原标题:新华网“舆情在线”发布大数据行业动态(总第9期)
行业动态
国内首个大数据双创平台“数据宝”在贵州上线
新华社8月9日报道,大数据双创平台“数据宝”网站8日在贵州正式上线,通过该平台,数据需求方可直接在线支付购买草根大数据,大大提高了数据的流通率和变现速度。
据了解,数据宝2016年4月由工信部电子科学技术情报研究所、贵州贵安新区和上海云信留客信息科技有限公司共同投资成立,是首个国家部委和地方政府共同投资参股建设的大数据资产运营管理平台,目前已接入电信、航空、公安、银联等行业数据资源,以及4000多种草根大数据。
在数据宝网站上,软件开发者可对政府公开的数据或互联网海量数据进行加工,提炼封装成合格的应用程序编程接口,并可上线到数据宝平台进行出售。同时,应用程序的创业者也可通过数据宝平台调用他人开发好的数据应用程序编程接口,开发出有价值的应用程序。
“数据宝平台不仅是官方大数据交易平台,也是一个草根大数据的交易平台,普通创业者可通过数据宝平台实现创业创新的梦想。”贵州数据宝网络科技有限公司董事长汤寒林说。
云计算竞争加剧 阿里云看好“大数据AI”
《上海证券报》8月10日报道,数据显示,阿里云2016财年(2015年4月1日至2016年3月31日)收入超30亿元,增幅达138%。而摩根士丹利报告显示,阿里云单独估值已达390亿美元。至于下一步,按照阿里云总裁胡晓明的规划,阿里云今年的布局重点是人工智能和大数据。
9日,阿里云首次推出“人工智能ET”,ET目前已具备智能语音交互、图像-视频识别、交通预测、情感分析等技能。据介绍,不同于微软小冰和苹果Siri,ET的特色在于采用大数据AI技术,其优势体现在全局洞察和实时决策上。
阿里云早在2012年就开始着眼于人工智能领域的技术研发和储备。胡晓明坦言,这两年底层计算能力的爆发推动了阿里云人工智能技术的进步。“基于此,阿里云加大了对于人工智能的投入,并于去年开始将人工智能的服务和能力对外开放。”
发布现场看到,ET可以随机从几十张图中选择一张“看图说话”,可以模仿马云和胡晓明的声音,甚至根据现场播放的视频实时解说篮球赛。
目前,ET正在从个体感知向全局智能进化,不止利用了人工智能,更依赖于背后的大数据技术。据胡晓明介绍,目前ET已被应用到了交通预测、智能客服、城市规划、语音识别等领域,可帮助浙江省交通厅预测未来一小时内的高速路路况,或者帮助金融机构的客服人员接电话等。而对开发者来说,构成ET的这些技术都已在阿里云上对外输出,所有的开发者都可以基于这些产品和技术构建自己的ET。
Google和斯坦福大学合作开展临床基因组服务
MyBioGate 8月11日报道,为了将基因组检测纳入医疗健康的日常服务,斯坦福大学医学院近日宣布与Google公司展开合作,来推动他们将要推出的临床基因组服务。这项服务有望在今年秋天推出。
Google将会为这项服务提供信息架构,这是一个基于google云平台的建设。接下来,斯坦福和Google将会建立基于云技术的应用来分析医疗健康数据库,旨在提高医疗护理和医学研究。
这项服务将会允许斯坦福的医生们为可能由特殊基因引起的有异常症状或特殊症状的患者提供基因组测序服务。斯坦福的工作人员将会分析患者的数据,并与系统中的数据库做比对来寻找可能的异常状况。相应地,这也提高了治疗癌症和破解各类罕见疾病的可能性。
“在过去的几年,关于医疗健康的数据出现了大爆发,”斯坦福医学院的院长Lloyd Minor说,“虽然科学家们还在研究如何将大数据进行整合,把这些数据在临床中为单个患者应用还是一个巨大的挑战。”
在协议中,Google成为了斯坦福医学院的正式商业合作伙伴,并且保护患者数据安全也会列在HIPAA法案(医疗电子交换法案)的监管约束之下。同时,所有存储在Google云平台上的数据都会保证隐私并加密。
斯坦福医疗系统包括斯坦福医学院、斯坦福健康护理和斯坦福儿童医院。财政信息和其他条款并未公开。
“这个协议将三方面的专业融合在了一起:数据科学、生命科学研究和临床护理。”Google行业解决方案工程的副总Sam Schillace说,“下一个阶段推动医疗健康更深理解和更快进步的人将来自于这三个领域的先锋者,他们共同合作来建立下一代的工具和数据平台。
业界观点
工信部:大数据产业生态发展是大势所趋
中国经济网8月8日报道,工业和信息化部副部长怀进鹏日前在出席2016中国大数据产业生态大会时表示,大数据产业生态发展恰逢其时,是大势所趋,也将大有可为。
怀进鹏指出,当前我们已经从IT时代进入DT时代,科技革命催生产业变革,给我们的生活、工作带来重大影响。大数据的重要性体现在数据创造价值上,能够创造价值的数据才是“大数据”。大数据是新事物,从学术角度来看,涉及数学、计算机科学、心理学、社会学和应用数学等诸多领域;从行业角度来看,覆盖了信息经济当中绝大多数部门和行业。目前大数据产业发展已从单一的技术和产品走向生态体系建设,需要改变传统的垂直行业管理模式,建立有效的产业生态环境,推动大数据技术和产业快速发展。
怀进鹏强调,当前我国经济已经进入新常态,发展面临速度变化、结构变化和动力变化三个特点,迫切需要通过供给侧结构性改革提高有效供给能力。而信息经济代表未来发展趋势,具有“加法”和“乘法”的效用,有利于带动相关行业和领域发展。在这样的背景下,政府、产业界和全社会要广泛关注大数据产业发展,积极为大数据产业创造良好发展环境,为信息经济增添新的活力和动力。
怀进鹏认为,习近平总书记在4月19日网络安全和信息化工作座谈会上对IT技术发展和培育信息经济等方面做了重要论述,推动大数据产业发展是落实总书记重要指示精神的具体举措。要坚持创新引领、市场导向,通过创新体制、完善保障,充分发挥政府的引导作用,完善数据开放共享、隐私安全等法律法规建设,形成政府、企业和社会共同联动,建立良好的大数据产业生态环境。同时,怀进鹏强调了企业和企业家在促进大数据产业发展方面的积极作用。
智慧大数据时代遥感不能缺席
《深圳商报》8月11日报道,定位导航、遥感、地理信息、虚拟现实等产业的出现,带动大数据产业发展。面对体量巨大、速度超快、形态多样、真伪难辨、价值无穷的大数据产业,遥感应该如何发展?”10日,参加中国遥感大会的中国科学院、中国工程院院士李德仁称,在大规模加快遥感大数据的应用推广前,还需打通多条通道。
据介绍,目前全球卫星超过5000个,再加上数以万计的无人机,早已将遥感应用渗透到了各行各业,并随之产生了海量数据。这些数据存在信息缺失、难以解译等问题。如何更高效率地利用遥感数据,已成为目前行业亟待解决的问题之一。
李德仁介绍,遥感数据近年来在军事和农业两大领域的应用有突出表现。其中在军事领域,通过对目标进行全面检索,可以将“秒级”实时图像提供给作战部队。而在农业领域,通过向农民提供光谱测量机,可以针对灌溉和施肥等农业活动进行实时监测和把控,发展精准农业。
“解决好在轨卫星数据处理、实时成像、高精度定向和相关检索,才可以将遥感大数据更好的应用到其他行业中。”李德仁认为,未来5年,如果可实现遥感卫星数据和手机,通过视频集成在一起,才意味着遥感数据服务真正大众化。
李德仁同时强调,在“互联网+”时代下,空间信息服务要重点做好以下三大方面的布局:首先是将数据信息加工后推广到全世界,可在线调用传感器数据;其次要实现全球覆盖定位、导航、授时、遥感、通信五位一体的实时服务;此外还要做好“一星多用”、“多星组网”、“多网融合”工作,保证卫星数据可提供全方位、全球的实时导航定位。
阿里巴巴 CTO 首次分享技术战略:没有大数据,就没有话语权
微信公号“极客公园”8月10日刊文,8月6日,阿里巴巴在西雅图举办了一场技术论坛,400多名当地的技术人才参加了这次活动,同时,这也是阿里巴巴CTO张建锋第一次在美国分享阿里巴巴的相关技术战略。
张建锋:今天,大数据做的最好的,都是些平台性的企业,比如Facebook和Google,因为他们有比较丰富以及高质量的数据。但有些做工具型的企业,在这波浪潮中要面临更多的挑战,比如 IBM ,微软等。这波浪潮中,大数据是核心,而谁拥有这些大数据,就非常关键。
阿里的优势在于我们的数据不仅海量而且种类繁多,比如说社交的、商业的,以及其他行为的数据,可以说阿里拥有的数据含金量特别高。
第一,阿里的数据,是用户通过购买行为投票产生的,这个投票对应的是每次的交易行为,是非常真实的。
第二,社交网络的数据是很难结构化的,而在淘宝上,商品的描述高达一百多个维度,所以阿里的数据是高度结构化的。
第三,我们有非常实时的行为,平常不管是在无线端还是PC端,阿里都有超过一个亿的人在访问,所以总体的行为非常密集。
这几个条件,对于大数据的发展,是得天独厚的。其次,我们从外围部分,像优酷、微博等平台,也整合了很多社交数据,形成了比较独特的数据。
除了数据,我也想谈谈算法。其实算法并不是一件孤立的事情,我不认为在实验室中就能研究出一个非常高效的算法。因为在行业里,有非常多的应用场景,而且应用场景和和公司的业务规模也是正相关的。
比如Facebook的核心业务是广告,所以他们广告的算法是远远领先于其他人的。像 Google 也一样,因为他的场景、数据、计算,已经决定他的深度比其他人更深。阿里是个另类的公司,我们有非常多种类的业务场景。所以阿里认为,数据、计算平台和算法的结合,是未来非常重要的趋势。
大数据+
用大数据进行食品安全监管 消除食品安全隐患
《新京报》8月11日报道,政府通过大数据进行食品安全监管的理念初步具备了;互联网、云计算、移动端应用等监管技术条件也基本成熟了,借助互联网技术提供安全食品并非不可能。
近年来,国务院一直在致力于建立食品安全的追溯体系。去年12月30日,《国务院办公厅关于加快推进重要产品追溯体系建设的意见》明确提出,建立食用农产品质量安全全程追溯协作机制,以责任主体和流向管理为核心、以追溯码为载体,推动追溯管理与市场准入相衔接,实现食用农产品“从农田到餐桌”全过程追溯管理。
外卖平台直接连通居民的餐桌,显然是实现这一食品追溯体系的重要一环。
其实,目前的互联网技术、物联网技术、云计算、大数据比对,包括摄像监控、手机终端的广泛使用,为食品安全保障和监管提供了太多的技术便利和实现路径。遗憾的是,目前很多平台和商家并没有意识到食品安全的分量,这方面投入仍然不足,甚至无视。
对监管部门来说,利用技术监管的意识也有待提高。2015年,国务院发布《关于运用大数据加强对市场主体服务和监管的若干意见》,提出将建立产品信息溯源制度,对食品、药品等关系群众生命财产安全的重要产品加强监督管理,形成来源可查、去向可追、责任可究的信息链条。这意味着每一件食品的生产过程都将记录在案,来源可查明、去向可追踪,百姓能轻松查到生产情况;企业能随时监控流通情况。
比如,订餐平台上五六家店铺共用一张证照的勾当,运用大数据、云计算等技术,很容易就能识破:地址接近、使用同一个电话、同一个邮箱,就应该被数据库识别为“高危商户”,做进一步风险调查。
如果政府与企业、社会合作,共享数据,打破“信息孤岛”,则更有助于进一步规范网络外卖平台的店铺。对于商家上传营业执照、食品安全证书,平台可能很难对其真伪做出判断,但若政府与平台进行信息互联互通,哪家是李鬼在冒用证书,一下子就能浮出水面。
整体上来说,政府通过大数据进行食品安全监管的理念初步具备了;互联网、云计算、移动端应用等监管技术条件也基本成熟了;借助互联网技术,提供更安全的食品,对诸如平台商家的信用进行识别筛选,已然可以做到。而市场竞争,也早已经过了跑马圈地的原始阶段,用户和市场也都趋于理性和成熟。
随着互联网经济的发展,越来越多传统食品安全问题也将转移到网络上,政府也需要将更多的监管力量投放到网络食品安全领域。互联网等新技术最终应该服务食品安全的公共命题,而不是,因为有了新技术,却令食品安全面临更大的危机。
用大数据建设危险品物流安全平台
《经济参考报》8月9日报道,危险品在运输与仓储过程中,往往会发生爆炸、泄漏和污染等事故。据不完全统计,仅去年一年就发生了近百起大大小小的生产安全责任事故,造成许多生命的消逝和巨额财产的损失。“百年累之,一朝毁之”,危险品的物流安全问题成为悬在头上的达摩克利斯之剑,有针对性地进行系统有效的预防、预警、应急处置与善后处理,便成为危险品物流发展中的当务之急。
危险品物流中的多头管理是其中最严重的问题之一。交通、公安、质检、安监、工商、环保、卫生、税务、海关等部门分头管理、职能交叉,形成的所谓闭环管理机制,容易存在争利时一哄而上而出现事故时则诿过推卸管理责任的可能,但目前还难以形成一个统一管理的体系,只能依靠技术工具来实现协同管理。
其中,大数据就是提高部门之间协同管理最便利的工具之一。所谓大数据,是指涉及的数据量规模巨大,无法通过传统数据库软件实现获取、存储、管理和分析的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低等特征。大数据的目的,是要把这些分布在各区域、各行业、各节点的非结构化或半结构化且含有意义的数据,依托云计算的分布式数据库和云存储进行专业化处理,实现深度数据挖掘。
危险品物流安全管理的大数据化可谓恰逢其时。在中国,2015被业界称为大数据元年,据调查显示,中国大数据市场已达到115.9亿元。2015年9月,国务院发布了《促进大数据发展行动纲要》,明确从顶层设计中解决政府数据开放共享不足、创新应用领域不广等问题;“十三五”规划也明确提出实施国家大数据战略,到2017年底形成跨部门数据资源共享共用格局。
实际上,危险品物流管理体系的主要目标是安全,其次才是效率;而危险品物流运营企业关注的主要是效益,安全则是约束的门槛。因此,利用大数据实现物流安全管理的需求在于各级管理部门,特别是很多部门还都有非常庞大的数据在手。例如,储存在交通部门的运输工具安全管理、从业人员资格等数据;储存在公安部门的危化品安全管理、剧毒化学品购买许可证、道路运输通行证、运输车辆的道路管理等数据;储存在质检部门的危化品及其包装物/容器的工业产品生产许可证以及储存在安监部门的危化品安全生产许可证、仓储危化品建设项目的安全条件审查、危化品安全使用许可证等数据。
而通过各个区域、各级政府部门建立的大数据平台,可以高度共享协同以往分散存储的安全管理信息数据,从管理源头上实时杜绝任何不符合危险品安全仓储和运输条件的企业、设施装备、从业人员以至安全管理体系,有效规避多头管理中的客户信息数据冲突,让法律法规和标准在企业管理中落地生根。
当然,单纯依靠危险品物流运营企业的自律还难以保证全系统的安全,可以利用大数据进行深度数据挖掘,从危险品的采购、生产制造、包装、分拣、储存、运输、配送等全供应链环节上实现企业级、区域级和国家级的安全风险识别、控制和规避。利用大数据建立强大的分级危险品物流安全监控中心,实时对所有危险品的生产、仓储和运输,实施严格的全流程信息管理,包括货品及货物盛装物的RFID识别标签、车载移动终端、仓储终端、作业人员识别标签等,并建立基于风险识别的预警和报警系统,这有利于危险品物流安全事故发生的应急处置和救援互助。
大数据依赖于各个分散在区域、部门和企业内部的数据库,也取决于各区域、各部门和各企业的信息化水平。不过,借国家大数据建设的东风,首先可以在已有庞大数据源的各区域、各管理部门构建大数据平台;其次可以利用危险品物流企业利润相对较高的优势,强力推行企业级信息化及智能化。大数据不仅仅是作用于危险品物流的安全管理,还能作为物流企业经营获利的利器,在危险品分级标准逐步科学合理的基础上,可以利用大数据实现的全供应链物流整体优化带来效益与利润,让企业乐于建设自身的数据平台,从而实现大数据在危险品物流管理部门与危险品物流运营企业间的融合共享。
大数据是旅游网络营运“利器”
《四川日报》8月11日报道,互联网时代,游客对旅行的需求更个性化,也更碎片化。在这样的背景下,如何精准对接游客需求,不断推出游客欢迎的旅游产品?
8月10日,在第五届全球旅游网络营运商合作交流会精英对话环节,与会嘉宾认为,大数据是企业找准游客需求的一件“利器”。“与传统旅游产品相比,我们主打周末游,平台里既有个人商家,也有像迪士尼这样的知名品牌;上线的活动既有旅游,也有演出、展览、讲座等;用户也千差万别,有情侣、独行者还有家庭。”周末去哪儿创始人肖鹏表示,利用大数据,平台能为不同产品、不同用户“画像”,梳理他们的属性和特色,从而为这些碎片化、个性化的信息精准定位。
有了这些“画像”,大数据就能精准匹配用户需求。简途旅行创始人杨烈透露,通过对游客特点和旅游中行为数据的分析,公司发现客户中超过60%是年轻女性,旅游途中做得最多的事就是听歌。“于是我们马上与草莓音乐节、百威音乐节等合作,推出专题巴士,效果很好。”
游谱旅行CEO李小坚认为,大数据在旅游业的应用有三个层面,第一个层面是对资源的梳理,比如景区适合什么样的人来,周边餐饮、娱乐、住宿等配套怎么样;第二个层面是用户行为的梳理,不同游客有不同的特点和喜好。第三个层面就是要建立资源与用户的匹配逻辑。
尽管大数据是一件“利器”,但其存在多元性和多样性,在数据的收集、整理、提炼方面难度很大。与会嘉宾认为,能否用好大数据,或成网络旅游营运商决胜的因素之一。
易达大数据CEO赖贵全建议,企业可多关注自身,挖掘企业内部数据这一块富矿。“从我们的项目经验来看,内部数据和外部数据一样重要,都需要企业去关注。”
企业经常面临的问题是,想要做一些分析的时候缺乏数据,就以为去外部找数据是唯一的办法。“其实从大数据的角度来看,即使是只利用企业内部的数据,也可以推测出不少结论。”赖贵全说。