×

促进号登陆

您当前的位置:首页 > 前沿科技

2016图灵机器人创新大会 创意领航惊艳全场

时间:2016-08-01 14:17:25  来源:中国科技网-科技日报   作者:左瑾收藏

此次创新大会的灵感来源是图灵机器人新品发布会,这次大会活动的主题围绕整个智能机器人产业的创新,包括产品创新、技术创新、应用以及生态创新等,并以此来阐述图灵机器人的进展。

中国科技网讯(记者 左瑾)2016图灵机器人创新大会于7月28日在国家会议中心大宴会厅举办。此次创新大会的灵感来源是图灵机器人新品发布会,这次大会活动的主题围绕整个智能机器人产业的创新,包括产品创新、技术创新、应用以及生态创新等,并以此来阐述图灵机器人的进展。因此,从一定程度上讲,这是图灵机器人的第一次创新大会,同时也是整个机器人产业的第一次。

数字证明实力

图灵机器人CEO俞志晨表明,图灵机器人平台第三方开发者突破了23万。从理想状态来讲,机器人平台上每一位开发者开发一个机器人,相当于最终输出23万个机器人劳动力。对比2015年10月份的发布会,第三方开发者有11万,也就是说在8个月时间内增长了110%。

俞志晨表示,语义理解一直是其公司在技术方面投入最大一块,截止到今天语义理解准确率已经提升到95.5%,据计算在过去8个月时间里提升了0.8%。自然语言处理相比语音识别和机器视觉,存在很大的模糊性和不确定性,这是目前整个行业、学术界一致认为自然语言处理很难的原因之一。

Turing OS是面向智能机器人的操作系统,据此图灵机器人同时发布了两款智能机器人产品,哆啦A梦和乐迪。哆啦A梦在今年4月份淘宝众筹,成为目前国内所有机器人品类当中众筹金额最高的,排名第一。针对目前在所有平台上机器人的统计进行数据分析,单款产品哆啦A梦占25.9%,有望成为机器人行业中惊艳的一款产品。乐迪机器人将会在下个月京东众筹上发布,根据官方预测,乐迪机器人在2016年下半年的出货量预计能够到达10万以上,进一步说明于2014年底提出的AI+IP已经得到了初步的验证。除了哆啦A梦和乐迪,还有7-8款正在研发的机器人产品搭载了Turing OS,预计在今年三四季度逐渐面向市场。

图灵机器人从去年10月份发布到今天,已经得到了行业越来越多合作伙伴的认可。 俞志晨认为四点原因是最重要的:第一,强大的技术,Turing OS基本上拥有了多年以来所研发积累的核心技术;第二,稳定的服务,人工智能的多种服务要求云端处理,图灵机器人做云端服务近五年时间99.9%的稳定性服务保证;第三,通过双方的合作,进一步降低整个产品的研发成本;第四可以缩短产品研发周期。俞志晨总结说机器人的技术门槛实际上比目前大家所看到的很多智能硬件都要高很多,因此上述四点很重要。

聚焦应用创新

2012年图灵机器人推出了国内第一个手机版的语音机器人,2014年推出了国内首个中文的语义理解和认证计算平台图灵机器人,在2015年又推出了Turing OS,基本上也是国内首个智能机器人操作系统。每个产品的推出都引领了这个领域的创新和创业。

很多人在问,Turing OS到底跟windows、安卓有什么区别?俞志晨很难回答,他的解释是无论是安卓还是windows都是像微软、谷歌这样的巨头干的事情,他们作为一个创业公司去勇敢把这个事情做了,有三点原因是最重要的:

第一,场景。windows主要用在桌面电脑、PC,安卓主要用在智能手机,Turing OS主要用在智能机器人上面。这是关于使用场景和硬件载体。

第二,交互模式。PC更多是通过键盘、鼠标的方式去跟人互动,安卓更多是通过多点触摸的方式跟智能手机互动。机器人有很大的不同,电脑、手机至少有一个屏幕,但是很多时候机器人都没有屏幕,图灵机器人在上一次发布会也提出了机器人多模态交互概念,至少从这几个月来看已经得到了整个行业越来越多人的认可。

第三,应用场景。基本上作为一个终端载体,通过不同的硬件、系统,以及交互方式,基于此产生的应用完全不一样,无论是PC还是手机都有自己的一套应用体系,俞志晨认为机器人也会在应用层面有更深层次的一些拓展。

聚焦四个应用:智能聊天、智能拍照、智能音乐和智能英语。

智能聊天

聊天这个功能是最能够体现机器人的情感思维和认知。图灵机器人的产品经理针对目前市场上所有智能机器人的功能做了一个统计,其中第一个是智能聊天。确实智能聊天是目前所有机器人里面最重要的一个功能,也是最高使用的功能,基本上很多的机器人都有这个功能。智能聊天、智能对话这件事情其实有很多好的方式可以去应用,但是要做好智能聊天又特别难,除了技术本身,、在产品设计方面也要做很大改进、优化。

说到聊天系统,图灵机器人在2011年开始研发文字版的聊天系统,在2012年研发了语音版的聊天系统,语音助手上能体验到的语音版的聊天系统。2015年,为了让儿童机器人这个产品得到更好的应用,又推出了儿童版的聊天系统,而且是纯净版。

多模态人机聊天系统,实际上还有一个单模态的聊天系统,俞志晨认为最大的区别在于多模态会把肢体动作、情感,还有它的整个行为融合在一起,来体现机器人说话时的一种状态。最大的不同在于可以体现机器人的情感。

除了这些,图灵机器人又推出了场景模式。希望通过它的一些产品模式来让这个机器人产品更大程度去提升机器人的一些情感,体现出人类的思维模式。

除此以外还有习惯养成和情绪调节。

智能拍照

在机器人上拍照的方式无非是三种:语音指令、手机控制、自动抓拍。

语音指令和手机控制基本上是在原来的手机上已经存在了,可以认为是手机的延续,但是自动抓拍有很多不一样的东西在里面。所以俞志晨所属公司当时为了做自动抓拍功能,给整个系统研发了一套叫深度选景系统(DSS),整个深度选景系统由四个部分组成:

质量描述网络,也就是说可以让机器人从1000万张照片中学习拍照的黄金构图、科学采光、焦点控制以及虚化控制等等,相当于把一本专业的摄影教材输入到了机器人大脑,教会机器人如何拍照。

语义描述网络,原来机器人拍出多么好的照片,还是要从语义层面对场景进行描述。

个性描述网络,通过表情、人体、物体识别等各种技术,能够让机器人对照片的颗粒元素有一个更深层次的认识。

以上是三个拍照主要的模式。如果机器人具备了这三大网络的话,基本上就已经具备了初级摄影师的能力。图灵机器人还增加了自学习系统,通过这个系统,这三大网络可以不断地去收集用户的反馈来提升自己的能力,进而使其拍照技术越来越好。

智能音乐

音乐在机器人上很多人基本都做了,音乐是第二大功能。音乐的玩法原来很多人做基本上是语音指令,可以通过语音跟它说播放音乐或者放轻音乐,机器人就可以开始给你播放音乐。这件事情图灵机器人在几年以前就已经完全实现了这个技术,把多模态跟整个音乐功能结合在了一起。

俞志晨认为多模态最重要一点是可以体现人的肢体动作、情感。因为有了这一点,实际上可以做出很好的东西出来。除了这一点,他认为还有一个特别讨人喜欢的功能,叫“哼歌伴舞”,按照字面很容易理解,就是用户哼歌的时候,机器人可以跟着音乐的节奏去伴舞。

无论是多模态音乐还是哼歌伴舞,肢体动作在整个过程当中扮演了很重要的角色。为此,图灵机器人给其智能音乐功能配备了100+种不同的舞蹈动作。

智能英语。

获得英语教育资源是非常稀缺的。图灵机器人的目标很简单,就是通过推动技术的创新,让每一个人都能够拥有公平的享受教育的机会。

首先图灵机器人开发了一个英汉翻译系统,支持单词和句子,这个功能在三四年以前就已经完全实施了。接着图灵机器人又推出了自由对话,就是让机器人能够在一个全英语的场景下跟用户进行英语对话,通过这种方式可以更进一步提升英语口语水平。当然在这个过程当中,还有一个功能叫口语矫正。

上述智能聊天、智能拍照、智能音乐、智能英语分别对应的是小伙伴、摄影师、音乐舞蹈家、英语外教。实际上图灵机器人把人类的四个不同的角色和技能同时放入到一个机器人里面,大家最关心的即机器人应用到底有一些什么特点和规律?这件事情图灵机器人的产品经理们花了半年时间总结了五点:

第一,家庭。家庭是目前智能机器人一个最主要的应用场景,围绕家庭可以做很多有意思的事情。

第二,自主性。手机更多是通过用户的主动触发进行交互,机器人更多是通过特定场景的需求自动执行任务,来满足用户的需求。

第三,多模态。刚才演示四个应用,很多是关于多模态相关的。多模态类似于手机UI,所以我们要设计一个好的机器人应用是必须要考虑这件事情。

第四,情感。情感也是机器人所特有的,机器人可以通过表情、肢体动作来表达情感,也可以识别情感。

第五,运动。机器人有着非常丰富的运动系统。

图灵机器人想法很简单,希望机器人这件事情将来能够与人类是携手合作关系,而不是控制与被控制关系,所有一切努力都是希望让技术、让人们生活变得更加美好。


`
友情链接