本文主要是介绍2016世界机器人大会归来随想,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
上周去参加世界机器人大会,刚去以为就是纯学术会议,没想到还有展览区和竞赛区,不过竞赛区都是一些RoboCup之类的东东,跟实用型机器人关系不大;展览区很多展商的技术骨干也在学术会议上做了报告,所以集中谈会议所得
工业机器人(偏重控制)
连续型机器人(Continuum Robot)
用于对未知结构的生产线进行快速原型,以方便部署最终的关节型工业机器人。类似于IC行业先用FPGA验证逻辑,再用ASIC批量生产
基于仿生接口(Bionic-Interface)的意图预测(Intent Prediction)
来自韩国的金熙勋(keehoon kim)介绍了他的意图预测技术,主要用于制造残疾人的假肢,或是残疾人辅助康复设备,技术原理我理解是这样的:
观测健康人在抬手、曲臂等各种动作时,胳膊上各个位置的神经所发出的脉冲,将这个脉冲编码成模板,然后让机械臂在探测到这个模板时做出跟健康人一样的动作,然后将机械臂安装到残疾人身上,采集人就能通过残肢末端的神经脉冲,驱动安装的机械臂运动了
是否开刀 | 脑 | 肌肉 | 神经 |
---|---|---|---|
开刀 | EMG | sEMG | |
不开刀 |
当然也可以不开刀植入,只是粘贴在胳膊表面,这样精度会下降,但依然比Kinect更能精确地识别手势,因为整条胳膊的任意动作,在小臂上的神经脉冲都是不一样的,所以他们只需要捕捉小臂,就能还原出整条胳膊的运动
协作机器人的柔顺机械臂
来自北京交大机电系的张秀丽,继张佳辰之后另一个靠谱的女研发!她说中科院提的共融机器人就是协作机器人,只是他们拿了NSFC的钱,paper上必须用这个拗口的机器人类名-_-!
协作机器人的柔顺控制分为主动型和被动型,主动型就是在控制算法上加入一些补偿量(韩国Chul-Goo Kang有相关报告),被动型有很多分类,不过他们专注的是驱动系统的柔顺,其中主要是电机驱动、柔顺手段是减速器搭配弹性元件,而弹性元件又分恒定刚度和可变刚度,前者有线弹簧、扭弹簧、SEA等,后者有非线性弹簧和引入阻尼的线弹簧
纳米机器人(nanobot)的视觉
来自香港中文大学的李文荣教授,是个ABC,听完他的演讲我认识到,科幻电影里的纳米机器人根本不存在,现在只是能通过一些高级显微镜技术,看到纳米级的微小目标,然后通过移动的电场等技术,将药物定向输送到病灶而已
服务型机器人(偏重智能)
机器人应用商店
纳恩博在收购了SegWay后,为了充分利用其平衡车的底盘技术,将底盘加上一众传感器技术,打造成一个机器人半成品,领域厂商只需要将他们的领域知识通过app灌注到底盘上,就能实现自己的领域机器人。高级总监张佳辰的演讲非常精彩,一句“机器人的本质是计算机的升级”就将大家的关注点从机器人上挪开了,好方便她平衡车的登场^_^
IBM的Watson
IBM为了兜售Watson系统,到处鼓吹认知概念,什么认知时代、认知计算,无非就是将大家的目光不仅从计算机上挪开,甚至脱离任何物理实体,只考虑他的Service。那么什么是Watson呢?就是一个云端服务,它能看懂你丢给它的任意格式原始资料(doc、xls),无需做任何辅助说明,然后一个专属于你的知识库就构建好了,你的客户可以通过Watson直接用自然语言与你的知识库互动。
安防机器人
大陆智源科技的高源,是一个非常实在的人,撕了很多机器人领域皇帝的新衣,他们的安防机器人没有语音交互,因为他知道让机器人跟人聊天其实很难,但加入了很多落地技术:能越障、爬坡、可靠的网络传输等等。报告结束后我们的领导感慨良多。。。。。。
人工智能的语言游戏
来自微软小冰之父周明的报告,通过机器学习实现符合平仄的对联、唐诗、字谜生成,通过RNN实现符合词牌结构的宋词生成
简单说,该算法能像人一样对对子、赋诗、猜字谜,非常牛叉
知识图谱(Knowledge Graph)
来自浙大的陈华钧教授,当年的人工智能大战以符号主义败给连接主义而告一段落,但随着基于神经网络等连接主义技术的感知系统(语音、视觉)越来越完善,认知&推理的重要性渐渐凸显,而这就要依赖符号主义学派了
知识图谱走的是跟NLP等机器学习技术完全不同的路子,它提倡在生产自然语言内容时,就对内容做语义标注,这样AI算法就能根据这些语义很方便地进行常识推理(common-sense reasoning),这个准确性应该是要比机器学习高的
另外他提到了ONEM2M这个物联网标准化组织,以及schema.org,貌似都是用语义网络(semantic web)做一些实际的事情
仿人机器人(Humanoid)HRP-4C Miim
来自日本AIST的Kazuhito Yokoi报告,他们最新款Humanoid叫Miim,除了控制能力更出色,比如具备能扭转的脚踝等,还在表情捕捉、歌声合成等AI算法上展示出非凡成就,跟他们比,国内同行简直是在玩过家家
智能硬件的生态
来自硬蛋科技的李世鹏,他指出了目前智能硬件的一些痛点
从能听会说到能理解会思考
来自科大讯飞的胡郁,他提了一个技术(但没细讲),说人耳耳蜗里有很多纤毛,分布在不同位置,当声音进入耳蜗时,人脑并不像计算机那样一段一段的理解,而是收集不同位置的纤毛给出的感应信息,在脑内绘制出一副彩色图像——所以某种程度上,语音识别跟图像识别是共通的
语音识别中的认知计算技术
来自思必驰的俞凯,他分别介绍了自家公司在感知和认知技术上的突破
感知层面,他说他们的语音解码已经由帧同步升级为音素同步,这可以大大减小语音训练模型的体积,使得原来要放到服务器上的模型,现在可以放到手机上。不过这块他也没细讲,我猜这个模型体积减小只针对讯飞的在线命令词识别吧?如果能将语音听写也做成离线,那就牛逼大发了,那我就能在本地做语音识别,机器人的抗噪困扰也会大大减轻。
认知层面,他详细介绍了他家的对话管理以及多轮交互技术,不过这个跟场景紧绑定,并不是很有技术含量,不过他的思路很不错:机器人不能独立工作,必须将人的知识融合进去,才能高效作业。
这篇关于2016世界机器人大会归来随想的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!