3D导航任务如何训练机器人

据外媒venturebeat报道,facebook、乔治亚理工学院和俄勒冈州立大学的研究人员在本周发表的一篇预印本论文中,描述了人工智能的一项新任务——通过听自然语言的指令,在3d环境中导航(例如,“走下大厅,在木桌旁左转”)。他们说,这可以为遵循自然语言指令的机器人助手奠定基础。
研究人员的任务,被称之为在连续环境中的视觉和语言导航(vln-ce),是在facebook的模拟器habitat中进行的,该模拟器可以训练机器人助手在模拟真实环境的环境中操作。直径为0.2米、1.5米高的助手被放置在来自matterport3d数据集的内部,该数据集是通过10800多个全景图和相应的3d网格捕获的90个环境的集合。
机器人助手必须在一条路径上做四个动作(向前移动0.25米,左转或右转15度,或停在目标位置)中的一个,并学会避免被困在障碍物上,比如椅子和桌子上。
研究小组将这些环境提炼成4475条由4到6个节点组成的轨迹,这些轨迹对应于在各个位置拍摄的360度全景图像,显示了导航能力。
他们用这个训练两个人工智能模型:一个sequence-to-sequence模型,该模型由采取视觉观察和指令表示的策略组成,并使用它们预测一个动作;另一个是两个网络交叉模式注意模型,该模型跟踪观察结果,并根据指令和特征做出决策。
研究人员表示,在实验中,表现最好的机器人可以遵循“向左拐,进入走廊”之类的指令,尽管这些指令要求机器人在发现视觉路标之前转动未知的次数。事实上,机器人在看不见的环境,大约三分之一的场景中导航到目标位置,平均采取了88次行动。
这些机器人偶尔也会失败,根据合著者的说法,这些失败通常是由于机器人在视觉上丢失了指令中提到的对象。
“至关重要的是,vln-ce为(研究)社区提供了一个测试平台,在这里可以进行研究高级和低级控制界面的这类集成实验,”合著者写道。
facebook投入了大量资源来解决自主机器人导航的问题。
在公布了一项训练六足机器人走路的计划后,facebook首次推出了pyrobot,一种用于pytorch机器学习框架的机器人框架。2018年,facebook推出了开源人工智能,可以通过360度图像在纽约市街道上导航。最近,facebook的一个团队发表了一篇论文,描述了一个通过观看视频学习如何在办公室里走动的系统。


吉利金刚、宝骏 310、凯翼 C3,三款5万以下小型车推荐
关于手机锂电池充电的知识
中晶半导体嘉兴12英寸大硅片项目预计在2021年2月竣工投产 预计实现年销售产值达35亿元
纳微半导体与Live Oak II签订合并最终协议,以10.4亿美元的企业价值上市
创造历史!贸泽电子恭贺董荷斌夺得FIA WEC 2017赛季开门红
3D导航任务如何训练机器人
工业用平板电脑的显示屏防水框的介绍
闻尚和联尚由于资金链断裂 将启动破产申请程序
新能源汽车电气化的痛点
传小米MIX3将取消前置摄像头 搭载骁龙845不怀疑
PS5 VR新专利:搭载一项可以追踪用户眼球运动的技术
富士康Model B/V正式发布,ALL IN电动车代工,全产业链布局格局显现
国内外固态电池企业不断实现技术突破,并在产能规划
$%卖/修 HP8563E Agilent 8563E HP
叶面积指数仪的仪器用途以及功能特点
vivo X30设计细节曝光机身背部搭载了四颗摄像头支持60倍数字变焦
中瓷电子拟斥资38亿元将进军第三代半导体
基于FAN100的LED系统设计
教您如何正确挑选投影机灯泡
资产管理标识RFID解决方案的优势有哪些