新建系统合并简单控制程序,使机队机器人-或其他多试管系统-以前所未有的方式协作
写程序控制单自主机器人导航不确定环境并带异常通信链路已经够难了多机器人写一视任务而定可能或不必协同工作甚至更难
工程师设计多试器系统控制程序-无论是机器人队或功能不同的设备网络-一般限于特殊情况,环境可靠信息可假设或相对简单协作任务可提前明确规定
5月,在自主代理和多试剂系统国际大会上,MIT计算机科学人工智能实验室的研究人员将介绍一个新的系统,将现有控制程序并发,允许多试剂系统以复杂得多的方式协作系统不确定性因素-例如通信链路下降概率或特殊算法无意中引导机器人死路-并自动环绕它规划
小协作任务系统可以保证程序组合最优-它能产生最佳结果-鉴于环境不确定性和程序本身的局限性。
和Jon How合作 Richard Cockburn Maclaurin航空航天学教授 和学生Chris Maynor合作 研究人员目前正在模拟仓储应用测试系统模拟工作由小类iRobotCreates组成,可编程机器人与Croomba吸尘器相同底盘
合理怀疑
Christopher Amato表示, CSAIL后院和新论文首创者CSAIL如果你有摄像头 摄像头不可能不断地向 所有其他摄像头流出所有信息类似地,机器人上网络不完全性, 需要一定时间接收消息给其他机器人, 或许可他们无法在某些环境下传递阻塞物。”
代理商可能连自身位置的完全信息都没有,Amato表示-例如它实际所在仓库的哪个通道并说,“当你想做决定时, 关于它如何展开还有些不确定性,”他说或网络间因打包丢失产生不确定性现实世界域中 通信噪声和不确定性 很难决策
新的MIT系统由Amato与计算机科学工程Panasonic教授Leslie Kaelbling和George Konidaris共同开发使用三种输入方式一组低级控制算法-MIT研究者称它为'macro-actions'-可规范代理行为集体或单个第二套数据显示程序在特定环境内执行第三是评估不同结果计划:完成任务累积高正值,但消费能量积负值
硬敲学院
阿马托设想统计可自动收集,简单让多试剂系统运行一段时间-无论是现实世界或模拟世界仓储应用中,例如机器人将留执行各种宏动作,系统将收集结果数据机器人试图从仓库中的A点移到B点 最终可能死到盲巷 一定百分比时间, 他们的通信带宽可能下降 部分其他百分比时间从B点移到C点的机器人百分比可能不尽相同
麻省理工学院系统取这些输入并再决定如何最佳组合宏动作以优化系统值函数可能使用所有宏动作可能只使用小子集并可能使用方式 人设计师不会想到
假设,举例说,每个机器人都拥有一小串彩色灯光,如果无线链路下降,它可用与对口通信程序员决定红灯指向这个房间帮助人 绿光指向那个房间帮助人以我们为例,我们可以说有三种光线 算法吐出使用与否 和每种颜色的含义
MIT研究者工作框架多试管控制问题 称它为半可见Markov决策过程或POMDP南加利福尼亚大学计算机科学助理教授Nora Ayanian表示 : “ POMDPs, 特别是d-POMDPs分散化版基本难以解决真多机器人问题,因为多机器人问题如此复杂和计算成本昂贵解决,以致增加机器人数时会爆炸。”多机器人世界不怎么受欢迎
通常你使用d-POMDPs时 工作粒度极低有趣的是,他们使用这些复杂工具 并减少分辨率
Ayanian补充道,实事求是 更能应用到复杂问题
详情访问http://web.mit.edu/newsoffice/2014/herding-robots-0212.html
文件基础:M2M(机器对机)





