美国陆军研究实验室和卡耐基梅隆大学机器人研究所的研究人员开发了一种新技术,可以在最少的人为监督下快速教会机器人新的穿越行为。
该技术允许移动机器人平台在环境中自主导航,同时执行人类在特定情况下对机器人的期望。
这项研究的实验成果最近发表在澳大利亚布里斯班举行的电气与电子工程师学会机器人与自动化国际会议上。
陆军研究实验室的研究人员。玛吉·维格尼斯和约翰·罗杰斯在两个半小时的互动演示中与数百名与会者进行了面对面的讨论。
据Wigness说,研究团队在自主系统研究中的一个目标是为士兵提供可靠的自主机器人队友。
Wigness说:“如果机器人作为队友,可以更快地完成任务,并获得更多的态势感知能力。”“此外,机器人队友可以作为潜在危险场景的初始调查员,从而使士兵远离伤害。”
为了实现这一目标,Wigness表示,机器人必须能够使用它学到的智能来感知、推理和做出决定。
Wigness说:“这项研究的重点是如何从一些人类例子演示中学习机器人的智能。”“学习过程非常快,需要最少的人工演示,因此当任务要求发生变化时,它是现场实时学习的理想学习技术。”
ARL和CMU的研究人员将他们最初的研究重点放在学习机器人的遍历行为上,这与机器人对环境中地形和物体的视觉感知有关。
更具体地说,机器人被教会如何在靠近道路边缘的情况下从环境中的不同点导航,以及如何使用建筑物作为掩护秘密穿越。
根据研究人员的说法,给定不同的任务任务,机器人操作过程中可以激活最合适的习得遍历行为。
这是通过利用逆最优控制来实现的,也通常被称为逆强化学习,这是一种机器学习,它寻求在已知的最优策略下恢复奖励函数。
在这种情况下,人类通过驾驶机器人沿着最能代表要学习的行为的轨迹来演示最优策略。
然后将这些轨迹范例与视觉地形/物体特征(如草地、道路和建筑物)相关联,以学习与这些环境特征相关的奖励函数。
虽然类似的研究在机器人领域也存在,但ARL所做的是特别独特的。
Wigness说:“与其他正在进行的研究相比,我们在ARL关注的挑战和操作场景是非常独特的。”“我们寻求创建在作战人员环境中可靠运行的智能机器人系统,这意味着场景是高度非结构化的,可能有噪声,我们需要在相对较少的环境当前状态的先验知识下做到这一点。事实上,我们的问题陈述与许多其他研究人员是如此的不同,这使得ARL在自主系统研究中产生了巨大的影响。根据这个问题的定义,我们的技术必须对噪声具有鲁棒性,并具有使用相对少量数据进行学习的能力。”
据Wigness说,这个初步的研究已经帮助研究人员证明了快速学习遍历行为编码的可行性。
“随着我们将这项研究推进到下一个阶段,我们将开始关注更复杂的行为,这可能需要学习更多的视觉感知特征,”Wigness说。“我们的学习框架足够灵活,可以利用有关环境的先验信息。这可能包括对手可能看到的区域或已知有可靠通信的区域的信息。这些额外的信息可能与特定的任务场景相关,而学习这些特征将提高移动机器人的智能。”
陆军研究实验室的研究人员。玛吉·维格尼斯和约翰·罗杰斯在马里兰州阿德尔菲实验室中心的实验室里和一个小型无人Clearpath哈士奇机器人合影。来源:美国陆军
研究人员还在探索这种类型的行为学习如何在不同的移动平台之间转移。
到目前为止,他们的评估工作是通过小型无人Clearpath Husky机器人完成的,该机器人的视野距离地面相对较低。
“将这项技术转移到更大的平台上,将引入新的感知视角和不同的平台机动能力,”Wigness说。“对于一个由异构机器人组成的团队来说,学习编码可以在不同平台之间轻松传输的行为是非常有价值的。在这种情况下,行为可以在一个平台上学习,而不是每个平台单独学习。”
该研究由陆军机器人协同技术联盟(RCTA)资助,RCTA将政府、工业和学术机构聚集在一起,解决部署未来军用无人地面车辆系统所需的研发问题,其规模从便携式到地面作战车辆不等。
罗杰斯说:“ARL将与RCTA的其他成员积极合作,利用学术界顶级研究人员的努力来解决陆军问题。”“这项特别的研究工作是将RCTA的几个组成部分与我们的内部研究结合起来;如果我们没有如此密切的合作,这是不可能的。”
最终,这项研究对未来的战场至关重要,届时士兵们将能够更加自信地依靠机器人来协助他们执行任务。
罗杰斯说:“下一代战斗车辆在未来战场上以最佳速度自主机动的能力将使强大的新战术成为可能,同时为士兵消除风险。”“如果NGCV遇到了不可预见的情况,需要远程操作,我们的方法可以用于学习在未来自主处理这些类型的情况。”
了下:航空+国防,机器人•机械手•末端执行器

