设计的世界

  • 首页
  • 文章
    • 3D CAD.
    • 电子•电
    • 紧固和连接
    • 工厂自动化
    • 线性运动
    • 运动控制
    • 测试与测量
    • 传感器
  • 3D CAD模型
    • PARTsolutions
    • TraceParts
  • 领导
    • 2020年的赢家
    • 2019年的赢家
    • 飞跃奖
  • 资源
    • 订阅
    • 数字问题
      • EE世界数字问题
    • 设计工程的未来
    • 飞跃奖
    • MC²运动控制课堂
    • 运动设计指南库
    • 播客
    • 供应商
    • 网络研讨会
  • 女性在工程
  • 电子书/技术提示
  • 视频
  • 新型冠状病毒肺炎

英特尔,OSU和UC San Diego在强化学习中致力于加强学习,可以帮助家用机器人

通过Eugene Demaitre.|2019年6月19日

分享
英特尔支持的强化学习,3D数据集研究为智能机器人提供了新的路径

PartNet的专家定义的“灯”层次模板,以及台灯(左)和吊灯(右)的实例化。来源:英特尔

英特尔公司一直是研究人工智能,机器学习和计算机愿景的强大支持者,其两个合作对机器人有影响,这些机器人在家庭中的动态环境中运行。本周,俄勒冈州立大学的英特尔AI实验室和研究人员和加州大学圣地亚哥,呈现了一个用于训练对象识别的新型加固学习和大规模数据集的论文。

“我们想要扩展机器学习的两种方法,以更复杂的交互设置探索空间,”他说酌唐他是英特尔人工智能产品组的首席工程师。“在设计和资助涉及新兴领域的大规模数据集方面,工业界可以做很多事情。”

在钢筋学习中,机器可以选择选择潜在的奖励,或者他们可以探索他们的环境以收集更多的数据,更稳健决策.在36日国际机器学习会议本周,来自俄勒冈州立大学和英特尔人工智能实验室的研究人员提供了一个解决方案,他们称之为“协作进化强化学习”(CERL)。

识别诸如门把手、开关或杯子把手等日常物体对机器人进行交互至关重要。视觉人工智能面临的一个主要挑战是为大型数据集添加上下文。

本周,加州大学圣地亚哥分校助理教授苏浩(Hao Su)和英特尔人工智能实验室的深度学习数据科学家苏巴纳·特里帕蒂(Subarna Tripathi)在2019年世界计算机大会上发表了一篇论文计算机视觉与模式识别学术会议介绍Partnet。他们称之为“具有细粒度分层,实例级别的注释的第一个大型数据集。”

Cerl结合了强化学习方法

“我们正在考虑将算法从游戏场景扩展到具有更多现实约束的内容,”他说Somdeb Majumdar他是英特尔人工智能实验室(Intel AI Lab)的深度学习数据科学家。“在使用实体机器人与人类互动之前,还有很多问题需要解决。”

Majumdar告诉我们,而不是为每个可能的决定进行编程,而不是为各种可能的决定,传统的强化学习(也称为策略网络)使用策略梯度方法机器人的报告.这些有利的政策可能更高的奖励可能更高的积极奖励。

另一种方法是进化算法(EA),其受自然演进的启发,是一种基于人群的算法,可以在每一代中选择强烈的候选。但是,EA需要更多的处理时间,因为它仅在探索剧集后评估候选者,解释了英特尔和OSU重置。

CERL结合了策略梯度和EA方法,允许更快的机器学习,同时也可以在更长的时间框架内处理奖励。结果,研究人员发现CERL解决了这个问题标准的学术标准使用更少的累积训练样本比任何一种方法单独。

协同进化强化学习

高层方面示意图。来源:英特尔

“俄勒冈州立大学的这项工作可以追溯到6到8个月前,”Majumdar说。“在过去的四个月里,我们扩大了规模,让多个机器人执行单一的协调任务。”

“每次互动都有10个候选对象,因为每个机器人解决的是不同的部分。他们很快就找到了解决方案。“因为这种基于群体的方法,我们不需要调整神经网络的行为。计算出有多少层或过滤器通常需要花费一些时间,但我们能够将问题转嫁给大众。”

它还利用了大型CPU集群,而不是内存有限的gpu。“功率传播开环是非常密集的cpu,大型集群更有效地探索空间,”Majumdar说。“我们正在利用现有的不同类型的集群。”

在一个基准在美国,CERL实现了人形机器人的3D模型走并在仿真中的1M时间步骤中保持4,702步的持续节奏。

“我们正致力于将一些算法从模拟陷入人形机器人,以走在俄勒冈州不同的表面上,”Majumdar说。“随着更多机器人实验室参与其中,我们可以利用大量学术实验室有物理机器人来测试算法。”

英特尔方面的方法

“你可以把它拿到并将其应用于适用于学习策略的任何工作量,例如芯片布局问题,”Majumdar说。“您可以将其作为Markovian游戏制订并应用加强学习解决方案。这种基于人口的工作的影响超出了物理机器人。“

阅读全文这里(PDF),代码是开源的GitHub上.

PartNet增加了对3D数据集的部分层次理解

“英特尔关心的是不同的数据集,”他说Tripathi..“去年,我们认识了苏浩教授,他的实验室专注于计算机视觉,我们决定创建一个大规模的、细粒度的数据集。”

“坐在椅子上实际上非常复杂,”UC圣地亚哥教授说郝苏.“它可能不是面对着你,你需要拉着它的一只胳膊,然后你必须知道垫子在哪里,后面是什么。为了与一个物体互动,机器人必须了解它的各个部分。

“在机器人专家使用的大多数虚拟环境中,都缺乏复杂性和规模,”他说。“我们希望实现能够真正理解复杂几何和物理属性的人工智能。”

大多数现有的3D形状数据集在少量实例中或以非分层方式注释占组件或对象的部分。UC San Diego和Intel研究人员宣布PartNet,其中包括26,671个形状或物体点云的573,585个语义识别的子组件。

这些注释与灯具、门或椅子等24类日常物品相关联。就台灯而言,零件包括“灯罩”、“灯泡”和“拉链”。提出了细粒度分割、实例分割和层次分割的方法,分别对对象进行划分、零件之间的区分和零件类型的识别。

“不仅识别一个物体的身份,还能识别它的属性、部件、成员和部件的功能,这将极大地影响计算机视觉、物体识别和机器人运动领域,”苏浩说。“很长一段时间以来,计算机视觉和感知是一个从规划、控制和驱动分割开来的社区。伙伴网络可以帮助提供一个共同的基础设施。”

智能机器人的人类注释

要创建和注释数据集,Partnet研究人员使用分层部分模板并使用66人合作。

“他们建立了基于几何、物理和语义属性的知识,”郝苏说,“该项目可以追溯到2016年,我们建立在ShapeNet项目的3D模型上。使用基于浏览器的用户界面,注释器可以按照层次分类法将一个部分分割成更小的部分,或者将部分合并成更大的部分。标注之后,会有一个完整性检查或质量控制过程,因为我们仍然会发现人类之间的一些不一致。”

有了PartNet数据集,研究人员可以用对象——包括它们的组件和功能——构建大规模的模拟环境。这种模拟可以用来训练机器人如何与微波炉等物体互动。

英特尔PartNet微波

PartNet能够进行模拟,更好地训练机器人与日常物体进行交互。来源:英特尔

“任务感知抓取目前基于几何学,但许多机器人不知道部件,”郝苏说。“例如,它可能不知道抓住杯子的把手,所以它可能必须处理热容器。”

伙伴网是建立动态虚拟环境的第一步Kaichun Mo.他是斯坦福大学人工智能实验室(Stanford University AI Lab)的博士候选人研究论文.“要打开一扇上锁的门,机器人必须首先识别锁眼——这是一个具有挑战性的问题。”

“然后打开门,机器人必须了解锁定以解锁的国家变化,我们目前正在进行中,”他说。“最后,机器人必须弄清楚物理细节。需要多少力量?门是什么?它应该施加力量吗?“

“Partnet将是下一个注释的基础,即移动性和动态属性,”郝苏说。“我们收到了询问更多属性的电子邮件。有些公司拥有独特的数据,其他大学已经开始使用PartNet进行微调,以便在识别结果上进行它们的数据。“

“英特尔在加强学习中做了真正的开创性工作,”郝苏说。“这可以帮助国内机器人的进步,这将更好地照顾年轻人和老年人。它需要了解家中的所有对象。“

“虽然伙伴网络已经关闭,但我们欢迎国际合作伙伴的使用,”莫开春说可以在这里.


了下:AI•机器学习,机器人的报告,机器人技术•机器人抓手•末端执行器
标记:英特尔

告诉我们你的想法!取消回复

相关文章阅读更多>

汽车雷达
汽车雷达的基础知识
Softbank Whiz清洁机器人在日本境外上市
CMR外科为Versius外科机器人筹集2.4亿美元
FarmWise为可持续机器人农场筹集了1450万美元的A轮融资

运动设计指南

“运动

不可或缺报名

运动控制课堂

设计世界数码版

封面

浏览最新一期设计世界和背面问题在一个容易使用高质量的格式。剪辑,分享和下载与领先的设计工程杂志今天。

EDABoard电子论坛

全球顶级问题解决EE论坛,涵盖微控制器,DSP,网络,模拟和数字设计,射频,电力电子,PCB布线等

EDABoard:电子论坛

赞助内容

  • 评估和设计多股输送机风格和解决方案的产品处理挑战
  • 使用超宽带的创造性方法和你需要知道的开始
  • HELUKABEL PVC控制和电机电缆获得ECOLAB认证
  • 电子阀技术
  • 特殊环:自锁,平衡,ID/OD锁
  • 五个原因:2065连接器是一个可靠的替代手工焊接
工程交易

工程交流是一个面向工程师的全球教育网络社区。

联系、分享、学习就在今天

微博通过@DesignWorld
设计的世界
  • 广告
  • 关于我们
  • 接触
  • 管理您的设计世界订阅
  • 订阅
  • 设计世界数字网络
  • 工程白皮书
  • 飞跃奖

Copyright©2021 WTWH Media LLC. All Rights Reserved。除非事先得到WTWH媒体的书面许可,否则不得复制、分发、传送、缓存或以其他方式使用本网站内容
隐私政策|广告|关于我们

搜索设计世界

  • 首页
  • 文章
    • 3D CAD.
    • 电子•电
    • 紧固和连接
    • 工厂自动化
    • 线性运动
    • 运动控制
    • 测试与测量
    • 传感器
  • 3D CAD模型
    • PARTsolutions
    • TraceParts
  • 领导
    • 2020年的赢家
    • 2019年的赢家
    • 飞跃奖
  • 资源
    • 订阅
    • 数字问题
      • EE世界数字问题
    • 设计工程的未来
    • 飞跃奖
    • MC²运动控制课堂
    • 运动设计指南库
    • 播客
    • 供应商
    • 网络研讨会
  • 女性在工程
  • 电子书/技术提示
  • 视频
  • 新型冠状病毒肺炎
我们使用cookie来个性化内容和广告,提供社交媒体功能,并分析我们的流量。我们还与我们的社交媒体、广告和分析合作伙伴分享您使用我们网站的信息,这些合作伙伴可能会将您使用我们网站的信息与您提供给他们的或他们从您使用他们的服务中收集的其他信息相结合。如果您继续使用本网站,您即同意我们的cookies。 行不阅读更多