人工智能使机器人能够进行全身对象操作

   日期:2024-09-26     来源:本站    作者:admin    浏览:102    

  Video thumbnail播放视频

  虽然这种方法仍处于早期阶段,但它有可能使工厂使用更小的移动机器人,这些机器人可以用整个手臂或身体来操纵物体,而不是只能用指尖抓住物体的大型机械手臂。这可能有助于减少能源消耗和降低成本。此外,这项技术对于执行火星或其他太阳系天体探测任务的机器人也很有用,因为它们只需要一台机载计算机就能迅速适应环境。

  电气工程和计算机科学(EECS)研究生、一篇关于这项技术的论文的共同主要作者h·j·特里·苏(H.J. Terry Suh)说:“与其把它看作是一个黑匣子系统,不如利用模型来利用这类机器人系统的结构,这样就有机会加快做出这些决定的整个过程,并提出丰富的接触计划。”

  加入Suh论文的共同主要作者是23岁的Tao Pang博士,他是波士顿动力人工智能研究所的机器人专家;杨陆杰,EECS研究生;资深作者Russ Tedrake,丰田汽车电气、航空航天和机械工程教授,计算机科学和人工智能实验室(CSAIL)成员。这项研究发表在本周的IEEE机器人学报上。

  关于学习的学习

  强化学习是一种机器学习技术,智能体(如机器人)通过试错来学习完成任务,并在接近目标时获得奖励。研究人员表示,这种类型的学习采用黑盒方法,因为系统必须通过试验和错误来学习世界上的一切。

  它已被有效地用于富接触操作规划,其中机器人寻求学习以特定方式移动物体的最佳方式。

  但是,由于机器人在决定如何使用手指、手、手臂和身体与物体互动时,可能需要对数十亿个潜在的接触点进行推理,因此这种反复试验的方法需要大量的计算。

  “强化学习可能需要经过数百万年的模拟时间才能真正学会一种策略,”Suh补充道。

  另一方面,如果研究人员利用他们对系统的了解和他们想让机器人完成的任务,专门设计一个基于物理的模型,那么这个模型就包含了这个世界的结构,使它更有效率。

  然而,当涉及到接触丰富的操作计划时,基于物理的方法不如强化学习有效——Suh和Pang想知道为什么。

  他们进行了详细的分析,发现一种被称为平滑的技术使强化学习表现得如此之好。

  机器人在决定如何操纵一个物体时所做的许多决定,在全局规划中并不重要。例如,一个手指的每一个微小的调整,无论它是否导致与物体接触,都无关紧要。平滑将许多不重要的中间决定平均掉,只留下一些重要的决定。

  强化学习通过尝试许多接触点,然后计算结果的加权平均值来隐式地执行平滑。根据这一见解,麻省理工学院的研究人员设计了一个简单的模型,可以执行类似的平滑操作,使其能够专注于核心机器人与物体的交互并预测长期行为。他们证明,这种方法在生成复杂计划方面与强化学习一样有效。

  “如果你对你的问题了解得更多,你就能设计出更有效的算法,”Pang说。

  成功的组合

  尽管平滑极大地简化了决策,但搜索剩余的决策仍然是一个难题。因此,研究人员将他们的模型与一种算法结合起来,该算法可以快速有效地搜索机器人可能做出的所有决定。

  通过这种组合,标准笔记本电脑的计算时间减少到大约一分钟。

  他们首先在模拟中测试了他们的方法,在模拟中,机器人的手被赋予任务,比如把笔移动到想要的位置,开门,或者捡起盘子。在每个实例中,他们基于模型的方法都取得了与强化学习相同的性能,但所用时间很短。当他们在真实的机械臂上测试他们的模型时,也看到了类似的结果。

  “使全身操纵成为可能的想法同样适用于用灵巧的、像人一样的手来规划。以前,大多数研究人员说,强化学习是唯一一种适用于灵巧手的方法,但特里和陶表明,通过从强化学习中获得(随机)平滑的关键思想,他们也可以使更传统的规划方法工作得非常好,”特德雷克说。

  然而,他们开发的模型依赖于对现实世界的简单近似,因此它不能处理非常动态的运动,比如物体下落。虽然对于较慢的操作任务有效,但他们的方法无法创建一个计划,例如让机器人把一个罐子扔进垃圾桶。未来,研究人员计划提高他们的技术,使其能够处理这些高度动态的运动。

  “如果你仔细研究你的模型,并真正理解你试图解决的问题,你肯定可以取得一些成果。在黑箱之外做事情是有好处的,”Suh说。

  这项工作得到了亚马逊、麻省理工学院林肯实验室、国家科学基金会和奥卡多集团的部分资助。

  /大学发布。来自原始组织/作者的材料可能具有时点性质,并根据清晰度,风格和长度进行了编辑。海市蜃楼。新闻不受机构限制

  所有的位置或侧面,以及所有的视图、位置等

  此处表达的结论仅代表作者的观点。点击此处查看全文。

 
打赏
 
更多>同类文章

推荐图文
推荐文章
点击排行