相信机器人能在新的空间中导航

新算法提高机器人感知的鲁棒性


Vasileios Tzoumas是一名研究科学家麻省理工学院(麻省理工学院),访问一个新的城市,他喜欢通过跑步来探索。有时他会迷路。几年前,在大阪参加一个会议的长途跋涉中,不可避免地发生了一件事。但就在离开酒店后不久,Tzoumas看到了一家他记得经过的7- 11便利店。这种认识让他在精神上“闭合回路”,将他的轨迹松散的一端与他知道并确定的地方连接起来,从而巩固了他的精神地图,让他能够回到酒店。

渐变非凸性(GNC)算法可以帮助机器穿越陆地、水、天空和空间,并返回来讲述故事。

闭环实际上是一个技术术语,指的是机器人在导航新环境时经常要做的事情。这是一个过程的一部分同步定位与测绘(SLAM).SLAM并不新鲜。它被用于机器人真空吸尘器、自动驾驶汽车、空中搜救无人机以及工厂、仓库和矿山中的机器人。当自动驾驶设备和车辆在从客厅到天空的新空间中行驶时,它们会在行驶过程中构建一张地图。他们还必须使用摄像头、GPS和激光雷达等传感器来确定自己在地图上的位置。

随着SLAM的应用越来越多,确保SLAM算法在具有挑战性的现实条件下产生正确的结果比以往任何时候都更加重要。SLAM算法通常在完美的传感器或受控的实验室条件下工作得很好,但当在现实世界中使用不完美的传感器时,它们很容易丢失。不出所料,工业客户经常担心他们是否可以信任这些算法。

麻省理工学院的研究人员已经开发了几个健壮的SLAM算法,以及从数学上证明我们可以信任它们的方法。麻省理工学院莱昂纳多职业发展助理教授卢卡·卡龙的实验室,发表了一篇论文研究了其渐近非凸性(GNC)算法,减少了SLAM结果的随机误差和不确定性。更重要的是,该算法在现有方法“丢失”的地方产生了正确的结果。这篇由Carlone、Tzoumas以及Carlone的学生Yang Heng和Pasquale Antonante共同撰写的论文在国际机器人与自动化会议(ICRA)上获得了机器人视觉领域的最佳论文奖。这种GNC算法将帮助机器穿越陆地、水、天空和太空,并返回来讲述故事。

一切都保持一致

机器人的感知依赖于传感器,这些传感器通常会提供嘈杂或误导性的输入。麻省理工学院的GNC算法允许机器人决定信任哪些数据点,丢弃哪些数据点。GNC算法的一个应用程序被调用形状对齐.机器人利用2D相机图像估计汽车的3D位置和方向。机器人接收一个带有许多点的摄像头图像,这些点由特征检测算法标记:前灯、车轮、后视镜。它的内存中还有一个汽车的3D模型。目标是缩放、旋转和放置3D模型,使其特征与图像中的特征对齐。“如果特征检测算法完美地完成了它的工作,这很容易,但这种情况很少出现,”Carlone说。在实际应用中,机器人面临着许多异常值(错误标记的特征),这些异常值占所有观测值的90%以上。这就是GNC算法发挥作用并胜过所有竞争对手的地方。

机器人使用一个数学函数来解决这个问题,该函数考虑了每对特征之间的距离——例如,图像中的右侧大灯和模型中的右侧大灯。他们试图“优化”这个函数——对模型进行定位,以使所有这些距离最小化。特征越多,问题就越难。

解决这个问题的一种方法是尝试函数的所有可能的解决方案,看看哪个效果最好,但尝试的方法太多了。万博 尤文图斯Yang和Antonante解释说,还有一种更常见的方法,“就是尝试一种解决方案,不断调整——比如,让模型中的大灯与2D图像中的大灯更加一致——直到你无法再改善它。”考虑到有噪声的数据,它不会是完美的——也许前灯对准了,但轮子没有——所以你可以重新开始另一个解决方案,尽可能地完善这个解决方案,重复几次这个过程,以找到最好的结果。不过,找到最佳解决方案的可能性很小。

在实际应用中,机器人面临许多异常值,这些异常值可以占所有观测值的90%以上。这就是GNC算法发挥作用并胜过所有竞争对手的地方。

GNC算法发现最优对齐尽管噪声测量高达70-90%的离群值。图片来源:麻省理工学院。

GNC背后的思想首先是简化问题。他们将试图优化的函数(描述3D模型和2D图像之间的差异的函数)简化为具有单一最佳解决方案的函数。现在,当他们选择一个解决方案并推动它时,他们最终会找到最佳解决方案。然后他们重新引入一些原始函数的复杂性,并改进他们刚刚找到的解决方案。一直这样做直到得到原始函数和它的最优解。前灯对准得很好,车轮和保险杠也是如此。

原地踏步

本文将GNC算法应用于形状对齐和SLAM等问题。在SLAM的例子中,机器人使用传感器数据来计算出它过去的轨迹并绘制地图。例如,一个在大学校园漫游的机器人会收集里程表数据,显示它在 上午8点之间走了多远,朝哪个方向前进。和15 点。, 上午8:15之间。和8:30 点。等等。它还有激光雷达和摄像头数据 上午8点。, 15 点。等等。偶尔,它会完成循环,在两个不同的时间看到同样的东西,就像Tzoumas再次跑过7- 11一样。

研究人员发现,GNC算法比最先进的技术更准确,可以处理更高比例的异常值。

就像形状对齐一样,有一个优化问题需要解决。Yang是这篇论文的第一作者,他解释说:“对于SLAM来说,系统不是将特征对齐来匹配3D模型,而是弯曲它认为它穿越的轨迹,以便在地图上对齐物体。”首先,该系统的工作原理是最小化不同传感器感知行程之间的差异,因为每个传感器都可能在测量中存在误差。例如,如果机器人的里程表显示它在 上午8:00之间行进了100米。和15 点。在美国,基于激光雷达和相机测量数据更新的轨迹应该能反映出这个距离,或者接近这个距离。该系统还能最大限度地缩小看似同一地点的位置之间的距离。如果机器人在早上八点看到同一家7- 11, 。和10点 点。,该算法将尝试弯曲回忆的轨迹——调整每条腿——以便它在 a.m. 8:00的时候回忆的位置。 and 10:00 a.m. align, closing the loop.

绘制建筑物内部地图的机器人。GNC逐渐将杂乱的数据拆开。只需相对较少的步骤,该算法就能得到建筑物内部的精确地图。图片来源:麻省理工学院。

与此同时,该算法识别并丢弃异常值——坏数据点,它认为它在回溯它的步骤,但它不是——就像形状对齐中的错误标记特征一样。你不想错误地关闭一个循环。Tzoumas回忆起有一次在缅因州的树林里跑步时,他跑过一堆看起来很熟悉的倒下的树干。他认为他已经完成了循环,并利用这个所谓的地标,他转向了。在20分钟内没有看到任何熟悉的东西后,他才怀疑自己犯了错误,然后转身回去。

优化之前的轨迹可能看起来像一团纠结的线。在解开缠结后,它就像一组直角线,反映出机器人所穿过的校园小路和走廊的形状。这个SLAM过程的技术术语是姿态图优化

在论文中,研究人员将他们的GNC算法与其他算法在几个应用上进行了比较,包括形状对齐和姿态图优化。他们发现他们的方法比最先进的技术更准确,可以处理更高比例的异常值。对于SLAM,即使四分之三的循环闭包是错误的,它也能工作,这比在实际应用中遇到的异常值要多得多。更重要的是,他们的方法通常比其他算法更有效,需要更少的计算步骤。Tzoumas说:“其中一个困难是找到一个通用的算法,在许多应用程序中都能很好地工作。”杨说他们已经在十多人身上试用过了。最后,Tzoumas说,他们找到了“最佳点”。

MATLAB根据机器人修剪草坪的数据生成地图。左:草坪原图。中间:使用常见SLAM算法优化的地图,其中包括来自未知离群循环闭包的错误标记数据。右图:GNC算法优化后的地图。

MathWorks的机器人研究科学家罗伯托·g·瓦伦蒂(Roberto G. Valenti)说,从研究到生产是研究成果产生大规模影响的重要一步。MathWorks一直在与Carlone的实验室合作,将GNC算法集成到MATLAB中,作为导航工具箱™的一部分,公司使用该工具箱在商业和工业自主系统上实现SLAM。

走出森林

Carlone的实验室正在研究如何扩展他们的GNC算法的功能。例如,Yang的目标是设计可以被证明是正确的感知算法。安东特正在寻找方法来管理不同算法之间的不一致性:如果自动驾驶汽车的SLAM模块说道路是直的,但车道检测模块说它是右弯的,你就有问题了。

GNC算法是允许机器人发现自己错误的新基准。

Tzoumas正在研究如何扩大规模,不仅是一个机器人中多个算法之间的交互,而且是多个机器人之间的协作。在早期的工作中,他为飞行的无人机设置了跟踪目标的程序,比如试图步行或开车逃跑的罪犯。未来,多台机器可能会共同运行GNC算法。每一个都将向其邻居提供部分信息,它们将一起构建一个全球地图——包括地球上或其他地方的位置。今年,他将转到密歇根大学的航空航天工程系,研究多机器人规划和自我导航的可靠自主性,即使在艰难的环境中,如战场和其他星球。

安东特说:“不知道人工智能和感知算法将如何表现,这是使用它们的一个巨大障碍。”他指出,如果机器人博物馆导游有可能撞到游客或蒙娜丽莎,它们就不值得信任:“你希望你的系统对环境和自身有深刻的了解,这样它就能发现自己的错误。”GNC算法是允许机器人发现自己错误的新基准,最重要的是,正如Tzoumas所说,“它可以帮助你走出困境。”

机器人技术的其他专题报道

一个由九名本科生组成的团队为他们的最终项目建造了创新的跳跃机器人
用10天时间建造对抗COVID-19的机器人
远程医疗的新前沿
试穿一下:设计师设计的服装赋予机器人触觉
面板的导航

学术界/人工智能

人工智能揭开了古代文物的秘密

使用深度学习和图像处理来恢复和保存艺术品

面板的导航

绿色技术/控制系统

去除数百万吨二氧化碳2每年海港排放的废气

用氢燃料电池为商用车充电

面板的导航

STEM /学术

在STEM领域开创未来

一名高中生发现编程不仅仅是电脑屏幕