《研究人员利用阴影对3D场景进行建模,包括被遮挡的物体》

  • 来源专题:人工智能
  • 编译者: 袁晨
  • 发布时间:2024-06-21
  • 这项技术可以带来更安全的自动驾驶汽车、更高效的AR/VR耳机或更快的仓库机器人。

    想象一下,驾驶自动驾驶汽车穿过隧道,但在你不知情的情况下,一场车祸让前方的交通停止了。通常情况下,你需要依靠前方的汽车才能知道你应该开始刹车。但是,如果你的车能看到前方的汽车并更快地刹车,该怎么办?

    麻省理工学院和Meta的研究人员开发了一种计算机视觉技术,有朝一日可以让自动驾驶汽车做到这一点。

    他们引入了一种方法,使用单个相机位置的图像创建整个场景的物理精确的3D模型,包括被遮挡的区域。他们的技术使用阴影来确定场景中被遮挡部分的内容。

    他们将他们的方法称为PlatoNeRF,基于柏拉图对洞穴的寓言,这是希腊哲学家《理想国》中的一段话,在这段话中,被锁在洞穴中的囚犯根据洞穴墙上投射的阴影来辨别外部世界的现实。

    通过将激光雷达(光检测和测距)技术与机器学习相结合,PlatoNeRF可以生成比一些现有人工智能技术更准确的3D几何重建。此外,PlatoNeRF更擅长平滑重建难以看到阴影的场景,例如那些环境光照高或背景暗的场景。

    除了提高自动驾驶汽车的安全性外,PlatoNeRF还可以使用户无需四处走动进行测量即可对房间的几何形状进行建模,从而提高AR/VR耳机的效率。它还可以帮助仓库机器人更快地在杂乱的环境中找到物品。

    麻省理工学院媒体艺术与科学研究生、麻省理工大学媒体实验室相机文化小组的研究助理、一篇关于PlatoNeRF的论文的主要作者Tzofi Klinghoffer说:“我们的关键想法是将这两个以前在不同学科中做过的事情结合起来——多盎司激光雷达和机器学习。事实证明,当你将这两件事结合在一起时,你就会发现很多新的机会来探索并两全其美。”。

    Klinghoffer与他的顾问Ramesh Raskar共同撰写了这篇论文,Ramesh Laskar是麻省理工学院媒体艺术与科学副教授兼相机文化小组组长;资深作者Rakesh Ranjan,元现实实验室人工智能研究主任;以及相机文化集团的研究助理Siddharth Somasundaram,Meta的Xiaoyu Xiang、Yuchen Fan和Christian Richardt。这项研究将在计算机视觉和模式识别会议上发表。

    揭示问题

    从一个相机视点重建完整的3D场景是一个复杂的问题。

    一些机器学习方法使用生成的人工智能模型,试图猜测被遮挡区域中的内容,但这些模型可能会使原本不存在的物体产生幻觉。其他方法试图使用彩色图像中的阴影来推断隐藏对象的形状,但当阴影很难看到时,这些方法可能会很困难。

    对于PlatoNeRF,麻省理工学院的研究人员使用一种名为单光子激光雷达的新传感模式建立了这些方法。激光雷达通过发射光脉冲并测量光反弹到传感器所需的时间来绘制3D场景。因为单光子激光雷达可以探测单个光子,所以它们可以提供更高分辨率的数据。

    研究人员使用单光子激光雷达照射场景中的目标点。一些光线会从该点反弹并直接返回到传感器。然而,大多数光在返回传感器之前会散射并从其他物体上反射。PlatoNeRF依赖于光的第二次反弹。

    PlatoNeRF通过计算光反弹两次然后返回激光雷达传感器所需的时间,捕捉到有关场景的额外信息,包括深度。光的第二次反弹也包含有关阴影的信息。

    该系统跟踪二次光线,即从目标点反弹到场景中其他点的光线,以确定哪些点位于阴影中(由于缺少光线)。基于这些阴影的位置,PlatoNeRF可以推断隐藏对象的几何图形。

    激光雷达依次照射16个点,捕捉多个图像,用于重建整个3D场景。

    Klinghoffer说:“每次我们照亮场景中的一个点时,我们都会产生新的阴影。因为我们有所有这些不同的照明源,我们有很多光线在周围照射,所以我们正在雕刻出被遮挡的、位于肉眼之外的区域。”。

    一个成功的组合

    PlatoNeRF的关键是将多盎司激光雷达与一种称为神经辐射场(NeRF)的特殊类型的机器学习模型相结合。NeRF将场景的几何结构编码为神经网络的权重,这使模型具有很强的插值或估计场景新视图的能力。

    Klinghoffer说,当与多盎司激光雷达相结合时,这种插值能力也可以实现高精度的场景重建。

    他说:“最大的挑战是弄清楚如何将这两件事结合起来。我们真的必须思考光如何通过多盎司激光雷达传输的物理问题,以及如何通过机器学习进行建模。”。

    他们将PlatoNeRF与两种常见的替代方法进行了比较,一种仅使用激光雷达,另一种仅采用带彩色图像的NeRF。

    他们发现,他们的方法能够胜过这两种技术,尤其是当激光雷达传感器的分辨率较低时。这将使他们的方法在现实世界中更实用,因为在现实世界,低分辨率传感器在商业设备中很常见。

    “大约15年前,我们的团队发明了第一台可以‘看到’角落的相机,它通过利用多次光的反弹或‘光的回声’来工作。这些技术使用了特殊的激光器和传感器,并使用了三次光的反弹。自那以后,激光雷达技术变得更加主流,这导致我们对可以透过雾看到的相机进行了研究。这项新工作只使用了两次光的反射,这意味着信噪比非常高,3D重建质量令人印象深刻,”Raskar说。

    未来,研究人员希望尝试跟踪两次以上的光反弹,看看这如何改善场景重建。此外,他们有兴趣应用更多的深度学习技术,并将PlatoNeRF与彩色图像测量相结合,以捕捉纹理信息。

    多伦多大学计算机科学系助理教授David Lindell没有参与这项工作,他说:“虽然阴影的相机图像长期以来一直被研究为3D重建的一种手段,但这项工作在激光雷达的背景下重新审视了这个问题,证明了重建的隐藏几何体的准确性有了显著提高。这项工作表明,当与普通传感器相结合时,聪明的算法可以实现非凡的能力,包括我们许多人现在口袋里携带的激光雷达系统。”。


  • 原文来源:https://news.mit.edu/2024/researchers-leverage-shadows-model-3d-scenes-blocked-objects-0618
相关报告
  • 《研究人员开发了一种3D打印石墨烯气凝胶新工艺》

    • 来源专题:纳米科技
    • 编译者:郭文姣
    • 发布时间:2021-04-25
    • AZO于2021年4月15日发布关于石墨烯的内容,文章指出石墨烯在去除水中污染物方面做得很好,但这种神奇的材料尚未成为商业上可行的用途。这种情况可能正在改变。 在最近的一项研究中,布法罗大学(University at Buffalo)的工程师们报告了一种3D打印石墨烯气凝胶的新工艺,他们称该工艺克服了水处理的两个关键障碍——可扩展性和创造出一种足够稳定、可以重复使用的材料版本。 “我们的目标是安全地去除水中的污染物,而不释放出任何有问题的化学残留物,”研究合著者、乌兰巴托大学工程与应用科学学院环境工程助理教授Nirupam Aich博士说。“我们创造的气凝胶在水处理系统中保持其结构,它们可以应用于各种水处理应用。” 这项名为“去除水污染的3D打印石墨烯-生物聚合物气凝胶:一个概念证明”的研究发表在《环境科学:纳米》杂志的新兴研究者系列上。阿维德·马苏德(Arvid Masud)博士是第一作者,他以前是Aich实验室的学生;周驰博士,联合作者,UB工业与系统工程副教授。 气凝胶是一种轻而多孔的固体,它是用气体取代凝胶中的液体而形成的,这样得到的固体与原来的固体大小相同。它们在结构配置上类似于聚苯乙烯泡沫塑料:多孔性强,重量轻,但又强又有弹性。 石墨烯是一种由单质碳组成的纳米材料,它由一层排列在重复六角形晶格中的碳原子组成。 为了创造出合适的石墨烯油墨稠度,研究人员将目光投向了大自然。他们添加了两种仿生聚合物——聚多巴胺(一种合成材料,通常被称为PDA,类似于贻贝的黏附分泌物)和牛血清白蛋白(一种来自奶牛的蛋白质)。 在测试中,重新配置的气凝胶去除了某些重金属,如铅和铬,这些重金属困扰着全国的饮用水系统。它还能去除阳离子亚甲基蓝、阴离子埃文斯蓝等有机染料,以及正己烷、庚烷、甲苯等有机溶剂。 为了证明气凝胶的再利用潜力,研究人员对有机溶剂进行了10次测试。每次都能去除100%的溶剂。研究人员还报告说,气凝胶在第三个循环后捕获亚甲基蓝的能力下降了2-20%。 Aich说,气凝胶也可以按比例放大,因为与纳米薄片不同,气凝胶可以打印更大的尺寸。他说,这消除了以前大规模生产中固有的问题,并使该工艺可用于大型设施,如污水处理厂。他补充说,气凝胶可以从水中去除,并在其他地方重复使用,而且它们不会在水中留下任何残留物。 Aich是UB和匹兹堡大学合作的一部分,由UB化学教授戴安娜·阿加博士领导,寻找方法和工具来降解每氟烷基和多氟烷基物质(PFAS),有毒物质如此难以分解,它们被称为“永恒的化学物质”。Aich注意到这与他的3D气凝胶工作的相似之处,他希望这两个项目的结果可以结合在一起,创造出更有效的去除水媒污染物的方法。 “我们不仅可以使用这些气凝胶来包含石墨烯颗粒,还可以使用纳米金属颗粒作为催化剂,”Aich说。“未来的目标是让纳米金属颗粒嵌入到气凝胶的内壁和表面,它们不仅能够降解或摧毁生物污染物,还能降解化学污染物。” Aich、Chi和Masud持有该研究中描述的石墨烯气凝胶的一项正在申请中的专利,他们正在寻找工业合作伙伴将这一工艺商业化。
  • 《德国研究人员开发3D扫描新方法可检测透明物体》

    • 来源专题:集成电路
    • 编译者:shenxiang
    • 发布时间:2021-05-10
    • 据环球网5月7日消息,德国弗劳恩霍夫应用光学与精密机械研究所(IOF)开发出一种利用激光和热辐射进行3D扫描的新系统,可精确测量透明物体的外形。此方法无需对透明物体进行预处理,即可精确检测其外形。此系统的核心是一个高能二氧化碳激光器,通过高功率密度的激光束照射物体,激光能量会被测量对象吸收,并辐射出其中一部分,利用两个热像仪从不同角度分析热信号,借助IOF自研软件,从两个视角的信息计算空间图像点,将它们组合后形成测量对象的3D数据。该系统能够满足工业用3D传感器的要求,未来有望应用在机器人领域。