得益于北卡罗来纳州立大学研究人员开发的一项技术,自动驾驶汽车有朝一日或许能在道路上更好地导航。 这项技术可以让人工智能程序利用二维图像更准确地绘制三维空间地图。
北卡罗来纳州立大学电气与计算机工程系研究人员表示:"大多数自动驾驶汽车都使用名为视觉转换器的强大人工智能程序,从多个摄像头获取二维图像,并创建车辆周围三维空间的表示。 虽然这些人工智能程序采用了不同的方法,但仍有很大的改进空间。多视图注意情境化"(MvACon),是一种即插即用的补充技术,可以与现有的视觉转换器人工智能程序结合使用,提高它们绘制三维空间地图的能力" 。研究团队用目前市场上三种领先的视觉转换器测试了 MvACon 的性能,这三种视觉转换器都依靠一组六个摄像头来收集它们转换的二维图像。 MvACon 显著提高了所有三种视觉转换器的性能。
该研究团队在今年的IEEE/CVF计算机视觉与模式识别大会上发表了题为 "Multi-View Attentive Contextualization for Multi-View 3D Object Detection "的论文。
原文链接:https://openaccess.thecvf.com/content/CVPR2024/papers/Liu_Multi-View_Attentive_Contextualization_for_Multi-View_3D_Object_Detection_CVPR_2024_paper.pdf