《可用于训练通用机器人在日常环境中完成各种任务的大型机器人仿真平台——RoboCasa》

  • 来源专题:新一代信息技术
  • 编译者: isticzz2022
  • 发布时间:2024-06-17
  •       RoboCasa是一个用于训练通用机器人的非常有潜力的大规模机器人仿真平台,利用了最新的生成式AI工具来极大扩充环境和任务的多样性,并提供了目前最大规模的机器人操作数据集。它为加速通用机器人的研发提供了基础设施。

          人工智能(AI)工具的性能,包括用于自然语言处理(NLP)的大型计算模型和计算机视觉算法,在过去几十年中得到了迅速提升。而目前机器人领域的chatgpt时刻还没到来,很大原因就是没有统一的系统物理执行机构和数据集。其中一个原因是从互联网上收集的用于训练这些算法的数据集呈指数级增长。另一方面,机器人控制和规划算法的训练数据仍然远没有那么丰富,部分原因是获取数据并不那么简单。因此,一些计算机科学家一直试图创建更大的数据集和平台,用于为广泛的机器人应用训练计算模型。

          最近在预印本平台arXiv发表的一篇论文中,德克萨斯大学奥斯汀分校和NVIDIA Research的研究人员介绍了其中一个名为RoboCasa的平台。RoboCasa是一个大型仿真框架,可用于训练通用机器人在日常环境中完成各种任务。“人工智能的最新进展很大程度上得益于在海量数据源上训练大型模型。”该论文的主要作者Yuke Zhu告诉Tech Xplore。“受这些进步的启发,我们寻求为能够执行各种日常任务的通用机器人开发基础模型。RoboCasa旨在提供训练此类机器人基础模型所需的高质量模拟数据。”

    这篇论文的核心贡献包括:

    • 开发了一个包含120个真实场景、数千个交互对象和家具电器的仿真环境,利用生成式AI工具生成了环境纹理和3D对象。
    • 引入了100个系统化评估任务,包括25个原子任务和75个由大语言模型引导生成的复合任务。
    • 提供了一个包含10万+轨迹的大规模多任务数据集用于模型训练,展示了用合成数据做行为克隆训练的性能提升,以及仿真数据在真实世界任务中的应用价值。

          其创新点主要在于利用生成式AI工具扩充仿真环境的多样性,用大语言模型引导生成任务,并提供了目前最大规模的机器人操作数据集。

    仿真环境:

          RoboCasa基于RoboSuite进行开发,提供了包括120个厨房场景、数千个高质量3D物体模型(涵盖153+类别)的仿真环境。利用Midjourney等工具生成了环境纹理,用Luma.AI等生成3D物体模型,极大丰富了仿真环境的多样性。

    数据集与实验:

          论文提供了一个超过10万轨迹的机器人操作数据集,主要通过人类示教和自动化轨迹生成方法(如MimicGen)得到。在原子任务上,随着合成数据量的增加(最高3000条/任务),模型性能显著提升,从人类示教的28.8%提升到47.6%。但在复合任务上,即使在原子任务上预训练再迁移学习,性能仍然较低。在真实世界任务中,利用仿真数据与真实数据联合训练,可以将性能从13.6%提高到24.4%,体现了仿真到真实的迁移价值。




           Yuke Zhu、Soroush Nasiriany、Abhiram Maddukuri、Lance Zhang、Adeet Parikh、Aaron Lo、Abhishek Joshi和Ajay Mandlekar最近的工作的主要目标是开发一个新的开源模拟平台,以促进机器人算法的培训。他们的努力最终促成了RoboCasa的开发,这是他们几年前推出的模拟框架RoboSuite的扩展。RoboSuite是团队用来创建RoboCasa模拟环境的模拟基础设施。Yuke Zhu解释道:“我们利用生成人工智能工具来创建各种各样的对象资产、场景和任务。这些人工智能工具显著提高了模拟世界的多样性和真实性。此外,RoboCasa支持各种机器人硬件平台,并为模型训练提供了超过10万条轨迹的大型数据集。”

           RoboCasa平台包括数千个3D场景,其中包含150多种不同类型的日常用品以及数十种家具和电器。RoboCasa的特点是高度逼真的模拟,这些模拟通过生成人工智能工具得到了丰富。朱和他的同事设计了100个机器人算法可以训练的任务,并为这些任务编写了高质量的人类演示。他们的平台还包括生成有效轨迹和运动的方法,使机器人能够完成这些任务。

           RoboCasa使用大型Lanague模型,如GPT-4,来创建各种各样的日常任务。Yuke Zhu说:“最让我兴奋的是两个关键发现。我们展示了一种扩展趋势:一是随着(机器生成的)训练数据集的大小增加,模型的性能稳步增长;二、通过将模拟数据与真实世界的数据相结合,我们发现增强的数据集增强了机器人在真实世界任务中的性能。”

           未来还有几个有趣的方向值得探索:

    1. 提高复合任务的学习表现,可以探索更强的策略架构和算法。
    2. 进一步利用大语言模型自动生成场景和任务的代码实现,减少人工参与。
    3. 将仿真数据与其他真实机器人数据集、互联网视频等结合,训练更强大的机器人基础模型。

    ————————————————

    原文链接:https://blog.csdn.net/jiayoushijie/article/details/139638261

    论文:https://arxiv.org/abs/2406.02523


  • 原文来源:https://techxplore.com/news/2024-06-large-scale-simulation-platform-robots.html
相关报告
  • 《人形机器人,谁主沉浮?》

    • 来源专题:智能制造
    • 编译者:icad
    • 发布时间:2024-03-07
    •     当前,机器人产业蓬勃发展,正极大改变着人类生产和生活方式,湖州,正着眼战略需求和前沿先机,打造新兴产业链,浙大湖州研究院,在机器人领域有很强的科研实力,2023年12月主办了中国机器人行业年会。未来,我们如何把握时代浪潮,助推湖州市机器人产业发展,是个值得思考的问题,为此,编写组拟推出若干期机器人行业观察文章,以抛砖引玉、共话发展。     一、人形 机器人 赛道火热     人形机器人近来可谓炙手可热。知名机器人网站The Robot Report公布的2023年机器人年度10大热点话题中有6篇是关于人形机器人的。     人形机器人又称仿人机器人,是具有人的形态,能够完成人类肢体能完成的运动、作业,并具有类人的感知、学习和认知能力的机器人,其发展可以分为四个阶段。     一是初步行走阶段:1973年,日本早稻田大学加藤一郎团队开发了仿人机器人WABOT-1,其能实现双足行走,但动作缓慢;     二是能力突破阶段:2000年,本田公司推出Asimo,其可以用双脚实现较流畅的行走;     三是技术突破阶段:2013年,美国波士顿动力推出Atlas,其可以进行后空翻、倒立等高难度动作,但成本过高;     四是商业化阶段:2022年,特斯拉发布Optimus,其可以实现直立行走、搬运、洒水等复杂动作,并宣称单个成本将降至2万美元左右,将于近年实现量产上市,最终数量将达到百万级,自此全球人形机器人赛道被引燃,各大公司纷纷入场。     有研究报告指出,当前全球 人形机器人产业正值爆发前夜,2024年将可能是人形机器人商业化元年。 2023年10月,我国工信部发布了《人形机器人创新发展指导意见》,指出“ 人形机器人集成人工智能、高端制造、新材料等先进技术,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,将深刻变革人类生产生活方式,重塑全球产业发展格局。 ”     为何人形机器人如此受关注?     人形是机器人的终极理想形态,在外形上与人最为相似,能完成的动作更多、更灵活,并且交互更具亲和性。其与传统工业/服务/特种机器人的最大不同在于其通用性,即不再根据预先规划完成特定任务,而是通过感知周边环境进行理解、学习并作出决策,且不再受限于单个场景,拥有真正意义上的具身智能。 为何是现在?     人形机器人之所以当前炙手可热,一是缘于近年来人工智能技术的飞速发展,包括语音识别、自然语言处理、图像识别、步态算法等方面的研究愈发成熟,大大提升了机器人的感知交互能力,而AI大模型的出现又使其能拥有更强的理解、学习和自主决策能力;二是在于硬件要素的提升,控制器、电机、精密减速器等部件性能提升让人形机器人有了从实验室走向市场的基础;三是在于配套产业的发展,全球机器人上下游产业链日趋完善,推动整机制造成本降低,这让人形机器人实现商业化变成可能。     二、国外人形机器人企业及产品盘点     1、人形机器人商业化赛道的领跑者——特斯拉,代表产品:Optimus、 Optimus2     特斯拉是人形机器人赛道的领跑者,也是全球电动汽车领军企业,其电动汽车制造与自动驾驶技术研发方面的积累为人形机器人研发提供了宝贵经验。     2021年8月,马斯克发布了特斯拉的人形机器人计划。仅一年后的2022年9月,Optimus(擎天柱)一代原型机就被推出,其身高173 cm ,重量约为73kg,集成2.3kWh电池,全身28个关节,整个身体的自由度超过200个,其中手掌通过6个执行器可完成11个自由度的动作,能举起超过20磅的物品。随后在经历3次迭代后,Optimus可完成流畅行走、物品抓取、物品分类、单脚站立、瑜伽表演等动作。马斯克表示, Optimus目标为代替人劳动,预计2025年至2027年量产,目标售价为2万美元左右,2024年将首先试用于特斯拉工厂。     Optimus采用了与特斯拉车辆相同的自研芯片、视觉方案,软件复用特斯拉汽车 FSD(完全自动驾驶)系统,算力调用特斯拉超级计算机Dojo超算,并像特斯拉汽车一样通过量产与技术进步控制单体制造成本。从这方面看,马斯克很可能在较早时就开始了人形机器人布局。     2023年12月,马斯克发布了Optimus 2的视频,Optimus 2相比Optimus重量减少10kg,动作更轻盈,平衡感和身体协调性得到改进,行走速度提升30%,可完成深蹲动作,颈部有2个自由度,手部动作也更为灵活,所有手指布有触觉 传感器 ,能轻松拿捏鸡蛋并实现左右手间传递以及叠衬衫等更精细化动作。     2、多年技术沉淀造就动态性能最强——波士顿动力,代表产品:ATLAS     波士顿动力是一家老牌的机器人设计公司,于1992年由马克·雷伯特教授创立于麻省理工学院,其深耕机器人领域三十余年,是 机器人技术 引领者。     波士顿动力的主要产品为四足机器人和人形机器人,以液压驱动和电液混合驱动为主。2005年,波士顿动力与美国国防高等研究计划署合作,推出四足机器人Big Dog,掀起了四足机器人的研究热潮,并在其后推出了LS3、Wild Cat、Spot等产品。在人形机器人领域,波士顿动力于2009年推出双足机器人Petman,主要用于检验美军防护服性能和军事设备,2013年发布人形机器人Atlas,其优越的动态性能在当时掀起轰动。     Atlas被称为最强动态性能人形机器人 ,其高1.5米,重约80千克,自由度28个,采用液压驱动,配备RGB相机和深度传感器。Atlas膝关节扭矩高达890N·m,髋关节扭矩达840N·m,步行速度达1.5m/s,拥有卓越的机动性,多次在演示中展现出近乎或超乎人类的运动与平衡能力。2021年发布的Atlas跑酷视频中,Atlas可以顺利完成跃平衡木、过斜坡、连续后空翻等动作。2023年1月,波士顿动力发布的Atlas人形机器人视频中,Atlas在工地给人类当助手,完成搭桥、爬楼、飞身旋转、向人类扔工具包、前空翻等灵敏动作。     尽管波士顿动力在技术上处于领先水平,但 商业化道路却进展缓慢 ,公司于近年先后被谷歌、日本软银与韩国现代汽车集团收购。Atlas售价过高,单台价值约200万美元,目前更多作为研发平台,暂未公布商业化计划。     3、与宝马达成合作的新起之秀——Figure,代表产品:Figure 01     Figure是一家AI机器人公司,成立于2022年,专注于设计自动通用人形机器人,成立至今共获得两轮共7900万美元融资。     Figure宣言 “要做世界上第一个商业上可行的通用人形机器人” , 创始人Brett Adcock指出,Figure与其他机器人公司如波士顿动力和亚马逊机器人的不同之处在于,Figure开发的机器人能够处理通用任务,并最终实现机器人对环境的学习和互动。     2023年10月,Figure正式推出该公司首款人形机器人Figure 01,对标特斯拉Optimus。Figure 01采用电驱动,身高167cm,重60kg,设计承载20kg,步速1.5m/s,续航达5小时,具有稳步行走、自主捡物品、搬运物品和自主导航的能力。     2024年1月,Figure 01一段煮咖啡的视频引起了各界关注。视频中,Figure 01只用了10个小时进行端到端训练,便自主完成打开机器盖、放入咖啡、启动机器的全过程。Figure 01还具备自主纠错的能力,如果咖啡包没有放在正确位置,它可以自行调整并继续完成任务。     目前Figure已与宝马达成合作。 在2024年1月,Figure与汽车制造商宝马签署了一项合作协议,将在宝马位于美国南卡罗来纳州的斯帕坦堡工厂部署人形机器人。初期,Figure 01将专注于五项特定的薄板金属处理任务,经少量测试后若达到性能目标,就将扩大应用规模。     4、仓储物流领域着重发力——Agility Robotics,代表产品:Digit     Agility Robotics是美国俄勒冈州立大学工程学院孵化的机器人公司,成立于2015年,在2020年被福特公司收购。公司于2017年推出第一个双足机器人Cassie,随后于2020年推出更像人类的Digit。Digit身高约1.75m,重65kg,最多可承载16kg,可以行走、跑步、爬楼梯、感知环境和手动搬运物品。     2023年3月,Agility推出新版Digit人形机器人, 主要用于物流领域 。该版Digit机器人身高175厘米,体重小于65kg,最多可承载16kg,采用可充电锂电池供电,续航能力达16小时。相比旧版,新版Digit增加了头部和手部,头部可以提供人机交互,手部呈小爪状,可以在保持平衡状态下搬运和装卸货物。根据Agility官网描述,新版Digit专为物流应用设计,目前主要用于搬运仓库的手提袋、包裹,未来还计划应用于货物卸载、配送等工作场景。     同时,Agility Robotics从2022年开始建造世界上 首家人形机器人制造工厂 。工厂位于美国俄勒冈州塞勒姆,占地7万平方英尺,据悉,该工厂每年可生产1万多台Digit,预计将于2024年开始向客户供货,2025年全面上市。     Agility Robotics 和亚马逊、福特等多公司有深入合作。 2019年5月,Agility Robotics 与福特汽车公司宣布建立合作伙伴关系,开发“最后一英里”无人物流解决方案;2023年10月,Digit人形机器人与亚马逊合作,主要用于帮助亚马逊仓库员工拾取和移动空手提箱,目前已在亚马逊工厂进行应用测试。     5、获OpenAI青睐的技术集成者——1X Technologies,代表产品:NEO、EVE     1X Technologies成立于2014年,是一家位于挪威的专注于开发具有高度灵活性和可扩展性的人形机器人制造商,其主要有两款人形机器人产品:EVE和NEO。     EVE 是1X的旗舰产品,已达成商业化,用于安保。 2020年,1X发布了EVE轮式人形机器人,身高186厘米,体重86千克,最高时速为14.4公里每小时,拥有15千克承载及6小时的续航能力。EVE配备摄像头和传感器,可以感知周围环境并与之互动。EVE的移动性、灵巧性和平衡性使其能够驾驭复杂的环境并有效地操纵物体,主要应用于物流、零售和守卫巡逻领域。2022 年,1X首次达成商业合作,签署了至少 140 台EVE机器人的分销合同,为美国商业场所提供安保服务;而在公司网站上显示,其还为医院等机构提供了约250 EVE台机器人,用于商业建筑的夜间警卫。     NEO为公司新一代产品,还在研发中,特点为轻量化和无齿轮设计。 根据1X官网,NEO身高167厘米,体重30千克,步行速度为4公里每小时,跑步速度为12公里每小时,拥有20kg的承载能力及2-4小时的续航能力。NEO将采用“无齿轮”设计理念,采用自研的无齿轮电机,大大降低整机重量,提高敏捷性。作为通用人形机器人,NEO可以处理物流、制造、操作机械等工业任务,同时提供清洁、整理家务以及日常陪伴等生活服务。     1X 获OpenAI融资支持,达成合作推动双向赋能。 2023年3月,1X 获得了一轮由OpenAI创业基金领投的2350万美元融资,成为了OpenAI投资的第一家硬件公司。同时,双方将在AI技术与机器人双向融合方面达成合作,一方面,1X的机器人为OpenAI的AI系统提供了绝佳的物理测试环境,从而增强其泛化能力和鲁棒性;另一方面,OpenAI的技术将全面提升机器人的智能程度,通过大模型的应用,有望创造出真正的“RobotGPT”,使1X机器人的学习理解能力更上一个台阶。     6、目标是太空探索——Apptronik,代表产品:Apollo     Apptronik于2016年成立,前身为美国得克萨斯大学奥斯丁分校的实验室,在近十年构建了超过10种独特的机器人。     Apptronik于2023年8月公布了人形机器人 Apollo。Apollo高1.7米,重72.6 kg,负载25kg,采用电机驱动,可以在室内或室外不受束缚的情况下工作22个小时。Apollo的特点在于 多部件模块化设计 ,如腿部可更换为固定桩,以此适应不同场合的工作需要;电池支持热插拔设计,以方便人形机器人续航。预计2025年实现商业化,拟售价不高于5万美元。     Apollo 的短期目标是 辅助物流领域 ,在演示视频中也展现出了其具有拿起、搬运、放下物体的能力。而作为与NASA深度合作的机器人公司, Apptronik 的长期目标是将 Apollo 用于太空探索 ,进行探测、太空作业等复杂任务,但目前来看还有较长的路要走。     三、国内人形机器人企业及产品盘点     1、国内人形机器人第一股——优必选,主要产品:Walker系列     优必选科技成立于2012年3月,总部位于深圳,从 伺服 舵机研发起步,逐步推出了消费级人形机器人、教育智能编程机器人、商用服务机器人、智能巡检机器人等产品。2023年12月29日,优必选在香港交易所主板挂牌上市,成为 中国“人形机器人第一股”。     优必选是国内最早开始研究人形机器人的企业之一,于2016年开始研发人形机器人Walker系列,2018年成功推出第一代大型双足仿人服务机器人Walker, 成为中国首家实现人形机器人商业化的企业。     随后,该产品经历了几次重要的技术迭代,在2019年推出第二代Walker,并在春节晚会上进行了表演。2021年推出了Walker X,该机器人身高130cm,体重63kg,拥有41个高性能伺服关节构成的灵巧四肢,并搭载了多维力觉、多目立体视觉、全向听觉和惯性、测距等全方位的感知系统,行走速度提升到3km/h。拥有复杂地形自适应平稳快速行走、动态足腿控制自平衡抗干扰、自主操作家电、全身柔顺控制、U-SLAM视觉导航、多模态情感交互、智能家居控制6大特性。     优必选伺服驱动器技术领先。 优必选成功开发了机器人操作系统应用框架(ROSA),是全球少数完成小扭矩到大扭矩(扭矩从0.2N·m到200N·m)伺服驱动器批量生产的公司之一。     2、会打乒乓球的人形机器人——浙江大学控制科学与工程学院,代表产品:悟空系列     浙江大学自2006年起开始研制人形机器人,突破了自适应精确建模、动态平衡控制、全身协调控制、智能感知决策等核心技术,先后完成四代“悟空”系列人形机器人系统研制。     2016年仿人机器人“悟空”1.0的亮相引起瞩目,在国际上形成了较大影响。“悟空”1.0身高1.6米,体重55kg,身躯采用了高强度轻质材料和 加工工艺 ,全身有30个关节,手臂为7个自由度。 “悟空”最大的亮点在于其优秀的运动性能,可以进行人-机、机-机对打乒乓球。 通过头上安装的摄像头以每秒120幅图像的速度捕捉乒乓球在空中的运动轨迹,精准地预测球的落点,误差不到2.5厘米;然后做出相应的反应动作,而且还可以与人对打,整个反应时间在50-100毫秒之间。     在之后经过多次迭代,2023年,悟空“4.0”在世界机器人大会现场登场。新款悟空身高140cm,体重46kg,全身自由度27个。 通过融合腿足运动技术与环境感知技术,实现了机器人的三维环境地图构建和自主动态导航。 运动能力相比1代更为出色,最快运动速度超过6km/h,跳高0.5m,可上下25度斜坡和10cm台阶,可轻松跨越障碍,可适应室外路面、草丛、泥地等多种地形。在钢管路面和外部推力干扰等未知扰动下,可快速恢复平衡并保持稳定行走。     目前,浙江大学研制的人形机器人正朝着实用化应用方向不断迭代和改进。     3、从医疗康复机器人到通用人形机器人——傅里叶智能,代表产品:GR-1     傅利叶智能成立于15年,总部位于上海张江机器人谷, 是国内康复医疗机器人领域的领军企业 ,迄今为止已经成功推出了30多个系列产品,并服务于全球2000多家医疗机构。     傅里叶智能早期专注于医疗康复外骨骼机器人,并实现了规模化应用,同时将其在医疗康复机器人取得的商业成果与技术积累转向通用人形机器人。公司在2019年启动通用人形机器人项目,2023年7月发布首款通用双足机器人产品       GR-1,并于9月开启预售,商业化进展快速。     GR-1身高165cm,体重55kg,全身自由度54个,采用一体化自研关节模组作为执行器,以及直腿行走方案,模拟人类直膝行走的自然步态,其步速可达5km/h,具备快速行走、敏捷避障、稳健上下坡、抗冲击干扰等功能,预计将应用于在工业、康复、居家、科研等多种应用场景。     4、国内首个能跑的人形机器人——宇树科技,代表产品:H1     宇树科技总部位于杭州,成立于2016年,是国内四足机器人领域的领先企业。有Laiakgo、Aliengo、A1、Go1、B1、H1等多款机器人产品,累积销量数千台。     2023年8月,宇树科技发布首款人形机器人H1,引起了广泛关注。H1采用 轻量化设计 ,高180cm,重量仅有47kg,全身19个自由度,配有3D激光雷达和深度相机,具有360°全景感知能力,能实现自主避障。     为适配大负载、高密度、大功率的需要,宇树科技为H1设计了大扭矩密度M107关节电机,应用在H1的两个膝关节上,峰值扭矩达到360N·m,而髋关节电机扭矩则为220N·m,踝关节为45N·m,手臂关节则为75N·m。据称,目前H1关节单元中核心零部件包括 伺服电机 、减速器、控制器均为宇树自研自产。     H1的运动能力十分优秀,行走速度达1.5m/s,而潜在运动能力可以达5m/s,在速度、力量、机动灵活性等方面具备全球近似规格最高的动力性能, 是国内首个能跑的人形机器人。     根据宇树展示的视频显示,H1的运动控制稳定,抗冲击能力较强,在受到外部冲击后,能够快速调整姿态,并保持身体平衡。     目前H1的手部还在开发中,整机预计3-5年内上市,应用于商用服务及科研教育。     5、主打服务于人——小米科技,代表产品:CyberOne     小米科技以智能手机和智能家居闻名,在2021年推出四足机器人Cyberdog后,又于2022年8月发布了全尺寸人形仿生机器人CyberOne(铁大)。     CyberOne身高177cm,体重为52kg,全身有5种关节驱动,共21个自由度,动力峰值扭矩高达300N·m,上肢有小米自研的30N·m扭矩电机,电机重量仅为500g,动作灵活,可单手抓握1.5kg的物体。下肢配合自研的人形双足控制算法,行走速度达3.6km/h。     CyberOne的特点在于人机交互。 通过自研的Mi-Sense深度视觉模组,可以对人脸、肢体动作等外界环境进行感知,在8米范围内进行三维重建,并通过自然语言处理算法感知6类45种人类语义情绪,分辨85种环境语义,使得其在与人交流时更为自然。脸部采用面罩设计,外层半透明材质,内层为OLED与柔光特效,搭配2D弯曲贴合显示模组,可实时表达机器人情绪。因此,其应用场景也更偏向于生活服务。     6、精英汇集的赛道新星——智元机器人,代表产品:远征A1     智元机器人成立于2023年2月,创始团队包括华为“天才少年”稚晖君、彭志辉等业界资深人士,拥有较强的技术背景和产业资源。     创立仅仅半年,智元机器人就于2023年8月发布了人形机器人远征A1,A1身高175cm,体重55kg,全身49+个自由度,步行速度可达7km/h,整机承重80kg,单臂最大负载5kg。膝盖采用反关节设计,膝盖向后弯曲可以拥有更大的空间,以应对更多的任务场景。     A1上搭载的PowerFlow关节电机为自研开发,使用了准直驱关节方案,实现了低齿槽转矩设计,搭配10速比以内的高力矩透明度行星减速器、共扼同轴双编码器、一体液冷循环散热系统以及自研的矢量控制驱动器,峰值扭矩超过350N·M,而重量仅为1.6kg。搭载RGBD相机、激光雷达,IMU以及麦克风阵列。灵巧手指尖集成了基于视觉的指间传感器,可以分辨被操做物体的颜色、形状甚至材质,并且基于算法可以实现近似压力传感器的效果。同时远征A1搭载了TeraFlops的高算力芯片,具备多模态感知、少样本学习、任务闭环等能力。     远征A1预计将于24年实现商业化落地,售价将控制在20万元以内,将首先应用于3C制造,汽车制造等领域,随后逐步走向家庭,协助工人、科研人员和家庭成员完成各种任务。     6、国内人形机器人商业化的先行者——开普勒,代表产品:先行者系列     开普勒机器人公司总部位于上海,成立于2023年8月,专注于通用人形机器人的研发、生产及应用生态构建。公司主要技术团队在2020年就开始了人形机器人的研究与开发,并经历了3代的原型机迭代。     在公司成立的同年11月,开普勒推出了第四代机器人产品——先行者系列通用人形机器人,分为先行者K1、S1、D1三个型号,在人形机器人赛道正式出场。     先行者机系列身高178cm,体重85kg,全身共40个关节自由度,其中灵巧手共有12个自由度。K1是标准款机器人,适用于教育科研、自动化生产线、智能搬运等;S1适用于复杂环境巡检、应急救援、户外安全作业等,主要用于户外巡检;D1主要面向危险环境检测、安全隐患排查等高危环境作业。      开普勒的人形机器人国产化率很高, 除了机器人主板等少数零部件采用国外厂商供应外,其余均为自研且已经实现国产化。     先行者系列预计在2024年下半年实现量产落实, 预估对外售价2-3万美金之间,和特斯拉擎天柱的价格相当。     除了机器人, 开普勒的另一大业务板块在开发者平台Kepler OS。 不同于特斯拉的平台封闭策略,Kepler OS允许使用者进行系统集成或二次开发,平台采用模块化设计,提供丰富的示例项目和开发文档,并支持多机 协同 ,提供强大的在线开发和调试功能。     四、结语     总体来看,国内外人形机器人商业化尚处于初期,但多数产品在研发设计之初就充分考虑了与应用单位的合作、成本控制的路径等,为汽车制造、仓储物流等领域的率先商业化批量应用积累条件,国外头部企业在这方面的表现更为明显。在技术积累与产品性能方面,国内企业与国外企业相比有一定差距,但从公布的技术参数来看,差距并非短期内不可逾越,应用为王、成本为王,技术、应用与成本三者相互交织,国内企业自有优势。     人形机器人是机器人的终极理想形态,除了用于生产外,很可能像计算机、汽车、智能手机一样走入千家万户,以此极大改变人类的生活方式;开拓性公司是推动社会发展的重要力量,随着特斯拉人形机器人与AI大模型的快速发展以及众多公司百舸争流局面的形成,相信这一前景终将呈现。同样,考虑到人形机器人市场巨大,以及当前产业处于发展初期、百舸争流局面刚刚起势,故 谁主沉浮远未定论,有志者事竟成,未来人形机器人产业很可能出现头牌引领、百花齐放的局面 ,让我们拭目以待。
  • 《Boston Dynamics 进军自主仓库机器人技术领域》

    • 来源专题:智能制造
    • 编译者:icad
    • 发布时间:2024-08-27
    • 仓库是自主机器人的前沿领域。随着消费者越来越习惯于快速周转的运输,仓库需要更快、更高效地运营。但是,仓库可能是困难的工作环境,需要需要体力劳动,例如移动重物和重复动作。自然,人们对机器人和其他仓库工作的自动化解决方案非常感兴趣。“自动化在人体工程学方面没有限制,”波士顿动力公司的高级技术总监 Mike Murphy 指出,该公司可能以 Spot(一种用于执行远程检查的机器狗)而闻名。Murphy 还是 Stretch 的首席系统工程师,Stretch 是该公司专为仓库设计的移动箱子处理机器人。 然而,仓库对机器人技术来说也可能是一个具有挑战性的环境。从表面上看,这项工作是简单而重复的。“将这些箱子从卡车上取下来,放在这个传送带上,移动它们,分类它们,把它们放在这些托盘上,然后把它们放回门外,”Murphy 说。但是,与机器人传统上取得成功的其他应用(例如制造)不同,仓库中的机器人可能会遇到更广泛的变化和挑战。例如,如果箱子没有正确关闭,它们可能会意外打开,或者它们可能会在运输过程中移动并最终落在地板或其他不该出现的地方。“这些正是我们开始能够通过自动化解决的问题,”他解释说。然后,这些知识可以应用于其他领域的新应用,例如制造业。 认识 StretchStretch 是一款电池供电的移动机器人,配备了一个带有强大吸力抓手的手臂。Stretch 在大约一个托盘大小的占地面积中包含完成工作所需的一切。它的板载摄像头和传感器使其能够“看到”周围的环境,识别正在发生的事情,并在没有预编程的情况下对任何问题做出反应并从中恢复。位于转盘上、机械臂旁边的可铰接式“感知桅杆”包含 2D 和 3D 传感器,用于从机器人周围的各个位置收集数据。然后,操作系统将数据拼接在一起,并通过机器学习管道运行数据,以检测盒子并确定面和角的位置。“它了解盒子的位置、大小、方向,”Murphy 解释说。 Stretch 的成功Stretch 于 2023 年初推出,因此它仍然相当新,但客户已经看到了成功。Murphy 描述了一个用户,该用户有几个第三方承包商,他们休息了,再也没有回来,留下一辆卡车停在阳光下,里面装满了需要卸载的沉重箱子。入库区的操作员需要找到一种方法来卸载卡车,因此他们决定尝试使用 Stretch。“他们把 Stretch 放进去,它就把卡车卸下来了,”他说。“他们非常高兴,这解决了他们的问题,而且没有抱怨高温。”仓库及其他虽然事实证明 Stretch 在卸货方面取得了成功,但这只是仓库中众多任务之一。“我们在设计硬件系统时考虑到了仓库中发生的事情,”Murphy 说,该公司目前正在从业务角度研究其他可能的应用,以决定下一步要关注什么。“我们有很多事情可以让机器人完成,基本上是软件更新,”他说。一种可能性是使用不是框的对象。“Stretch 还可以从卡车上卸下什么?无论是轮胎还是手提袋,或者你知道的,抓手可以抓住的任何东西,我们肯定会考虑。该团队还在寻找不涉及卸载的任务,例如将物体从托盘移动到输送机,反之亦然,以及从货架上拣选物品。Murphy 解释说:“无论何时,当您将单个案例从一个地方转移到另一个地方时,我们都希望从技术角度和商业意义上了解这样做需要什么。“这个机器人做这项工作有意义吗?做到这一点的典型挑战是什么?至于 Stretch 的非仓库应用程序,Boston Dynamics 在仓库领域看到了如此多的机会,以至于它并没有真正将目光投向该环境之外的更多应用程序。Murphy 说,制造应用是一个潜在的应用,汽车应用的零件排序也是如此。“但我认为,由于仓库的规模,我们目前非常关注仓库空间,”他补充道。从研究到商业化Stretch 是 Boston Dynamics 继 Spot 之后的第二个商业化产品,Spot 是专为工业检测而设计的机器狗。值得注意的是,Spot 是在公司专注于机器人研究的同时开发的。“例如,我们在这段旅程中的早期客户和合作伙伴帮助我们发现了 Industrial Inspection 作为这种平台可能真正有用的领域,”Murphy 解释说。在开发 Stretch 时,该公司希望在推出产品之前了解其技术的应用。“该平台能够在仓库中实现所有这些不同的应用,”他说。“但我们已经对几个我们有强大商业案例的案例有了非常好的了解,并且在设计平台之前,我们非常了解客户的用例。然后我们从那里开始扩张。 据 Murphy 称,Stretch 标志着 Boston Dynamics 开始成为机器人产品的连续生产商。“这确实是让我们的转型真正将我们的公司转变为专注于产品、客户价值、在全球范围内扩大规模,并能够做所有必要的事情,以拥有一套成功的产品,从销售到制造,以及拥有一家能够大规模做到这一点的公司所需的所有支柱。”“他说。 然后,Stretch 根据检测到的内容执行 “pick planning”。该系统考虑了环境因素(如墙壁、地板和天花板)以及所有箱子的位置、抓手和机械臂的几何形状、机械臂的伸展范围以及所有箱子之间的相互作用。因此,如果 Stretch 正在卸载一堆箱子,它知道不要选择底部的箱子,因为这会将堆垛的其余部分撞倒,并且它知道等到其他箱子不碍事后再在墙壁或天花板附近卸载箱子,以便更好地抓住它们。选秀规划对 Stretch 至关重要。“如果你在那里做出了一个错误的决定,你最终可能会造成一场雪崩,机器人需要一段时间才能清理干净,”Murphy 指出。Stretch 可以优化其每次选取或每几次选取的选取规划策略,具体取决于它所处的模式。 板载传感器还可以检测环境中的异常情况,例如掉落在地板上的箱子。“我们在行为系统中有反应来处理这些问题,”Murphy 说。在许多情况下,Stretch 无论如何都会尝试移动框。“这些盒子不需要完美无缺,Stretch 就可以发挥作用,”他说。它的真空抓手采用波士顿动力公司所谓的 Smart Gripper 技术,可以单独控制每个吸盘。这使 Stretch 能够拾取有孔、撕裂或凹痕的箱子。“无论哪个吸盘在盒子表面购买得好,都会得到完全的吸力,而其他吸盘最终会被关闭,这样我们就不会失去吸力,”Murphy 解释说。当 Stretch 遇到它无法处理的问题时,例如盒子打开和里面的东西洒在地上,它可以向附近工作的“机器人管理员”寻求帮助。与人类合作该团队将卡车卸货作为 Stretch 的初始应用。当货物到达仓库时,必须将其从卡车、拖车或集装箱移动到仓库中。在温暖的月份,这些容器可能会在阳光下烘烤数小时,就像烤箱一样,然后员工进去卸货。这些工作可能很难填补,以至于仓库经常求助于第三方公司来招聘和雇用工人,即便如此,人员流动率也很高。 为这项任务寻找人类工人的难度使其成为 Stretch 的理想应用程序,因为它几乎可以单独完成。但 Stretch 仍然需要一些人类的帮助——操作员必须通过将 Stretch 开入拖车或集装箱来设置 Stretch,并处理任何需要人工干预的问题。“我们设计了一些系统来保持机器人安全运行,”Murphy 说。一种选择是便携式笼子,它可以在工作时将 Stretch 完全封闭在拖车或集装箱中。在启动 Stretch 之前,人工确保笼内没有其他人,并且它会继续运行,直到门打开或人工停止。但是,正如 Murphy 所指出的,“我们的客户重视灵活性,他们不希望笼式面板妨碍他们所有其他东西。因此,该公司开发了一种“虚拟防护”系统。它使用传感器来设置一个边界,如果检测到附近有人,它会减慢 Stretch 的速度,如果有人靠得太近,它会停止。“我们在机器人上安装了功能安全系统,能够确保系统安全停止,”他补充道,“如果出现这些情况,将手动重启。 目前,Stretch 只能在受保护的空间内自主移动,但最终,它将能够在其他人中完全自主地穿过仓库。Murphy 说,他预计 Stretch 不会与其他人并肩工作。“Stretch 非常强大,覆盖范围很广,它独立工作真的很有意义,”他解释说。但是,随着 Stretch 在仓库中承担更多任务,它将需要与人共享空间,尤其是当它需要人工帮助时。“我们正在努力真正考虑如何让我们非常有信心地安全地进行这项工作,”他说。入职由于 Stretch 不需要预先编程,因此部署过程相对简单快捷。Murphy 说,这需要 5 天或更短的时间,而且用户可以在一周内自行运行系统。该过程包括连接网络系统和电气工作,以及将 Stretch 物理或无线连接到它放置箱子的输送机上,以便将它们从拖车上移除。Stretch 可以与各种输送机配合使用,从 Stretch 可以随身携带的柔性手风琴类型到可以自行伸展和缩回的固定伸缩输送机。Stretch 可以控制这些输送机的位置,并要求输送机跟随它进入拖车。 工人在调试过程中接受为期两天的培训,学习如何使用挂件上的操纵杆驾驶 Stretch,当 Stretch 需要人工帮助时如何安全干预,以及什么是不同的错误代码以及如何修复它们。一旦 Stretch 就位,“看起来真的就像启动一台洗衣机,”Murphy 描述道。“你按照向导操作,按下几个按钮,按住启动按钮,它就会卸载卡车。”