《基于神经网络的机器人学习与控制:回顾与展望》

  • 来源专题:数控机床与工业机器人
  • 编译者: icad
  • 发布时间:2023-03-14
  • 基于神经网络的机器人学习与控制:回顾与展望 谢正泰, 樊佳亮, 刘梅, 金龙
    Learning and Control of Robots Based on Neural Networks: Review and Outlook
    XIE Zhengtai, FAN Jialiang, LIU Mei, JIN Long
    信息与控制 . 2023, (1): 37 -58 .  DOI: 10.13976/j.cnki.xk.2023.2428
    .
    .
  • 原文来源:https://xk.sia.cn/CN/lexeme/showArticleByLexeme.do?articleID=4678
相关报告
  • 《利用量子技术,机器人学习速度更快》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2021-04-12
    • 奥地利维也纳大学,因斯布鲁克大学,德国量子技术研究所,以及荷兰莱顿大学的研究人员首次成功证明了量子技术可以加速机器人学习过程。相关研究发表在《Nature》上。 人工智能是我们现代生活的一部分。实际应用中的一个关键问题是这种智能机器的学习速度有多快。这里,研究人员通过实验已经回答了这个问题,通过将用于单光子的量子处理器用作机器人表明了量子技术可以加快学习过程。 解决计算机游戏,识别人的声音或帮助寻找最佳治疗方法的机器人:这些是过去几年人工智能领域产生的惊人例子。不断寻求更好的机器的竞争引发了一个问题,即如何以及以何种方式实现改进。与此同时,最近量子技术的巨大进步证实了量子物理学的威力,不仅因为它常常是奇特而令人费解的理论,而且也因为它在现实生活中的应用。因此,融合这两个领域的想法:一方面,人工智能及其自主机器;另一方面,量子物理及其强大的算法。 在过去的几年里,许多科学家已经开始研究如何连接这两个世界,并研究量子力学如何证明有利于学习机器人,反之亦然。一些有趣的结果表明,例如,机器人决定他们的下一步行动更快,或设计新的量子实验使用特定的学习技术。然而,机器人仍然无法更快地学习,这是日益复杂的自主机器发展的一个关键特征。 人工智能中的一个重要范例是强化学习(RL),即被称为“代理”的决策实体与环境交互,并通过在获得反馈的基础上更新其行为进行学习。只要代理执行良好(即做出正确的决定),环境就会奖励其行为,并且代理会使用此信息来逐步增加完成其任务的可能性。实际应用中的关键问题是代理的学习速度。尽管各种研究已经利用量子力学来加快代理的决策过程,但尚未证明学习时间的减少。 图1, 学习代理的示意图。a、代理通过接收感知输入si并输出动作ai与环境进行交互。b、代理和环境进行经典交互,即使用经典信道,其中只能通过固定的首选基础(例如,垂直或水平光子极化)进行通信。c、代理和环境通过量子通道进行交互,在该通道上交换任意叠加状态 这里,研究人员提出一种强化学习实验,这是环境和一种量子增强的混合代理之间的交互。使用该混合代理可以通过交换量子状态,这意味着通信不再局限于经典信道(具有固定的首选基础),而是允许通过量子信道进行任意叠加的交换。这样可以在其学习时间中实现量子加速,并实现对学习过程的最佳控制。 简而言之,可以通过想象一个站在十字路口的机器人来理解实验,该机器人的任务是学习始终向左转。机器人在执行正确的动作时会通过获得奖励来进行学习。现在,如果将机器人放置在我们通常的经典环境中,那么它将尝试左转或右转,并且只有在选择了左转的情况下才能获得奖励。相比之下,当机器人利用量子技术时,量子物理学的奇异面开始发挥作用。机器人现在可以利用其最著名,最独特的功能之一,即所谓的叠加原理。直观理解的话,通过想象机器人同时向左转和向右转,研究人员Hans Briegel表示:“这一关键功能使得量子搜索算法的实现能够减少学习正确路径的尝试次数。因此,一个能够在叠加中探索其环境的智能体,这将比传统的智能体学习得快得多。” 为了进行验证,研究人员利用了单光子,即光的基本粒子,并将其耦合到由麻省理工学院设计的紧凑且完全可调的集成纳米光子处理器上实施此学习协议。 该处理器用于机器人并用于执行学习任务。该设备与电信波长光子对接,具有快速的有源反馈机制,将可以轻松集成到未来大规模量子通信网络中,进而展示代理的系统量子优势。 通过使用量子计算可以增强机器学习的这一实验性的演示显示了将这两种技术结合在一起时的有希望的优势。菲利普•沃尔瑟(Philip Walther)说,“这是初次开始了解量子人工智能的可能性,因此,每一项新的实验结果都为该领域的发展做出了贡献,而该领域目前被视为量子计算领域中最富饶的领域之一。 ”
  • 《Nature | 机器学习揭示昆虫翅膀铰链的控制机制》

    • 来源专题:战略生物资源
    • 编译者:李康音
    • 发布时间:2024-04-21
    • 2024年4月17日,美国加州理工学院的研究人员在Nature发表题为Machine learning reveals the control mechanics of an insect wing hinge的文章。 昆虫构成了后生动物中物种最丰富的适应辐射,这一成功得益于主动飞行的进化。不同于翼龙、鸟类和蝙蝠,昆虫的翅膀并不是从腿进化而来的,而是一种新颖的结构,通过生物力学上复杂的铰链连接到身体上,将专门力量肌肉的微小高频振荡转化为翅膀的前后运动。铰链由称为骨片sclerites的微小硬化结构系统组成,这些骨片通过灵活的关节相互连接,并由专门的控制肌肉活动进行调节。 该研究报道了基于基因编码的钙指示剂,对果蝇的这些肌肉活动进行成像,同时用高速摄像机跟踪翅膀的三维运动。利用机器学习,创建了卷积神经网络,可以根据转向肌肉的活动,准确预测翅膀的运动,以及编码器-解码器,可以预测单个骨片对翅膀运动的作用。通过在动态缩放的飞行机器人上回放机翼运动模式,量化了转向肌肉活动,对气动力的影响。基于物理模拟结合铰链模型,产生了与自由飞行昆虫非常相似的飞行动作。 这种综合的、多学科方法揭示了,昆虫翅膀铰链的机械控制逻辑,可以说是自然界中,最复杂和进化上最重要的骨骼结构之一。