《基于神经网络的机器人学习与控制:回顾与展望》

  • 来源专题:数控机床与工业机器人
  • 编译者: icad
  • 发布时间:2023-03-14
  • 基于神经网络的机器人学习与控制:回顾与展望 谢正泰, 樊佳亮, 刘梅, 金龙
    Learning and Control of Robots Based on Neural Networks: Review and Outlook
    XIE Zhengtai, FAN Jialiang, LIU Mei, JIN Long
    信息与控制 . 2023, (1): 37 -58 .  DOI: 10.13976/j.cnki.xk.2023.2428
    .
    .
  • 原文来源:https://xk.sia.cn/CN/lexeme/showArticleByLexeme.do?articleID=4678
相关报告
  • 《利用量子技术,机器人学习速度更快》

    • 来源专题:光电情报网信息监测服务平台
    • 编译者:husisi
    • 发布时间:2021-04-12
    • 奥地利维也纳大学,因斯布鲁克大学,德国量子技术研究所,以及荷兰莱顿大学的研究人员首次成功证明了量子技术可以加速机器人学习过程。相关研究发表在《Nature》上。 人工智能是我们现代生活的一部分。实际应用中的一个关键问题是这种智能机器的学习速度有多快。这里,研究人员通过实验已经回答了这个问题,通过将用于单光子的量子处理器用作机器人表明了量子技术可以加快学习过程。 解决计算机游戏,识别人的声音或帮助寻找最佳治疗方法的机器人:这些是过去几年人工智能领域产生的惊人例子。不断寻求更好的机器的竞争引发了一个问题,即如何以及以何种方式实现改进。与此同时,最近量子技术的巨大进步证实了量子物理学的威力,不仅因为它常常是奇特而令人费解的理论,而且也因为它在现实生活中的应用。因此,融合这两个领域的想法:一方面,人工智能及其自主机器;另一方面,量子物理及其强大的算法。 在过去的几年里,许多科学家已经开始研究如何连接这两个世界,并研究量子力学如何证明有利于学习机器人,反之亦然。一些有趣的结果表明,例如,机器人决定他们的下一步行动更快,或设计新的量子实验使用特定的学习技术。然而,机器人仍然无法更快地学习,这是日益复杂的自主机器发展的一个关键特征。 人工智能中的一个重要范例是强化学习(RL),即被称为“代理”的决策实体与环境交互,并通过在获得反馈的基础上更新其行为进行学习。只要代理执行良好(即做出正确的决定),环境就会奖励其行为,并且代理会使用此信息来逐步增加完成其任务的可能性。实际应用中的关键问题是代理的学习速度。尽管各种研究已经利用量子力学来加快代理的决策过程,但尚未证明学习时间的减少。 图1, 学习代理的示意图。a、代理通过接收感知输入si并输出动作ai与环境进行交互。b、代理和环境进行经典交互,即使用经典信道,其中只能通过固定的首选基础(例如,垂直或水平光子极化)进行通信。c、代理和环境通过量子通道进行交互,在该通道上交换任意叠加状态 这里,研究人员提出一种强化学习实验,这是环境和一种量子增强的混合代理之间的交互。使用该混合代理可以通过交换量子状态,这意味着通信不再局限于经典信道(具有固定的首选基础),而是允许通过量子信道进行任意叠加的交换。这样可以在其学习时间中实现量子加速,并实现对学习过程的最佳控制。 简而言之,可以通过想象一个站在十字路口的机器人来理解实验,该机器人的任务是学习始终向左转。机器人在执行正确的动作时会通过获得奖励来进行学习。现在,如果将机器人放置在我们通常的经典环境中,那么它将尝试左转或右转,并且只有在选择了左转的情况下才能获得奖励。相比之下,当机器人利用量子技术时,量子物理学的奇异面开始发挥作用。机器人现在可以利用其最著名,最独特的功能之一,即所谓的叠加原理。直观理解的话,通过想象机器人同时向左转和向右转,研究人员Hans Briegel表示:“这一关键功能使得量子搜索算法的实现能够减少学习正确路径的尝试次数。因此,一个能够在叠加中探索其环境的智能体,这将比传统的智能体学习得快得多。” 为了进行验证,研究人员利用了单光子,即光的基本粒子,并将其耦合到由麻省理工学院设计的紧凑且完全可调的集成纳米光子处理器上实施此学习协议。 该处理器用于机器人并用于执行学习任务。该设备与电信波长光子对接,具有快速的有源反馈机制,将可以轻松集成到未来大规模量子通信网络中,进而展示代理的系统量子优势。 通过使用量子计算可以增强机器学习的这一实验性的演示显示了将这两种技术结合在一起时的有希望的优势。菲利普•沃尔瑟(Philip Walther)说,“这是初次开始了解量子人工智能的可能性,因此,每一项新的实验结果都为该领域的发展做出了贡献,而该领域目前被视为量子计算领域中最富饶的领域之一。 ”
  • 《基于递归模糊神经网络的污水处理控制方法》

    • 来源专题:广州能源研究所信息监测
    • 编译者:giecinfo
    • 发布时间:2016-04-13
    • 针对污水处理过程具有非线性、大时变等问题,提出了一种基于递归模糊神经网络的多变量控制方法。该方法通过递归模糊神经网络控制器自适应地获得对操作变量的控制精度,控制器在常规BP学习算法的基础上采用学习率自适应学习算法且引入了动量项来训练网络参数,避免网络陷入局部最优,提高了网络对系统的控制精度。最后,基于仿真基准模型(BSM1)平台对第五分区中的溶解氧和第二分区中的硝态氮控制进行动态仿真实验,结果表明,与PID、前馈神经网络和常规递归神经网络相比,该方法能有效提高系统的自适应控制精度。