基于奖励机的离线强化学习算法研究

出版社:中国科学技术大学
出版年:2024
作者:孙浩源
资源类型:图书
细分类型:学位论文
相关推荐

基于含噪奖励分布分解的分布型多智能体强化学习算法

  • 作者:耿炜
  • 出版社:中国科学院软件研究所
  • 出版年:2024

稀疏奖励下参数化动作空间的深度强化学习算法研究

  • 作者:宋佳凯
  • 出版社:中国科学技术大学
  • 出版年:2023

稀疏奖励环境下的强化学习方法研究

  • 作者:康永欣
  • 出版社:中国科学院大学人工智能学院
  • 出版年:2023

面向卫星姿控的逆强化学习奖励函数研究

  • 作者:吴科余
  • 出版社:中国科学院软件研究所
  • 出版年:2023

稀疏奖励强化学习环境下的观测攻击防御研究

  • 作者:刘夕
  • 出版社:中国科学技术大学
  • 出版年:2024

面向稀疏奖励任务的深度强化学习探索方法研究

  • 作者:徐沛
  • 出版社:中国科学院大学人工智能学院
  • 出版年:2023