2.765

2022影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种新的多智能体Q学习算法

郭锐 吴敏 彭军 彭姣 曹卫华

郭锐, 吴敏, 彭军, 彭姣, 曹卫华. 一种新的多智能体Q学习算法. 自动化学报, 2007, 33(4): 367-372. doi: 10.1360/aas-007-0367
引用本文: 郭锐, 吴敏, 彭军, 彭姣, 曹卫华. 一种新的多智能体Q学习算法. 自动化学报, 2007, 33(4): 367-372. doi: 10.1360/aas-007-0367
GUO Rui, WU Min, PENG Jun, PENG Jiao, CAO Wei-Hua. A New Q Learning Algorithm for Multi-agent Systems. ACTA AUTOMATICA SINICA, 2007, 33(4): 367-372. doi: 10.1360/aas-007-0367
Citation: GUO Rui, WU Min, PENG Jun, PENG Jiao, CAO Wei-Hua. A New Q Learning Algorithm for Multi-agent Systems. ACTA AUTOMATICA SINICA, 2007, 33(4): 367-372. doi: 10.1360/aas-007-0367

一种新的多智能体Q学习算法

doi: 10.1360/aas-007-0367
详细信息
    通讯作者:

    吴敏

  • 中图分类号: TP18

A New Q Learning Algorithm for Multi-agent Systems

More Information
    Corresponding author: WU Min
  • 摘要: 针对非确定马尔可夫环境下的多智能体系统,提出了一种新的多智能体Q学习算法.算法中通过对联合动作的统计来学习其它智能体的行为策略,并利用智能体策略向量的全概率分布保证了对联合最优动作的选择. 同时对算法的收敛性和学习性能进行了分析.该算法在多智能体系统RoboCup中的应用进一步表明了算法的有效性与泛化能力.
  • 加载中
计量
  • 文章访问数:  4037
  • HTML全文浏览量:  173
  • PDF下载量:  1981
  • 被引次数: 0
出版历程
  • 收稿日期:  2005-11-10
  • 修回日期:  2006-04-28
  • 刊出日期:  2007-04-20

目录

    /

    返回文章
    返回