基于一般和随机对策论框架下的多智能体学习

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于一般和随机对策论框架下的多智能体学习

欧海涛, 张卫东, 许晓鸣

文章导航 > 自动化学报 > 2002 > 28(3): 423-426

欧海涛, 张卫东, 许晓鸣. 基于一般和随机对策论框架下的多智能体学习. 自动化学报, 2002, 28(3): 423-426.

引用本文:

欧海涛, 张卫东, 许晓鸣. 基于一般和随机对策论框架下的多智能体学习. 自动化学报, 2002, 28(3): 423-426.

OU Hai-Tao, ZHANG Wei-Dong, XU Xiao-Ming. Multi-Agent Learning Based on General-Sum Stochastic Games. ACTA AUTOMATICA SINICA, 2002, 28(3): 423-426.

Citation:

OU Hai-Tao, ZHANG Wei-Dong, XU Xiao-Ming. Multi-Agent Learning Based on General-Sum Stochastic Games. ACTA AUTOMATICA SINICA, 2002, 28(3): 423-426.

欧海涛, 张卫东, 许晓鸣. 基于一般和随机对策论框架下的多智能体学习. 自动化学报, 2002, 28(3): 423-426.

引用本文:

欧海涛, 张卫东, 许晓鸣. 基于一般和随机对策论框架下的多智能体学习. 自动化学报, 2002, 28(3): 423-426.

OU Hai-Tao, ZHANG Wei-Dong, XU Xiao-Ming. Multi-Agent Learning Based on General-Sum Stochastic Games. ACTA AUTOMATICA SINICA, 2002, 28(3): 423-426.

Citation:

OU Hai-Tao, ZHANG Wei-Dong, XU Xiao-Ming. Multi-Agent Learning Based on General-Sum Stochastic Games. ACTA AUTOMATICA SINICA, 2002, 28(3): 423-426.

基于一般和随机对策论框架下的多智能体学习

1.
上海交通大学自动化系,上海

通讯作者:
欧海涛

中图分类号: TP13
计量
- 文章访问数: 2163
- HTML全文浏览量: 218
- PDF下载量: 1072
- 被引次数: 0
出版历程
- 收稿日期: 2000-01-14
- 刊出日期: 2002-03-20

Multi-Agent Learning Based on General-Sum Stochastic Games

1.
Department of Automation,Shanghai Jiaotong University,Shanghai

More Information

Corresponding author: OU Hai-Tao

摘要: 将Q-learning从单智能体框架上扩展到非合作的多智能体框架上,建立了在一般和随机对策框架下的多智能体理论框架和学习算法,提出了以Nash平衡点作为学习目标.给出了对策结构的约束条件,并证明了在此约束条件下算法的收敛性,对多智能体系统的研究与应用有重要意义.
- 多智能体 /
- Q-learning /
- 随机对策 /
- Nash平衡点
Abstract: Q-learning from original single-agent framework is extended to non-cooperative multi-agent framework, and the theoretic framework of multi-agent learning is proposed under general-sum stochastic games with Nash equilibrium point as learning objective. We introduce a multi-agent Q-learning algorithm and prove its convergence under certain restriction, which is very important for the study and application of multi-agent system.
- Multi-agent /
- Q-learning /
- stochadtic games /
- Nash equilibrium point

参考文献(0)

资源附件(0)

计量

文章访问数: 2163
HTML全文浏览量: 218
PDF下载量: 1072
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net