竞争式Takagi-Sugeno模糊再励学习

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

竞争式Takagi-Sugeno模糊再励学习

晏雄伟, 邓志东, 孙增圻

文章导航 > 自动化学报 > 2002 > 28(6): 873-880

邓自立, 李北新. 非平稳ARMA信号自校正滤波器及其应用. 自动化学报, 1992, 18(1): 80-86.

引用本文:

晏雄伟, 邓志东, 孙增圻. 竞争式Takagi-Sugeno模糊再励学习. 自动化学报, 2002, 28(6): 873-880.

Deng Zili, Li Beixin. A Self-Tuning Filter for Nonstationary Arma Signals and its Applications. ACTA AUTOMATICA SINICA, 1992, 18(1): 80-86.

Citation:

YAN Xiong-Wei, DENG Zhi-Dong, SUN Zeng-Qi. Competitive Takagi-Sugeno Fuzzy Reinforcement Learning. ACTA AUTOMATICA SINICA, 2002, 28(6): 873-880.

邓自立, 李北新. 非平稳ARMA信号自校正滤波器及其应用. 自动化学报, 1992, 18(1): 80-86.

引用本文:

晏雄伟, 邓志东, 孙增圻. 竞争式Takagi-Sugeno模糊再励学习. 自动化学报, 2002, 28(6): 873-880.

Deng Zili, Li Beixin. A Self-Tuning Filter for Nonstationary Arma Signals and its Applications. ACTA AUTOMATICA SINICA, 1992, 18(1): 80-86.

Citation:

YAN Xiong-Wei, DENG Zhi-Dong, SUN Zeng-Qi. Competitive Takagi-Sugeno Fuzzy Reinforcement Learning. ACTA AUTOMATICA SINICA, 2002, 28(6): 873-880.

竞争式Takagi-Sugeno模糊再励学习

1.
清华大学计算机科学与技术系智能技术与系统国家重点实验室,北京

通讯作者:
晏雄伟

中图分类号: TP18
计量
- 文章访问数: 2188
- HTML全文浏览量: 102
- PDF下载量: 1083
- 被引次数: 0
出版历程
- 收稿日期: 2000-11-27
- 刊出日期: 2002-06-20

Competitive Takagi-Sugeno Fuzzy Reinforcement Learning

1.
Department of Computer Science&Technology,State Key Laboratory of Intelltgent Technology&System,Tsinghua University,Beijing

More Information

Corresponding author: YAN Xiong-Wei

摘要: 针对连续空间的复杂学习任务,提出了一种竞争式Takagi-Sugeno模糊再励学习网络 (CTSFRLN),该网络结构集成了Takagi-Sugeno模糊推理系统和基于动作的评价值函数的再励学习方法.文中相应提出了两种学习算法,即竞争式Takagi-Sugeno模糊Q-学习算法和竞争式Takagi-Sugeno模糊优胜学习算法,其把CTSFRLN训练成为一种所谓的Takagi-Sugeno模糊变结构控制器.以二级倒立摆控制系统为例,仿真研究表明所提出的学习算法在性能上优于其它的再励学习算法.
- 再励学习 /
- 函数逼近 /
- T-S模糊推理系统
Abstract: This paper proposes a competitive Takagi-Sugeno fuzzy reinforcement learning network (CTSFRLN) for solving complicated learning tasks of continuous domains. The proposed CTSFRLN is constructed by combining Takagi-Sugeno type fuzzy inference systems with action-value-based reinforcement learning methods. Two competitive learning algorithms are derived, including the competitive Takagi-Sugeno fuzzy Q-learning and the competitive Takagi-Sugeno fuzzy advantage learning. These learning methods lead to so called Takagi-Sugeno fuzzy variable structure controllers. Simulation experiments on the double inverted pendulum system demonstrate the superiority of these learning methods.
- Reinforcement learning /
- function approximation /
- Takagi-Sugeno fuzzy inference systems

参考文献(0)

资源附件(0)

计量

文章访问数: 2188
HTML全文浏览量: 102
PDF下载量: 1083
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net