基于Q学习算法和BP神经网络的倒立摆控制

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于Q学习算法和BP神经网络的倒立摆控制

蒋国飞, 吴沧浦

文章导航 > 自动化学报 > 1998 > 24(5): 662-666

蒋国飞, 吴沧浦. 基于Q学习算法和BP神经网络的倒立摆控制. 自动化学报, 1998, 24(5): 662-666.

引用本文:

蒋国飞, 吴沧浦. 基于Q学习算法和BP神经网络的倒立摆控制. 自动化学报, 1998, 24(5): 662-666.

Jiang Guofei, Wu Cangpu. Learning to Control an Inverted Pendulum Using Q-Learning and Neural Networks. ACTA AUTOMATICA SINICA, 1998, 24(5): 662-666.

Citation:

Jiang Guofei, Wu Cangpu. Learning to Control an Inverted Pendulum Using Q-Learning and Neural Networks. ACTA AUTOMATICA SINICA, 1998, 24(5): 662-666.

蒋国飞, 吴沧浦. 基于Q学习算法和BP神经网络的倒立摆控制. 自动化学报, 1998, 24(5): 662-666.

引用本文:

蒋国飞, 吴沧浦. 基于Q学习算法和BP神经网络的倒立摆控制. 自动化学报, 1998, 24(5): 662-666.

Jiang Guofei, Wu Cangpu. Learning to Control an Inverted Pendulum Using Q-Learning and Neural Networks. ACTA AUTOMATICA SINICA, 1998, 24(5): 662-666.

Citation:

Jiang Guofei, Wu Cangpu. Learning to Control an Inverted Pendulum Using Q-Learning and Neural Networks. ACTA AUTOMATICA SINICA, 1998, 24(5): 662-666.

基于Q学习算法和BP神经网络的倒立摆控制

1.
北京理工大学自控制系,北京

计量
- 文章访问数: 3659
- HTML全文浏览量: 196
- PDF下载量: 1933
- 被引次数: 0
出版历程
- 收稿日期: 1997-01-22
- 刊出日期: 1998-05-20

Learning to Control an Inverted Pendulum Using Q-Learning and Neural Networks

1.
Department of Automatic Control,Beijing Institute of Technology,Beijing

摘要: Q学习是Watkins[1]提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.将Q学习算法和BP神经网络有效结合,实现了状态未离散化的倒立摆的无模型学习控制.仿真表明:该方法不仅能成功解决确定和随机倒立摆模型的平衡控制,而且和Anderson[2] 的AHC(Adaptive Heuristic Critic)等方法相比,具有更好的学习效果.
- Q学习 /
- BP网络 /
- 学习控制 /
- 倒立摆系统 /
- 高斯噪声
Abstract: Q-learning is a reinforcement learning method to solve Markovian decision problems with incomplete information. This paper presents a novel method to control an inverted pendulum with unquantized states by using Q-learning and neural networks. Simulation results are included to show that the new method can not only balance the determined or stochastic inverted pendulums successfully but also lead to a better effect of learning when compared with Anderson's AHC method.
- Q-Learning /
- BP neural network /
- learning control /
- inverted pendulum /
- Gaussian noise

参考文献(0)

资源附件(0)

计量

文章访问数: 3659
HTML全文浏览量: 196
PDF下载量: 1933
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net