平均准则问题的即时差分学习算法

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

平均准则问题的即时差分学习算法

胡光华, 吴沧浦

文章导航 > 自动化学报 > 2000 > 26(4): 533-536

胡光华, 吴沧浦. 平均准则问题的即时差分学习算法. 自动化学报, 2000, 26(4): 533-536.

引用本文:

胡光华, 吴沧浦. 平均准则问题的即时差分学习算法. 自动化学报, 2000, 26(4): 533-536.

Hu Guanghua, Wu Cangpu. Temporal Difference Learning Algorithms for Average Reward Problem. ACTA AUTOMATICA SINICA, 2000, 26(4): 533-536.

Citation:

Hu Guanghua, Wu Cangpu. Temporal Difference Learning Algorithms for Average Reward Problem. ACTA AUTOMATICA SINICA, 2000, 26(4): 533-536.

胡光华, 吴沧浦. 平均准则问题的即时差分学习算法. 自动化学报, 2000, 26(4): 533-536.

引用本文:

胡光华, 吴沧浦. 平均准则问题的即时差分学习算法. 自动化学报, 2000, 26(4): 533-536.

Hu Guanghua, Wu Cangpu. Temporal Difference Learning Algorithms for Average Reward Problem. ACTA AUTOMATICA SINICA, 2000, 26(4): 533-536.

Citation:

Hu Guanghua, Wu Cangpu. Temporal Difference Learning Algorithms for Average Reward Problem. ACTA AUTOMATICA SINICA, 2000, 26(4): 533-536.

平均准则问题的即时差分学习算法

1.
北京理工大学自动控制系,北京

通讯作者:
吴沧浦

计量
- 文章访问数: 3196
- HTML全文浏览量: 185
- PDF下载量: 895
- 被引次数: 0
出版历程
- 收稿日期: 1998-06-23
- 刊出日期: 2000-04-20

Temporal Difference Learning Algorithms for Average Reward Problem

1.
Department of Automatic Control,Beijing Institute of Technology,Beijing

摘要: 考虑平均准则随机动态规划(SDP)问题的一族在线即时差分(TD)学习算法.在学习中,平均问题的相对值函数是控制器所要学习的目标函数.所提出的算法是已有的TD(λ) 算法及R-学习算法的一种推广.
- 即时差分学习 /
- 强化学习 /
- 动态规划 /
- Monte Carlo方法
Abstract: In this paper, some on-line TD (λ) learning algorithms for average reward stochastic dynamic programming problems are presented. During learning, the relative function is the object to be predicted by the agent. This work is an extension to and generalization of the work on previous TD (λ) methods and R-learning algorithms.
- Temporal-difference learning /
- reinforcement learning /
- dynamic programming /
- Monte Carlo method

参考文献(0)

资源附件(0)

计量

文章访问数: 3196
HTML全文浏览量: 185
PDF下载量: 895
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net