Q学习算法在库存控制中的应用

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

Q学习算法在库存控制中的应用

蒋国飞, 吴沧浦

文章导航 > 自动化学报 > 1999 > 25(2): 236-241

毛剑琴. 用奇异值分解实现捷联式矩阵最佳正归化的方法. 自动化学报, 1985, 11(增刊1): 17-24.

引用本文:

蒋国飞, 吴沧浦. Q学习算法在库存控制中的应用. 自动化学报, 1999, 25(2): 236-241.

Mao Jianqin. Optimal Orthonormalization of Strapdow Matrix by Singular Value Decomposion. ACTA AUTOMATICA SINICA, 1985, 11(增刊1): 17-24.

Citation:

JIANG Guofei, Wu Cangpu. Inventory Control Using Q-Learning. ACTA AUTOMATICA SINICA, 1999, 25(2): 236-241.

毛剑琴. 用奇异值分解实现捷联式矩阵最佳正归化的方法. 自动化学报, 1985, 11(增刊1): 17-24.

引用本文:

蒋国飞, 吴沧浦. Q学习算法在库存控制中的应用. 自动化学报, 1999, 25(2): 236-241.

Mao Jianqin. Optimal Orthonormalization of Strapdow Matrix by Singular Value Decomposion. ACTA AUTOMATICA SINICA, 1985, 11(增刊1): 17-24.

Citation:

JIANG Guofei, Wu Cangpu. Inventory Control Using Q-Learning. ACTA AUTOMATICA SINICA, 1999, 25(2): 236-241.

Q学习算法在库存控制中的应用

1.
北京理工大学自动控制系,北京

计量
- 文章访问数: 3074
- HTML全文浏览量: 138
- PDF下载量: 1500
- 被引次数: 0
出版历程
- 收稿日期: 1997-04-14
- 刊出日期: 1999-02-20

Inventory Control Using Q-Learning

1.
Department of Automatic Control,Beijing Institute of Technology,Beijing

摘要: Q学习算法是Watkins提出的求解信息不完全马尔可夫决策问题的一种强化学习方法.这里提出了一种新的探索策略,并将该策略和Q学习算法有效结合来求解一类典型的有连续状态和决策空间的库存控制问题.仿真表明,该方法所求解的控制策略和用值迭代法在模型已知的情况下所求得的最优策略非常逼近,从而证实了Q学习算法在一些系统模型未知的工程控制问题中的应用潜力.
- Q学习 /
- 马尔可夫决策过程 /
- 库存控制 /
- 连续状态和决策空间 /
- 探索策略
Abstract: Q-learning is a reinforcement learning method to solve Markovian decision problems with incomplete information. In this paper, we present a novel exploration strategy and use Q-learning method with this strategy to solve a typical inventory control problem with continuous state and decision space. Simulation results are included to show that the optimal policy given by Q-learning can well approximate to the accurate one.
- Q-learning /
- markovian decision problem /
- inventory control /
- continuous state and decision space /
- exploration strategy

参考文献(0)

资源附件(0)

计量

文章访问数: 3074
HTML全文浏览量: 138
PDF下载量: 1500
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net