可控碼尔可夫鏈的一种最优决策

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

可控碼尔可夫鏈的一种最优决策

文章导航 > 自动化学报 > 1964 > 2(3): 146-154

刘永清. 李雅普諾夫函数的分解问題. 自动化学报, 1965, 3(3): 178-182.

引用本文:

吳滄浦. 可控碼尔可夫鏈的一种最优决策. 自动化学报, 1964, 2(3): 146-154.

LIU YUNG-CHING. DECOMPOSITION OF LIAPUNOV'S FUNCTION. ACTA AUTOMATICA SINICA, 1965, 3(3): 178-182.

Citation:

WU CHANG-PU. AN OPTIMAL POLICY FOR CONTROLLING THE CONTROLLABLE MARKOV CHAINS. ACTA AUTOMATICA SINICA, 1964, 2(3): 146-154.

刘永清. 李雅普諾夫函数的分解问題. 自动化学报, 1965, 3(3): 178-182.

引用本文:

吳滄浦. 可控碼尔可夫鏈的一种最优决策. 自动化学报, 1964, 2(3): 146-154.

LIU YUNG-CHING. DECOMPOSITION OF LIAPUNOV'S FUNCTION. ACTA AUTOMATICA SINICA, 1965, 3(3): 178-182.

Citation:

WU CHANG-PU. AN OPTIMAL POLICY FOR CONTROLLING THE CONTROLLABLE MARKOV CHAINS. ACTA AUTOMATICA SINICA, 1964, 2(3): 146-154.

可控碼尔可夫鏈的一种最优决策

吳滄浦

计量
- 文章访问数: 1958
- HTML全文浏览量: 76
- PDF下载量: 535
- 被引次数: 0
出版历程
- 刊出日期: 1964-07-20

AN OPTIMAL POLICY FOR CONTROLLING THE CONTROLLABLE MARKOV CHAINS

WU CHANG-PU

摘要: 本文研究了一种最优马尔可夫控制系统,这种控制系统以统计规律依赖于决定序列的马尔可夫链描述.我们称决定序列为决策.存在一具有下述性质的目标状态,一日系统到达此状态,状态就不再改变.我们的目的是要选取一决策,使所有从每一初始状态出发最终到达此目标状态的概率都达到最大.我们先提出在平稳决策集合中求最优决策的决策迭代法.然后证明,此决策在包含平稳及不平稳决策的决策集合上也是最优的.

Abstract: This paper is concerned with one type of the optimal Markov controlled systems. The controlled system is described by a Markov chain whose statistical property depends on the sequence of decisions that we call a policy. There exists an objective state with the property that once the system reaches this state, it remains unchanged forever. Our purpose is to choose a policy which maximizes all the probabilities that the system ever reaches this objective state from every initial state. First we give a policy-iteration method for obtaining an optimal policy over the set of stable policies. We then prove such a policy is also optimal over the set containing both stable and unstable policies.

参考文献(0)

资源附件(0)

计量

文章访问数: 1958
HTML全文浏览量: 76
PDF下载量: 535
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net