-
摘要: 对于具有未知参数的LQG(Linear quadratic Gaussian)问题,提出了一种次优对偶控制方法,用Kalman滤波处理过程噪声和测量噪声,用前一时刻的后验概率对Cost-to-go进行线性近似,然后,用动态规划获得了次优控制律.最后,用一个例子说明了本文设计的控制器的实施过程.结果表明,该控制律具有良好的对偶性质,并能在学习和控制之间实现较好平衡.
-
关键词:
- LQG (Linear quadratic Gaussian) /
- 动态规划 /
- 对偶控制 /
- 最优控制
Abstract: For the LQG problem with unknown parameters, a novel suboptimal dual control approach is proposed in this paper. First, Kalman filter is used to deal with the noises of process and measurement and posterior probabilities at the previous moment are used to linearly approximate the cost-to-go at the present moment. Then dynamic programming is adopted to obtain a suboptimal control law. Finally, an example is presented to illustrate the implementation process of the developed controller. The result shows that this control law has good dual property and achieves a better balance between learning and control.-
Key words:
- LQG (Linear quadratic Gaussian) /
- dynamic programming /
- dual control /
- optimal control
-
-
表 1 不同不确定参数下Monte Carlo仿真性能指标比较
Table 1 Performance index of Monte Carlo runs comparison for different uncertainty parameters
最优控制 非对偶控制1 非对偶控制2 对偶控制 30.1702 5.1102×105 379.9141 38.6375 表 2 两个控制律性能比较
Table 2 Performance comparison for two control laws in example
控制律 DUL控制 对偶控制 统计平均值 56.4350 39.2685 最大值 148.6953 126.3292 标准差 27.9879 21.2748 -
[1] Asami T, Nishihara O. H2 optimization of the three-element type dynamic vibration absorbers. Journal of Vibration and Acoustics, 2002, 124 (5):583-592 http://ci.nii.ac.jp/naid/110002378313 [2] Feldbaum A A. Optimal Control Systems. New York:Academic, 1965. 13-16 [3] Feldbaum A A. Dual control theory Ⅰ-Ⅱ. Automatic Remote Control, 1960, 21 (4):1033-1039 [4] Filatov N M, Unbehauen H. Adaptive Dual Control Theory and Applications. Heidelberg:Springer Verlag, 2004. 75-86 [5] Chen J, Patton R J[著], 吴建军[译]. 动态系统基于模型的鲁棒故障诊断. 北京: 国防工业出版社, 2009. 81-94Chen J, Patton R J[Author], Wu Jian-jun[Translator]. Robust Model-Based Fault Diagnosis for Dynamic Systems. Beijing:National Defence Industry Press, 2009. 81-94 [6] 张丹. 高速列车动力学模型的参数辨识和状态估计[硕士学位论文], 西安理工大学, 中国, 2016. http://d.g.wanfangdata.com.cn/Thesis_D01041199.aspxZhang Dan. Parameter Identification of Dynamic Model of High Speed Train[Master dissertation], Xi'an University of Technology, China, 2016. http://d.g.wanfangdata.com.cn/Thesis_D01041199.aspx [7] 李维伟. 基于钢丝绳弹簧的车载担架——卧姿人体系统隔振设计研究[硕士学位论文], 天津大学, 中国, 2013. http://cdmd.cnki.com.cn/Article/CDMD-10056-1015017518.htmLi Wei-Wei. Vibration Isolation Design of Vehicle Stretcher-supine Body System Based on Wire-rope Spring[Master dissertation], Tianjin University, China, 2013. http://cdmd.cnki.com.cn/Article/CDMD-10056-1015017518.htm [8] Alster J, Bélanger P R. A technique for dual adaptive control. Automatica, 1974, 10 (6):627-634 doi: 10.1016/0005-1098(74)90083-1 [9] Bar-Shalom Y, Wall K D. Dual adaptive control and uncertainty effects in macroeconomic systems optimization. Automatica, 1990, 16 (2):147-156 http://www.sciencedirect.com/science/article/pii/0005109880900503 [10] Milito R, Padilla C, Padilla R, Cadorin D. An innovations approach to dual control. IEEE Transactions on Automatic Control, 1982, 27 (1):132-137 doi: 10.1109/TAC.1982.1102863 [11] Deshpande J G, Upadhyay T N, Lainiotis D G. Adaptive control of linear stochastic systems. Automatica, 1973, 9 (1):107-115 doi: 10.1016/0005-1098(73)90017-4 [12] Fu P L, Li D, Qian F C. Active dual control for Linear-Quardratic Gaussian system with unknown parameters. In:Proceedings of the 15th IFAC World Congress. Barcelona, Spain:Pergamon, 2002. 337-342 [13] Li D, Qian F C, Fu P L. Research on dual control. Acta Automatica Sinica, 2005, 31 (1):32-42 http://kns.cnki.net/KCMS/detail/detail.aspx?filename=moto200501005&dbname=CJFD&dbcode=CJFQ [14] Li D, Qian F C, Fu P L. Variance minimization in stochastic systems. Stochastic Modeling and Optimization. New York:Springer-Verlag, 2003. 2010-2020 [15] Li D, Qian F C, Fu P L. Variance minimization approach for a class of dual control problems. IEEE Transactions on Automatic Control, 2002, 47 (12):2010-2020 doi: 10.1109/TAC.2002.805683 [16] Li D, Qian F C, Fu P L. Optimal nominal dual control for discrete-time linear-quadratic Gaussian problems with unknown parameters. Automatica, 2008, 44 (1):119-127 doi: 10.1016/j.automatica.2007.04.014 [17] 钱富才, 朱少平, 刘丁.噪声未知的LQG控制问题研究.控制理论与应用, 2010, 27 (8):1017-1022 http://www.cnki.com.cn/Article/CJFDTOTAL-KZLY201008010.htmQian Fu-Cai, Zhu Shao-Ping, Liu Ding. On LQG problems with unknown noises. Control Theory & Applications, 2010, 27 (8):1017-1022 http://www.cnki.com.cn/Article/CJFDTOTAL-KZLY201008010.htm [18] 陈小可. 具有不确定参数的LQG对偶控制问题研究[硕士学位论文], 西安理工大学, 中国, 2004. http://cdmd.cnki.com.cn/Article/CDMD-10700-2004043564.htmChen Xiao-Ke. Research on Dual Control in LQG with Uncertainty Parameters Problem[Master dissertation], Xi'an University of Technology, China, 2004. http://cdmd.cnki.com.cn/Article/CDMD-10700-2004043564.htm [19] 吴森堂.飞航导弹制导控制系统随机鲁棒分析与设计.北京:国防工业出版社, 2010.Wu Sen-Tang. Stochastic Robustness Analysis and Design for Guidance and Control System of Winged Missile. Beijing:National Defence Industry Press, 2010. [20] Qian F C, Gao J J, Li D. Complete statistical characterization of discrete-time LQG and cumulant control. IEEE Transactions on Automatic Control, 2012, 57 (8):2110-2115 doi: 10.1109/TAC.2011.2179844 期刊类型引用(20)
1. 巩彬,安爱民,石耀科,杜先君. 基于IMODA自适应深度信念网络的复杂模拟电路故障诊断方法. 电子科技大学学报. 2024(03): 327-344 . 百度学术
2. 金亮,闫银刚,杨庆新,刘素贞,张闯. 小样本条件下永磁同步电机深度迁移学习性能预测方法. 电工技术学报. 2023(18): 4921-4931 . 百度学术
3. 朱小勇,陈胜. 基于ResNet-ViT的海战多目标态势感知. 信息与控制. 2023(05): 638-647 . 百度学术
4. 吴智怀,王志伟. 基于SDAE的液压泵故障诊断方法研究. 冶金设备. 2023(05): 15-22 . 百度学术
5. 李锦键,王兴贵,杨维满,赵玲霞. 基于改进递归深度信念网络的CSP电站短期出力预测. 太阳能学报. 2022(07): 225-232 . 百度学术
6. 沈浩宇,江先志,冯涛. 二轮平衡车的神经元控制算法及仿真. 机床与液压. 2022(19): 159-166 . 百度学术
7. 王功明,乔俊飞,关丽娜,贾庆山. 深度信念网络研究现状与展望. 自动化学报. 2021(01): 35-49 . 本站查看
8. 石媛媛,裴志利,姜明洋. 基于深度信念网络的文本分类研究综述. 内蒙古民族大学学报(自然科学版). 2021(01): 44-50 . 百度学术
9. 李娜娜,胡坚剑,顾军华,张亚娟. 深度置信网络优化模型在人才评价中的应用. 计算机工程. 2020(02): 80-87+102 . 百度学术
10. 唐魏,郑源,潘虹,徐晶珺. 引入动态调节学习率的SAE轴承故障诊断研究. 计算机工程与应用. 2020(20): 264-269 . 百度学术
11. 李少波,李传江,胡建军,张安思,杨静. 基于深度置信网络的机械设备故障诊断研究综述. 现代制造工程. 2020(10): 156-162+142 . 百度学术
12. 史科,陆阳,刘广亮,毕翔,王辉. 基于多隐层Gibbs采样的深度信念网络训练方法. 自动化学报. 2019(05): 975-984 . 本站查看
13. 高磊,范冰冰,黄穗. 基于残差的改进卷积神经网络图像分类算法. 计算机系统应用. 2019(07): 139-144 . 百度学术
14. 张德,李国璋,王怀光,张峻宁. 位姿估计自适应学习率的改进. 电子测量与仪器学报. 2019(06): 51-58 . 百度学术
15. 邢海霞,程乐. 一种基于强化学习的深度信念网络设计方法. 控制工程. 2019(11): 2115-2120 . 百度学术
16. 索明何,程乐. 基于PLSR的深度信念网输出权值确定方法. 控制工程. 2018(04): 668-676 . 百度学术
17. 王功明,乔俊飞,王磊. 一种能量函数意义下的生成式对抗网络. 自动化学报. 2018(05): 793-803 . 本站查看
18. 牟善仲,徐天赐,符奥,王萌,白茹. 基于自适应深度学习模型的变压器故障诊断方法. 南方电网技术. 2018(10): 14-19 . 百度学术
19. 刘冰尧,庞腾,雷菊阳. 基于深度信念网络的变压器故障诊断. 化工自动化及仪表. 2018(11): 873-878 . 百度学术
20. 王献锋,张传雷,张善文,朱义海. 基于自适应判别深度置信网络的棉花病虫害预测. 农业工程学报. 2018(14): 157-164 . 百度学术
其他类型引用(31)
-