Optimal Tracking Control for Slag Grinding Process Based on Adaptive Dynamic Programming
-
摘要: 矿渣微粉是一种新型绿色环保型建材,可以大大提高水泥混凝土的力学性能.本文以矿渣微粉生产过程为研究对象,针对该过程难以通过机理建模进行辨识和控制的特点,利用数据驱动的思想,建立矿渣微粉生产过程的递归神经网络模型.在此基础上,利用自适应动态规划,设计具有控制约束的跟踪控制器,并将其应用到矿渣微粉生产过程中.仿真分析表明,建立的数据驱动模型能够有效地辨识矿渣微粉生产过程,同时,本文提出的控制方法能够实现输入受限的微粉比表面积及磨内压差的最优跟踪控制.Abstract: Super fine slag powder is a new kind of green environmental-friendly construction material, which can greatly improve the mechanical properties of cement concrete. However, the slag powder grinding process is hard to identify by a mechanism model. In this paper, a data-driven based recurrent neural network model is constructed utilizing the information measured from slag grinding system. Based on this model, an adaptive dynamic programming algorithm is proposed to realize the optimal tracking control with constrained control input. Further, this algorithm is applied to the slag grinding process. Simulation examples show that the data-based model can effectively identify the grinding process, and the control method can realize the optimal tracking control of specific surface area and mill differential pressure with control constraints.
-
混响环境下的声源定位技术在很多领域有着广泛并且极其重要的应用, 例如, 在室内服务机器人或者视频会议系统中, 语音识别、语音增强和助听器装置等方面的应用.
在各种复杂环境下, 人耳都能精确地进行声源定位.这一事实表明可以通过模仿人耳听觉系统的机制, 实现有效的人工双耳声源定位[1-2].基于生理科学以及物理科学的研究都表明, 听觉定位中的全部线索形成于声波从声源到鼓膜之间的传递过程之中[3].主要的定位线索是声波到达双耳时的时间差(Interaural time difference, ITD)、强度差(Interaural level difference, ILD)以及声波中包含的频率成分[4-5], 这些要素可以统一用头部相关传递函数(Headrelated transfer function, HRTF)来描述.定位所包含的信息形成是在耳膜以前完成的, 因而HRTF包含了所有物理上的定位信息[6].头部脉冲响应(Headrelated impulse response, HRIR)是HRTF的时域表示.混响环境下, 双耳房间脉冲响应(Binaural room impulse response, BRIR)是通过HRIR与房间脉冲响应(Room impulse response, RIR)卷积获取, 表示从声源到左右耳接收信号的脉冲响应.目前有很多定位算法都是通过最大化双耳互相关值[7], 或者是ITD/ILD估计来确定声源的位置[8-9].虽然这些方法在无干扰环境下有很好的定位效果, 但是在混响环境下的定位性能急剧下降[10-12].Stèphenne等[13]提出在提取ITD前采用倒谱预滤波方法, 有效地减少了混响对声源定位的影响.该算法对接收信号进行最小相位分解消去混响分量[14], 提高了双耳声源定位方法对混响的鲁棒性.Mosayyebpour等[15]在Stèphenne的基础上改进了广义互相关算法提取ITD.然而, 接收信号的倒谱参数主要体现语音的基音和共振峰特性, 大多用于语音识别中, 并不能反映HRTF方位信息的特征[16], 而且在倒谱域中会丢失相位信息, 以致丢失ITD的信息, 造成声源定位误差.
本文提出了一种基于倒谱BRIR的双耳互相关声源定位算法.仿真实验证明, 该算法在混响环境下具有更好的定位效果.
1. 系统模型
在混响环境下, 左右耳接收到的信号在离散时间域表示为
${{x}_{l}}\left( n \right)=s\left( n \right)*{{h}_{l}}\left( n \right)+{{n}_{l}}\left( n \right)$
(1) ${{x}_{r}}\left( n \right)=s\left( n \right)*{{h}_{r}}\left( n \right)+{{n}_{r}}\left( n \right)$
(2) 式中, ${h_i}\left( n \right)$为双耳房间脉冲响应, 包含了所有的混响成分, $s\left( n \right)$表示声源信号, ${n_i}\left(n \right)$表示加性噪声, 通常为一个与源信号不相关的、零均值的平稳高斯随机噪声.
2. 倒谱预处理
离散信号$x\left( n \right)$的倒谱形式表示为
$\hat{x}\left( k \right)={{F}^{-1}}\left\{ \log X\left( W \right) \right\}$
(3) 式中, $X\left( W \right)$为$x\left( n \right)$的傅里叶变换, ${F^{ -1}}\left\{ \cdot\right\}$为反傅里叶变换, $\log$是对数运算, $k$是倒谱域变量.在时域中, 信号的卷积在倒谱域相当于信号相加.
${{\hat{x}}_{i}}\left( k \right)={{\hat{h}}_{i}}\left( k \right)+{{\hat{n}}_{i}}\left( k \right)+\hat{s}\left( k \right)$
(4) 式中, ${\widehat h_i}\left( k \right)$和$\widehat s\left( k\right)$分别是脉冲响应和声源信号的倒谱. ${\widehat n_i}\left( k\right)$是加性噪声的倒谱, 可表示为
\begin{align} {\widehat n_i}\left( k \right) = {F^{ - 1}}\left\{ {\log \left\{ {1 + \frac{{{N_i}\left( W \right)}}{{{H_i}\left( W \right)S\left( W \right)}}} \right\}} \right\} \end{align}
(5) 式中, ${N_i}(W)$, ${H_i}(W)$和$S(W)$分别为${n_i}(n)$, ${h_i}(n)$和$s(n)$的傅里叶变换.为后文分析方便, 假设背景噪声足够低, 忽略噪声的影响.但在评价定位性能时包括噪声的影响.
在倒谱域中, 脉冲响应${\widehat h_i}\left( k\right)$可由一个最小相位分量(Minimum-phase component, MPC)${\widehat h}_{i,mpc}\left( k \right)$和一个全通分量${{\hat{h}}_{i,apc}}\left( k \right)$级联组成.式(4)可以表示为
\begin{align} {\widehat x_i}\left( k \right) = {\widehat h}_{i,mpc}\left( k \right) + {\widehat h}_{i,apc}\left( k \right) + {\widehat n_i}\left( k \right)+ \widehat s\left( k \right) \end{align}
(6) 倒谱滤波是在每一帧的基础上进行的, 假设声源信号的倒谱MPC是在帧与帧之间变化的, 而且均值为零.信道倒谱MPC是缓慢变化的, 可以通过时间平均获取.
3. 基于倒谱BRIR的互相关法
为了避免倒谱法的不足以及接收信号倒谱对定位的作用, 并且充分体现HRTF中的定位信息, 本文在文献[13]中Stèphenne算法的基础上提出基于倒谱BRIR的双耳互相关声源定位算法.
3.1 倒谱BRIR互相关法
基于倒谱BRIR的双耳互相关声源定位的基本步骤为:
步骤1.在接收信号${x_l}\left( n \right)$和${x_r}\left(n \right)$的每一帧上加上指数窗$\omega \left( n \right) = {\alpha^n}$, $0 \le n \le K - 1$, 其中$K$是窗长, $0 < \alpha \le 1$;
步骤2.对各信号进行倒谱处理, 并计算倒谱域接收信号和BRIR的最小相位分量
\begin{align} {\widehat h}_{i,mpc}\left( k \right) = \begin{cases} 0,&k < 0\\ {{\widehat h}_i}\left( 0 \right),&k = 0\\ {{\widehat h}_i}\left( k \right) + {{\widehat h}_i}\left({- k} \right),&k > 0 \end{cases} \end{align}
(7) 步骤3.通过连续信号帧递归获得估计的混响分量, 即${\overline h _{i,mpc}}\left({k;m} \right)$
\begin{align} {\overline h _{i,mpc}}\left( {k;m} \right) = \begin{cases} {{\widehat x}_{i,mpc}}\left( {k;m} \right),\qquad\qquad~~~m = 1\\ \left( {1 - \mu } \right){\widehat h}_{i,mpc}\left( k;m - 1 \right)+\\ \qquad \mu {{\widehat x}_{i,mpc}}\left( k;m \right),\quad~~~~~m >1 \end{cases} \end{align}
(8) 其中, $0 < \mu < 1$, $m$表示帧数.
步骤4.从倒谱BRIR中减去混响分量, 得到去混后的倒谱BRIR, 即${\widetilde {{h}}_i}\left( {k;m} \right)$
\begin{align} {\widetilde {{h}}_i}\left( {k;m} \right) = {\widehat h_i}\left( {k;m} \right) - {\overline h _{i,mpc}}\left( {k;m} \right) \end{align}
(9) 步骤5.将${\widetilde {{h}}_i}\left( {k;m}\right)$变换到时域${h_{ei}}\left( n \right)$, 并与已知数据库中HRIR${h_i}\left( n \right)$进行互相关运算;
步骤6.设置适当的互相关阈值, 其中最大互相关值相对应的方位角即为所求.
3.2 倒谱BRIR互相关方位角估计
为了得到有效的倒谱预处理效果, 在倒谱预处理前, 为将$X\left( W\right)$的零极点移动到单位圆内, 在每一帧上加上一个指数窗函数.指数窗的目的是尽可能地集中最小相位分量, 以便尽可能多地减去混响分量, 减少混响对声源定位的影响.针对Stèphenne算法中接收信号的倒谱参数并不能反映HRTF方位信息的特征的问题, 在基于倒谱BRIR的互相关定位算法中得到${\widetilde {h}_i}\left( {k;m}\right)$后, 反变换到时域${h_{ei}}\left( n \right)$, 与数据库中选择的HRIR ${h_i}\left( {n,\theta }\right)$进行互相关运算.
$P\left( \theta \right)={{h}_{ei}}\left( n \right)\oplus {{h}_{i}}\left( n,\theta \right)$
(10) $\begin{align} & {{h}_{ei}}\left( n \right)=[{{h}_{el}}\left( {{n}_{a}} \right),\cdots ,{{h}_{el}}\left( {{n}_{b}} \right),\\ & {{h}_{er}}\left( {{n}_{a}} \right),\cdots ,{{h}_{er}}\left( {{n}_{b}} \right)] \\ \end{align}$
(11) $\begin{align} & {{h}_{i}}\left( n,\theta \right)=[{{h}_{l}}\left( {{n}_{a}},\theta \right),\cdots ,{{h}_{l}}\left( {{n}_{b}},\theta \right),\\ & {{h}_{r}}\left( {{n}_{a}},\theta \right),\cdots ,{{h}_{r}}\left( {{n}_{b}},\theta \right)] \\ \end{align}$
(12) 其中, $n \in \left\{ {{n_a},\cdots,{n_b}} \right\}$, $ \oplus $为互相关运算符号, 因此声源方位角为
$\hat{\theta }=\arg \underset{\theta }{\mathop{\max }} \left\{ P\left( \theta \right)\ge \gamma \right\}$
(13) $\gamma =\max \left\{ 0.95\cdot \max \left\{ P\left( \theta \right) \right\},0.5 \right\}$
(14) 考虑到噪声的影响, 选择阈值来确定频谱的峰值及相关声源位置.
4. 仿真实验及分析
本研究描述的系统直接引用CIPIC数据库中subject003仰角为0时的各个方位角的HRTF数据库, 其中采样率为44.1 kHz.使用PASCAL CHiMESpeech Separation and Recognition Challenge的语音信号建立语音库, 采样率为16 kHz, 16 bit的信号.双耳信号则为源信号与RIR和HRIR相卷积所得.
经验值数据如下: $\mu=0.08$, $\alpha$的取值取决于窗长$K$的值, $K=1 024$, 同时相对应的经验值$\alpha=0.994$.本实验分别在混响时间RT为0 s, 0.30 s, 0.50 s, 0.70 s, 0.90 s的混响环境下, 同时在信噪比(Signal noise ratio, SNR)为20 dB的环境下进行仿真实验.图 1~5是在不同混响时间下, 三种声源定位算法在方位角${15^\circ}$时的定位效果比较.其中, 图(a)表示的是文献[13]倒谱滤波后基于互相关时延估计定位法(CEP-CC-ITD), 图(b)表示的是文献15]倒谱滤波后基于广义互相关时延估计定位法(CEP-GCC-ITD), 图(c)表示基于倒谱BRIR的双耳互相关声源定位法(CEP-BRIR-CC).横坐标表示方位角, 纵坐标表示时间, 灰度深浅表示归一化互相关值的大小.${0^\circ}$表示声源在正前方, 正角度表示声源在右边, 负角度表示声源在左边.
从图 1~5可以看出, 在不同混响时间下, CEP-BRIR-CC声源定位法较CEP-CC-ITD和CEP-GCC-ITD声源定位法的图像能更突出地显示出方位角的位置.此外, 随着混响时间的增大, 图像显示越来越模糊, 定位精度有所降低, 但CEP-BRIR-CC声源定位法的图像依然比较稳定, 具有一定的鲁棒性.这是由于CEP-BRIR-CC声源定位法的互相关运算是比较两个脉冲响应的相似性, 克服了倒谱法中丢失ITD的缺点, 稳定性比较好, 而且避开了接收信号倒谱对定位的作用, 充分利用HRTF中的定位信息, 提高了在混响环境中的定位性能.
图 6所示为声源方位角${15^\circ }$时, 混响时间分别为0 s, 0.30 s, 0.50 s, 0.70 s, 0.90 s时, CEP-BRIR-CC、CEP-CC-ITD和CEP-GCC-ITD声源定位法的均方值误差图.从图 6可以看出, CEP-BRIR-CC声源定位法的均方值误差小于CEP-CC-ITD和CEP-GCC-ITD声源定位法的均方值误差, 表明CEP-BRIR-CC声源定位法估计的方位角与实际方位角的偏差更小, 具有更好的定位精度.
表 1是混响时间分别为0 s, 0.3 s, 0.5 s, 目标声源在方位角为${0^\circ }$, ${10^\circ }$, ${15^\circ}$, ${20^\circ }$, ${30^\circ }$和${35^\circ }$时, CEP-BRIR-CC、CEP-GCC-ITD和CEP-CC-ITD声源定位法的声源方位估计和绝对定位误差实验数据.由表 1中可知, CEP-BRIR-CC声源定位法在混响时间分别为0 s, 0.3 s, 0.5 s时的绝对定位误差平均值分别为0.165, 0.842, 1.17.CEP-GCC-ITD声源定位法在混响时间分别为0 s, 0.3 s, 0.5 s时的绝对定位误差平均值分别为0.553, 1.707, 2.728.CEP-CC-ITD声源定位法在混响时间分别为0 s, 0.3 s, 0.5 s时的绝对定位误差平均值分别为0.78, 1.94, 3.385.
从表 1可以看出, 在不同混响环境下, 两种方法的定位绝对误差随着混响时间的增大而增大; 在相同的混响环境下, CEP-BRIR-CC声源定位法定位误差相对较小.同时CEP-BRIR-CC声源定位法估计的声源方位角度的绝对误差都在${2^\circ}$范围以内.因为CEP-CC-ITD和CEP-GCC-ITD声源定位法都涉及到接收信号的倒谱和时延估计的互相关计算, 会对定位造成一定的影响.而CEP-BRIR-CC声源定位法很好地避免了这些问题, 具有更准确的定位精度和更好的鲁棒性.
表 1 在不同混响时间下三种定位方法的声源方位估计Table 1 Sound source azimuth estimation of three location methods in different reverberation time实际角度(°) 0 10 15 20 30 35 CEP-BRIR-CC
声源定位法RT=0s 估计角度(°) 0.08 10.24 15.06 20.23 30.15 35.23 绝对误差(°) 0.08 0.24 0.06 0.23 0.15 0.23 RT=0.3s 估计角度(°) 0.17 9.03 14.82 21.09 30.25 36.39 绝对误差(°) 0.17 0.97 1.18 1.09 0.25 1.39 RT=0.5s 估计角度(°) -0.29 8.79 13.67 18.69 30.69 36.87 绝对误差(°) 0.29 1.21 1.33 1.31 0.69 1.87 CEP-GCC-ITD
声源定位法RT=0s 估计角度(°) -0.08 10.67 15.92 20.86 30.42 35.37 绝对误差(°) 0.08 0.67 0.92 0.86 0.42 0.37 RT=0.3s 估计角度(°) 0.39 8.11 12.81 17.23 28.85 33.14 绝对误差(°) 0.39 1.89 2.19 2.77 1.14 1.86 RT=0.5s 估计角度(°) -1.69 7.06 11.91 16.14 28.15 32.06 绝对误差(°) 1.69 2.94 3.09 3.86 1.85 2.94 CEP-CC-ITD
声源定位法RT=0s 估计角度(°) 0.07 10.73 15.95 21.46 30.85 35.62 绝对误差(°) 0.07 0.73 0.95 1.46 0.85 0.62 RT=0.3 s 估计角度(°) 0.63 8.68 12.78 23.06 27.62 32.97 绝对误差(°) 0.63 1.32 2.22 3.06 2.38 2.03 RT=0.5s 估计角度(°) -2.06 6.12 11.66 15.89 26.85 38.77 绝对误差(°) 2.06 3.88 3.34 4.11 3.15 3.77 5. 真实场景实验分析
为验证算法的实际性能, 用两个麦克风连接同一计算机采集语音进行场景测试. 图 7为实验环境示意图.实验房间大小为2.2 m $\times$ 2.2 m $\times$ 3 m, 两个麦克风位置分别为$(0.8,0.5,1.3)$和$(1.04,0.5,1.3)$, 声源位置距离两麦克风连线中点1 m, 测试角度为$- {75^\circ}$~${75^\circ }$, 测试间隔为${15^\circ }$, 声源与麦克风在同一水平面上并且位于麦克风前方, 此房间的混响时间大约0.3 s.使用Adobe Audition进行语音采集, 信号采样率为16 kHz/s.
实验中对三种方法分别进行了多次测试, 统计的平均结果如表 2所示.从表 2可以看出, CEP-BRIR-CC、CEP-GCC-ITD和CEP-CC-ITD声源定位法在实际场景中的平均定位误差分别为${4.38^\circ}$, ${7.42^\circ }$和${8.72^\circ }$.CEP-BRIR-CC定位法的定位误差相对较小, 能够进行更准确的定位, 这一结论与理论计算趋势是一致的.与仿真结果相比, 真实场景下各定位法的定位误差都相对较大, 这是由于测试并非是在纯净环境下进行的, 实际环境中的信噪比问题有可能对实验造成一定的影响.
表 2 三种定位方法的统计结果Table 2 The statistical results of three localization methods角度
方法—60° —15° 0° 30° 45° 估计值 误差 估计值 误差 估计值 误差 估计值 误差 估计值 误差 CEP-BRIR-CC —54.8° 5.2° —19.6° 4.6° —3° 3° 35.2° 5.2° 41.1° 3.9° CEP-GCC-ITD —67.6° 7.6° —22.3° 7.3° 7.5° 7.5° 36.9° 6.9° 52.8° 7.8° CEP-CC-ITD —50.9° 9.1° —23.5° 8.5° 8.8° 8.8° 22.0° 8.0° 54.2° 9.2° 6. 结语
本文研究了一种在混响环境中声源定位方法, 在仿真和真实场景中建立了一个完整的声源定位系统模型.与CEP-GCC-ITD和CEP-CC-ITD声源定位法相比, 本文的CEP-BRIR-CC声源定位法有较高的定位精度, 且鲁棒性较好.然而, 如何在强混响环境下精确定位仍然是个难点.本文提出的方法虽然在混响环境下有一定的定位效果, 但计算量比较大, 还有很多可以改进的地方.同时该模型在如何进行运动声源定位和多源定位以及三维定位方面仍需继续探索研究.
-
表 1 济钢鲁新建材3号矿渣微粉生产线生产运行数据
Table 1 Production data of Luxin mill line 3
编号 水渣进料
(103 kg/Hr)电机转速
(r/min)进口风温
(℃)入磨循环风阀开度
(%)比表面积
(cm2/g)磨内压差
(mbar)1 85.60 1 250 230 65.13 438.5 27.60 2 84.81 1 160 229 69.50 426.3 28.13 3 84.77 1 240 235 66.17 430.7 26.97 ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ ⋮ 323 99.63 1 049 242 60.59 438.5 24.65 324 100.42 1 050 243 60.53 426.3 24.94 325 101.20 1 051 248 60.62 433.9 25.00 表 2 各控制变量容许变化范围
Table 2 Tolerance range of different variables
水渣进料
(103 kg/Hr)电机转速
(r/min)进口风温
(℃)入磨循环风阀开度
(%)最大值 160 1 300 300 80 最小值 0 0 150 0 -
[1] Işikdağ, Topču Ī B. The effect of ground granulated blast-furnace slag on properties of Horasan mortar. Construction and Building Materials, 2013, 40:448-454 doi: 10.1016/j.conbuildmat.2012.11.016 [2] Zhang Y J, Zhang X. Grey correlation analysis between strength of slag cement and particle fractions of slag powder. Cement and Concrete Composites, 2007, 29(6):498-504 doi: 10.1016/j.cemconcomp.2007.02.004 [3] 陈远.大型立磨选粉机研究[硕士学位论文], 重庆大学, 中国, 2008. http://cdmd.cnki.com.cn/article/cdmd-10611-2009050041.htmChen Yuan. Study on Separator of Large-scale Vertical Mill[Master dissertation], Chongqing University, China, 2008. http://cdmd.cnki.com.cn/article/cdmd-10611-2009050041.htm [4] Xu J X, Hou Z S. Notes on data-driven system approaches. Acta Automatica Sinica, 2009, 35(6):668-675 https://www.researchgate.net/profile/Zhong_Sheng_Hou/publication/245568563_Notes_on_Data-driven_System_Approaches/links/56cc290908aee3cee5433e86.pdf?inViewer=0&pdfJsDownload=0&origin=publication_detail [5] 侯忠生, 许建新.数据驱动控制理论及方法的回顾和展望.自动化学报, 2009, 35(6):650-667 doi: 10.3724/SP.J.1004.2009.00650Hou Zhong-Sheng, Xu Jian-Xin. On data-driven control theory:the state of the art and perspective. Acta Automatica Sinica, 2009, 35(6):650-667 doi: 10.3724/SP.J.1004.2009.00650 [6] 代伟, 柴天佑.数据驱动的复杂磨矿过程运行优化控制方法.自动化学报, 2014, 40(9):2005-2014 http://www.aas.net.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=18472Dai Wei, Chai Tian-You. Data-driven optimal operational control of complex grinding processes. Acta Automatica Sinica, 2014, 40(9):2005-2014 http://www.aas.net.cn/CN/article/downloadArticleFile.do?attachType=PDF&id=18472 [7] 颜文俊, 秦伟.水泥立磨流程的建模和控制优化.控制工程, 2012, 19(6):929-943 http://www.cnki.com.cn/Article/CJFDTOTAL-JZDF201206001.htmYan Wen-Jun, Qin Wei. Modeling and control optimization in cement vertical roller mill process. Control Engineering of China, 2012, 19(6):929-943 http://www.cnki.com.cn/Article/CJFDTOTAL-JZDF201206001.htm [8] Cai X Y, Meng Q J, Luan W L. Soft sensor of vertical mill material layer based on LS-SVM. In:Proceedings of the 2013 International Conference on Measurement, Information, and Control (ICMIC). Harbin, China:IEEE, 2013. 22-25 [9] Lin X F, Qian Z. Modeling of vertical mill raw meal grinding process and optimal setting of operating parameters based on wavelet neural network. In:Proceedings of the 2014 International Joint Conference on Neural Networks (IJCNN). Beijing, China:IEEE, 2014. 3015-3020 [10] Umucu Y, Çağlar M F, Gündüz L, Bozkurt V, Deniz V. Modeling of grinding process by artificial neural network for calcite mineral. In:Proceedings of the 2011 International Symposium on Innovations in Intelligent Systems and Applications (INISTA). Istanbul, Turkey:IEEE, 2011. 344-348 [11] 张化光, 张欣, 罗艳红, 杨王君}.自适应动态规划综述.自动化学报, 2013, 39(4):303-311 doi: 10.1016/S1874-1029(13)60031-2Zhang Hua-Guang, Zhang Xin, Luo Yan-Hong, Yang Jun. An overview of research on adaptive dynamic programming. Acta Automatica Sinica, 2013, 39(4):303-311 doi: 10.1016/S1874-1029(13)60031-2 [12] Xu X, Zuo L, Huang Z H. Reinforcement learning algorithms with function approximation:recent advances and applications. Information Sciences, 2014, 261:1-31 doi: 10.1016/j.ins.2013.08.037 [13] Murray J J, Cox C J, Lendaris G G, Saeks R. Adaptive dynamic programming. IEEE Transactions on Systems, Man, and Cybernetics, Part C:Applications and Reviews, 2002, 32(2):140-153 doi: 10.1109/TSMCC.2002.801727 [14] Wei Q L, Liu D R, Yang X. Infinite horizon self-learning optimal control of nonaffine discrete-time nonlinear systems. IEEE Transactions on Neural Networks and Learning Systems, 2015, 26(4):866-879 doi: 10.1109/TNNLS.2015.2401334 [15] Liu D R, Wei Q L. Policy iteration adaptive dynamic programming algorithm for discrete-time nonlinear systems. IEEE Transactions on Neural Networks and Learning Systems, 2014, 25(3):621-634 doi: 10.1109/TNNLS.2013.2281663 [16] Zhang H, Cui L, Zhang X, Luo Y H. Data-driven robust approximate optimal tracking control for unknown general nonlinear systems using adaptive dynamic programming method. IEEE Transactions on Neural Networks, 2011, 22(12):2226-2236 doi: 10.1109/TNN.2011.2168538 [17] Modares H, Lewis F L, Naghibi-Sistani M B. Integral reinforcement learning and experience replay for adaptive optimal control of partially-unknown constrained-input continuous-time systems. Automatica, 2014, 50(1):193-202 doi: 10.1016/j.automatica.2013.09.043 [18] Wei Q, Liu D. A novel iterative θ-adaptive dynamic programming for discrete-time nonlinear systems. IEEE Transactions on Automation Science and Engineering, 2014, 11(4):1176-1190 doi: 10.1109/TASE.2013.2280974 [19] Qin C B, Zhang H G, Luo Y H. Adaptive optimal control for nonlinear discrete-time systems. In:Proceedings of the 2013 IEEE Symposium on Adaptive Dynamic Programming and Reinforcement Learning. Singapore:IEEE, 2013. 13-18 期刊类型引用(9)
1. 孙胜难,袁铸钢,刘钊,马洪浩. 基于随机森林回归算法的水泥立式磨磨内压差预测. 洛阳理工学院学报(自然科学版). 2024(02): 44-50 . 百度学术
2. 富月,陈威. 具有解耦性能的离散时间线性多变量系统最优跟踪控制. 自动化学报. 2022(08): 1931-1939 . 本站查看
3. 李晓理,高杰,王康. 微粉生产过程中磨机进出口温度多目标优化. 控制理论与应用. 2020(02): 275-282 . 百度学术
4. 李客,万安平. 矿渣粉磨生产工艺智能调控系统研究与应用. 科学技术与工程. 2020(11): 4279-4287 . 百度学术
5. 赵颖,付俊,赵军. 切换系统的无扰切换控制及其在航空发动机中的应用. 自动化学报. 2020(10): 2165-2176 . 本站查看
6. 李晓理,王康,于秀明,苏伟. 基于CPS框架的微粉生产过程多模型自适应控制. 自动化学报. 2019(07): 1354-1365 . 本站查看
7. 李晓理,王子洋,王康. 矿渣微粉生产过程全流程优化. 大连理工大学学报. 2017(05): 517-523 . 百度学术
8. 陈龙,刘全利,王霖青,赵珺,王伟. 基于数据的流程工业生产过程指标预测方法综述. 自动化学报. 2017(06): 944-954 . 本站查看
9. 代风,纪杨建,万安平,张真. 矿渣粉磨健康状态识别模型及系统设计. 振动.测试与诊断. 2018(04): 827-833+878 . 百度学术
其他类型引用(27)
-