-
摘要: 鉴于在控制实际中存在的不确定性问题, 提出了一种针对大滞后过程的不确定性抑制的新型高性能控制器(New higher performance controller, NHPC).基于在新型观测方法和新型控制方法包括新型滤波方法上的良好进展, 将一种新型超前观测器(New advanced observer, NAO)、一种内反馈控制器(Internal feedback controller, IFC)包括一种正弦跟踪滤波器(Sinusoid tracking filter, STF)等用于构造NHPC.将NHPC运用于大滞后过程控制, 能够对较宽的范围内的时变性和非线性等不确定性问题进行较好的抑制.数学分析、仿真实验和实际电力控制工程应用的结果验证了本文所提观点和方法的正确性和有效性.Abstract: As the uncertainty in automatic control, a new higher performance controller (NHPC) of uncertainty suppression for large-lag process is proposed. Based on good progress in new observation methods and new control methods as well as new filtering methods, a new advanced observer (NAO) and a internal feedback controller (IFC) as well as a sinusoidal tracking filter (STF), etc. are used to construct NHPC. NHPC which can effectively suppress the time variability and nonlinear uncertainty in a wider range is used to large-lag process control. The mathematical analysis, simulation experiments and actual power engineering application results verify the correctness and effectiveness of the proposed ideas and methods in this paper.
-
Key words:
- Process control /
- proportional-integral-derivative (PID) controller /
- sinusoid tracking filter (STF) /
- internal feedback controller (IFC) /
- new advanced observer (NAO) /
- new high performance controller (NHPC)
-
人体运动估计旨在通过分析和理解人体动作, 从输入传感器数据中提取出有关人体姿态、运动轨迹和动作意图等信息. 传统人体运动估计方法通常基于视觉传感器(如摄像头或深度相机)获取图像或点云数据来检测人体的姿态和运动. 然而, 该方法在遮挡、光照变化和复杂背景等情形下往往表现不佳, 这限制了其应用范围. 为了克服视觉传感器的应用局限性, 近年来, 基于表面肌电信号 (Surface electromyography, sEMG)、惯性等可穿戴式传感器的人体运动估计引起了广泛关注[1]. 特别地, 表面肌电信号是一种通过肌肉收缩状态反映肢体运动的电信号, 可用于识别手势、肢体运动和人类意图等[1]. 由于采集方式的无创性和便携性, sEMG被广泛应用于助力机器人、康复机器人、智能假肢[2-6], 以及人机协作等领域[7-10].
尽管现有sEMG采集技术已经比较成熟, 但由于sEMG自身非平稳、微弱等特性, 采集的信号中往往包含复杂噪声干扰[1, 6]. 为此, 不少研究人员开始融合惯性传感器信息, 来获取更多的姿态信息, 从而弥补sEMG感知的不足[1, 11-14]. 例如, Stival等集成sEMG和惯性测量单元(Inertial measurement unit, IMU)信息, 来提高人体运动估计的性能[15]. Sakamoto等构建了长短期记忆(Long short-term memory, LSTM)网络以sEMG和IMU信息作为输入, 来实现下肢力和力矩的估计[16]. Hollinger等将多个sEMG和IMU的特征作为网络输入, 利用Bi-LSTM网络实现了超前100 ms的关节角度预测[17]. 上述方法大多以深度学习为主, 通过挖掘各传感器数据的高维特征, 对高维特征向量进行拼接来实现人体运动的融合估计. 尽管这类方法有助于提高人体运动估计的性能, 但由于深度学习网络存在可解释性欠缺的问题, 这限制了网络模型估计性能的进一步提升[1, 12, 18].
卡尔曼滤波(Kalman filtering, KF)是一种能够有效地降低由传感器噪声以及其他外部因素引起的不确定性的滤波算法, 已被广泛用于多传感器信息融合领域. Han等利用Hill模型结合前向动力学构建了状态空间模型, 并利用无迹卡尔曼滤波(Unscented Kalman filtering, UKF)实现了基于sEMG的肢体运动估计[19]. 然而, Hill模型是一种生理现象学模型[1, 11], 其内部结构复杂, 需要专业的人体肌肉知识来进行人体运动模型的构建和分析, 存在较大的应用局限性[12-14]. 为了克服这些限制, 学者们尝试利用神经网络学习卡尔曼滤波参数和模型. Coskun等首先提出了LSTM-KF框架, 将三个LSTM模块集成到KF中, 来学习姿态估计任务中的观测模型和噪声模型[20]. Revach等提出了一种KalmanNet网络, 在传统KF的基础上, 利用深度神经网络(Deep neural networks, DNN)学习KF中的增益[21]. Bao等利用LSTM模块学习KF的所有参数, 实现了基于sEMG的腕部和指部关节角度估计[22]. 但这种LSTM-KF的结构较为简单, 线性量测框架对肌电和运动状态之间的非线性关系描述并不充分. 在LSTM-KF的基础上, 文献[23]提出了一种渐进无迹卡尔曼滤波网络(Progressive unscented Kalman filter network, PUKF-net), 设计了三个LSTM模块学习量测模型和噪声统计特性, 利用UT变换(Unscented transformation)和渐进量测来减小线性化误差, 实现了端到端的估计. 然而, 该方法在网络端到端的训练中, 缺乏多传感器互补性信息, 这限制了线性化误差的补偿性能以及估计效果的提升.
针对以上问题, 本文提出一种序贯渐进高斯滤波网络 (Sequential progressive Gaussian filtering network, SPGF-net)来融合多通道表面肌电和惯性信息, 以增强人体运动估计的性能. 首先, 利用卷积神经网络对观测数据进行特征提取, 挖掘深层次观测特征. 其次, 针对异构传感器融合问题, 采用了序贯融合的方式融合肌电和惯性量测特征. 特别地, 通过序贯渐进量测更新的方法对观测网络特征的不确定性进行补偿, 来提高人体上肢关节运动估计的精度和抗干扰能力.
1. 问题描述与建模
本文考虑了一类基于多通道表面肌电和惯性融合的人体运动估计问题. 如图1所示, 本文以人体上肢运动估计为例, 将八通道肌电传感器穿戴于大臂来检测上肢肌肉的状态, 同时将一个惯性传感器(由加速度计、陀螺仪和磁力计组成)固定在手腕处来估计小臂的运动状态. $ O_{w}\text{-}X_{w}Y_{w}Z_{w} $为全局坐标系({G}系), $ O_{Opti}\text{-}X_{Opti}Y_{Opti}Z_{Opti} $为光捕全局坐标系({O}系), $ O_{body}\text{-}X_{body}Y_{body}Z_{body} $为躯体坐标系({B}系), $ O_{wrist}\text{-}X_{wrist}Y_{wrist}Z_{wrist} $为手腕坐标系({W}系), $ O_{imu}\text{-}X_{imu}Y_{imu}Z_{imu} $为惯性传感器坐标系({S}系). 在运动过程中惯性传感器的坐标系会随手腕运动而变化, 而且肢体运动姿态与身体朝向密切相关, 为此, 需要建立坐标转换来描述肢体在躯体坐标系中的姿态. 为了便于坐标系转换, 简化实验, 在光捕系统进行标定时, 令光捕全局坐标系({O}系)与全局坐标系({G}系)指向相同, 即转换矩阵$ R^G_O $为单位阵. 同时, 令腕部坐标系与惯性坐标系重合, 即转换矩阵$ R^S_W $也为单位阵. 根据光捕系统中躯体的刚体坐标系可以求得{O}系与{B}系之间转换矩阵$ R^B_O $, 同时利用IMU静止时, 测到的重力加速度和磁感应强度两个矢量计算出{G}系与{S}系之间旋转矩阵$ R^G_S $, 那么, 通过惯性传感器相对于躯体的转换矩阵$ R^B_S=R^G_SR^O_GR^B_O $, 可以得到肢体在躯体坐标系中的姿态信息$ {{o}^{imu}_{k, B}}= R^B_SR^S_W $.
为了挖掘原始观测数据的深层次特征, 利用卷积神经网络(Convolutional neural networks, CNN)将原始观测数据$ {{o}_k} $提炼为观测特征$ {z_k} $, 并将$ {z_k} $作为观测信号建模如下:
$$ {z_k} = {g^\theta }({{o}_k}) $$ (1) 其中, $ {g^\theta }\left( \cdot \right) $为观测网络. 由于观测网络的引入以及多维观测的复杂性, 往往难以描述准确的观测模型. 在此, 利用LSTM网络去学习各量测和运动状态之间的关系, 并建立观测模型如下:
$$ z_k^{emg} = {\rm{LSTM}}_h^{emg}({x_k}) + v_k^{emg} $$ (2) $$ z_k^{imu} = {\rm{LSTM}}_h^{imu}({x_k}) + v_k^{imu} $$ (3) $ {\rm{LST}}{{\rm{M}}_h} $表示用于学习观测函数的网络模块, ${x_k} = [ {{{( {{\theta _k}} )}{}^{\rm{T}}}}\;\;{{{( {{{\dot \theta }_k}} )}{}^{\rm{T}}}} ]^{\rm{T}}$表示$ k $时刻上肢关节状态向量, $ {z_k^{emg}={g^\theta }({o^{emg}_k})} $表示$ k $时刻肌电特征向量, $ {o^{emg}_k} $为整流后的肌电幅值, $ {z_k^{imu}={g^\theta }({o^{imu}_{k, B}})} $表示$ k $时刻姿态特征向量, $ {o^{imu}_{k, B}} $为肢体相对于躯体的姿态角(roll、pitch、yaw), $ {v_k} $为$ k $时刻观测噪声. 同时, 对人体运动建模如下:
$$ {x_k} = f({x_{k - 1}, a_{k-1}}) + {w_k} $$ (4) 其中, $f( {x_{k}, a_{k}}) = \left[ {\begin{aligned} {{\theta _k} + {{\dot \theta }_k} \cdot {T_s}}\;\;\;\;\;\;\;\;\\ {{{\dot \theta }_k} + (\tfrac{{{a_k} + g\sin\theta }}{l}) \cdot {T_s}} \end{aligned}} \right]$为系统非线性状态方程, $ a_{k} $为惯性传感器测得的加速度, $ g $为重力加速度, $ l $ 为小臂长度, $ T_s $为采样时间, $ {w_k} $为$ k $时刻系统噪声, 且$ {w_k} $和$ v_k $为互不相关的零均值高斯白噪声.
虽然观测网络的引入能提取原始数据中深层次的特征, 但其依赖于训练数据, 而肌电和惯性传感器信号具有时变性[24-27], 在一定程度上增加了信息提取的难度. 为此, 设计了一种基于多通道表面肌电和惯性融合的高斯滤波网络, 利用序贯融合的方式实现互补性传感器观测融合, 同时, 采用渐进量测更新对量测特征的不确定性进行补偿.
2. 运动估计方法
如图2所示, 利用卷积神经网络分别提取肌电和惯性信号的量测特征$ z_k^{emg} $和$ z_k^{imu} $. 同时, 设计了${\rm{LSTM}} _{Q} $和${\rm{LSTM}} _R $模块来学习噪声统计特性$ {Q_{k}} $和$ {R_{k}} $. 其次, 利用UT变换将用于学习量测函数的$ {\rm{LSTM}}_h $模块输出线性化. 考虑到肌电信号具有超前性, 通常在肢体运动之前产生[1], 因此, 采用序贯渐进量测更新方法灵活地融合肌电和惯性传感器量测特征, 以逐步更新状态估计, 从而减小线性化误差. 最后, 利用真值与估计值 $ \hat{x}_{k|k} $的偏差优化滤波网络的权重参数, 以此学习合适的状态转移过程.
2.1 序贯渐进高斯滤波网络
贝叶斯滤波是一种常见的用于递归估计未知概率密度函数的概率方法, 它包括两个阶段:
预测:
$$ \begin{split} &p(x_{k}|Z_{1:k-1})=\\ &\qquad\int p\left(x_{k}|x_{k-1}\right)p(x_{k-1}|Z_{1:k-1}){\rm d}x_{k-1} \end{split} $$ (5) 量测更新:
$$ p(x_k|Z_{1:k})=\frac{p(z_k|x_k)p(x_k|Z_{1:k-1})}{\int p(z_k|x_k)p(x_k|Z_{1:k-1}){\rm d}x_k}$$ (6) 式中, $ p(\cdot) $表示概率密度函数, $ Z_{1:k-1} $=$ \{z_{1} $, $ z_{2}, {\cdots} $, $ z_{k-1}\} $为1到$ {k-1} $ 时刻所有量测. 对于系统(4), 结合UT变换, 可以计算系统先验均值$ \hat x_{k|k-1} $和协方差$ P_{k|k-1} $为:
$$ \begin{split} &\hat x_{k|k-1} =\int x_{k}p(x_{k-1}|Z_{1:k-1}){\rm d}x_{k-1}=\\ &\qquad\int f({x}_{k-1}){\rm N}\left(x_{k};\hat{x}_{k-1|k-1}, P_{k-1|k-1}\right){\rm d}x_{k-1}\approx\\ &\qquad\sum_{i=0}^{2n}W_{i}^{m}f({\chi_{k-1|k-1}^{i}})\\[-15pt] \end{split} $$ (7) $$ \begin{split} &P_{k|k-1}=\int\left(x_{k}-\hat{x}_{k|k-1}\right)\left(x_{k}-\hat{x}_{k|k-1}\right)^{\rm{T}}\;\times\\ &\quad p(x_{k-1}|Z_{1:k-1}){\rm d}x_{k-1}=\int f({x}_{k-1})f^{\rm{T}}({x}_{k-1})\;\times \\ &\quad{\rm N}(x_k;\hat{x}_{k-1|k-1}, P_{k-1|k-1}){\rm d}x_{k-1}-\hat{x}_{k|k-1}\hat{x}_{k|k-1}^{\rm{T}}\;+\\ &\quad{Q}_{k-1}\approx\sum\limits_{i = 0}^{2n} {W_i^c} f(\chi _{k - 1|k - 1}^i){f^{\rm{T}}}(\chi _{k - 1|k - 1}^i)\;- \\&\quad{{\hat x}_{k|k - 1}}\hat x_{k|k - 1}^{\rm{T}} + {Q_{k-1}}\\[-15pt] \end{split} $$ (8) $N(\cdot) $为高斯分布, $ {W_i^m} $ 和$ {W_i^c} $, $ i=0, \; 1, \; \cdots, \; 2n $是均值和协方差计算中的权值, $ {\chi _{k-1|k-1}^{i}} $为生成的sigma点, $ {Q_k} $为系统噪声协方差. 考虑到噪声统计特性通常隐藏在时序数据中, 而LSTM能够充分捕获时序数据之间的关联性, 为此直接利用LSTM模块从系统状态向量中学习$ {Q_k} $.
$$ {Q_k} = {\rm{LST}}{{\rm{M}}_Q}({x_{k - 1}}, c_{k - 1}^Q) $$ (9) $ {\rm{LSTM}}_Q $表示用于学习系统中$ Q_{k} $的LSTM模块, $ c_{k-1}^Q $是上一时刻$ {\rm{LSTM}}_Q $的隐藏单元. $ {\rm{LSTM}}_{Q} $结构如图3(a)所示, 由1层LSTM和1个全连接层组成, LSTM层由8个隐藏单元, 1个归一化层和1个LeakyReLU激活函数组成, 全连接层有2个隐藏单元.
如图4所示, 在序贯渐进高斯滤波网络中, 量测更新由几个子过程组成, 在每个子过程中, 采集到的传感器测量将依次用于更新状态估计.
注1. 在卡尔曼滤波中, 当量测测量向量的维数很大时, 求解增益阵$ K $时求逆的阶数将很高(通常, 求逆的计算量与矩阵阶数的三次方近似成正比). 特别地, 在高维矩阵运算时, 可能会出现发生数值溢出近似、奇异矩阵等问题, 从而导致估计系统不稳定. 而在序贯渐进高斯滤波中, 将传感器测量分解为多个分量, 使得对高阶矩阵的求逆转变为对低阶矩阵求逆, 同时利用传感器的互补优势逐一渐进地引入信息, 来降低线性化误差以及提高滤波的稳定性. 这就改善了高维量测引发的模型融合估计效率降低以及系统不稳定等问题.
在渐进高斯滤波中[28-29], 通过引入伪时间长度$ {\lambda_j}={\lambda_{j-1}}+{\Delta_j} $ ($ {\Delta_j} $为渐进步长, $ {\lambda_{0}}=0) $, 对观测中的不确定性进行补偿. 其中, 似然函数可以写成如下形式:
$$ \begin{split} p(z_k|x_k)=\;&\frac{1}{\sqrt{2\pi\left|R_k\right|}}\exp\{-\frac{1}{2}[z_k-h(x_k)]^{{\rm{T}}}\;\times \\ &\big(R_{k}\big)^{-1}\big[z_{k}-h(x_{k})\big]\}\;= \\ &C_{N}\prod_{j=1}^{N}\frac{1}{\sqrt{\left|\frac{2\pi R_k}{\Delta_{j}}\right|}}\exp\{-\frac{1}{2}[z_k-h(x_k)]^{{\rm{T}}}\;\times \\ &\left(\frac{R_{k}}{\Delta_{j}}\right)^{-1}\left[\left.z_{k}-h\left(x_{k}\right)\right]\right\}\;= \\ &C_{N}\prod_{j=1}^{N}p(z_k, \Delta_{j}|x_k)\\[-15pt] \end{split} $$ (10) $ {p ({z_k}, {\Delta _j}|{x_k})} $为渐进似然函数. $ {C_N} $为归一化常量, $ C_N=\left(1/\sqrt{2\pi R_k}\right)^{N-1}\prod_{j=1}^N\sqrt{\Delta_j} $, $ {\Delta _j}=\frac{1}{N} $为渐进步长. $ {N} $为渐进步数, 理论上, 较大的$ {N} $可以提供更精确的状态估计, 较小的$ {N} $能降低计算复杂度, 但可能无法充分捕捉系统的非线性行为, 导致滤波估计不准确. 在实际应用中, 通常需要进行实验和调整, 以找到最佳的$ N $值. 在本文中, 经过权衡, $ {N} $的取值为20. 根据贝叶斯准则, 伪时间$ {\lambda_{j+1}} $对应的渐进后验概率密度函数为:
$$ \begin{split} p( {x_k}|&{\lambda _{j + 1}}, {z_k}, {Z_{1:k - 1}})=\\ &p({x_k}|{\lambda _j} + {\Delta _j}, {z_k}, {Z_{1:k - 1}})=\\ &\frac{{p({z_k}, {\Delta _j}|{x_k})p({x_k}|{\lambda _j}, {Z_{1:k - 1}})}}{{\int {p({z_k}, {\Delta _j}|{x_k})p({x_k}, {\lambda _j}|{Z_{1:k - 1}}){\rm d}{x_k}} }} \end{split} $$ (11) 对于系统(2), 假设$ {p(z_k^{emg}, \Delta_j|x_k)} $服从零均值协方差为$ {R_k^{emg}/\Delta_j} $的高斯分布, 即
$$ \begin{split} &p(z_k^{emg}, {\Delta _j}|{x_k})= \\ &\qquad\frac{1}{{\sqrt {\left| {\frac{{2\pi R_k^{emg}}}{{{\Delta _j}}}} \right|} }}\exp \Bigg\{ { - \frac{1}{2}}{\left[ {z_k^{emg} - {\rm{LSTM}}_{{h}}^{{{emg}}}\left( {{x_k}} \right)} \right]^{\rm{T}}}\;\times \\ &\qquad {{{\left( {\frac{{R_k^{emg}}}{{{\Delta _j}}}} \right)}^{ - 1}}\left[ {z_k^{emg} - {\rm{LSTM}}_{{h}}^{{{emg}}}\left( {{x_k}} \right)} \right]} \Bigg\}\\[-20pt] \end{split} $$ (12) $ {\rm{LSTM}}^{emg}_{h} $为学习的肌电观测函数, $ {R^{emg}_k} $由LSTM模块直接从系统状态向量中学习得到, 结构分别如图3(b)、3(c)所示. 其中, $ {\rm{LSTM}}^{emg}_{h} $由2个LSTM层和2个全连接层组成, 每层LSTM由1个归一化层和1个LeakyReLU激活函数组成. 第1层LSTM中有64个隐藏单元, 第2层LSTM中有32个隐藏单元. 第1个全连接层有16个隐藏单元, 第2个全连接层有10个隐藏单元. $ {\rm{LSTM}}_{R} $ 由1层LSTM和1个全连接层组成, LSTM层由8个隐藏单元、1个归一化层和1个LeakyReLU激活函数组成, 全连接层有10个隐藏单元.
假设渐进联合概率密度函数为高斯分布:
$$ \begin{split} &p({x_k}, z_k^{emg}, {\lambda _{e, j + 1}}|{Z_{1:k - 1}}) = {\rm N} \Biggr( {\left[ {\begin{array}{*{20}{l}} {{x_k}}\\ {{z_k}} \end{array}} \right];} \\ &\qquad {\left[ {\begin{array}{*{20}{l}} {\hat x_{k|k}^{{\lambda _{e, j}}}}\\ {\hat z_{k|k}^{emg, {\lambda _{e, j + 1}}}} \end{array}} \right], \left[ {\begin{array}{*{20}{l}} {P_{xx, k|k}^{{\lambda _{e, j}}}}&{P_{xz, k|k}^{{\lambda _{e, j + 1}}}}\\ {P_{zx, k|k}^{{\lambda _{e, j + 1}}}}&{P_{zz, k|k }^{{\lambda _{e, j + 1}}}} \end{array}} \right]} \Biggr) \end{split} $$ (13) 则渐进后验概率密度函数为:
$$ \begin{split} p( & x_{k}|\lambda_{{e}, j+1}, z_{k}^{emg}, Z_{1:k-1})=\\ &\qquad{\rm N}\left(x_k; \hat{x}_{k|k}^{\lambda_{e, j+1}}, P_{k|k}^{\lambda_{e, j+1}}\right) \end{split} $$ (14) 结合UT变换计算量测预测值及其协方差:
$$ \begin{split} &\hat z_{k|k}^{{{emg}, \lambda _{e, j}}} =\\ &\quad\int\int{{z_{k}^{emg}}p({x_k}, z_k^e, {\lambda _{e, j }}|{Z_{1:k - 1}}){\rm d}{z_k}{\rm d}{x_k}}\;=\\ &\quad\int {\left\{ {\int {{z_{k}^{emg}}p(z_k^{emg}, {\Delta _j}|{x_k}){\rm d}{z_k}} } \right\}}\; \times \\ &\quad p(x_{k}|\lambda_{e, j-1}, z_{k}^{emg}, Z_{1:k-1}){\rm d}{x_k}\;\approx \\ &\quad\int {{\rm{LSTM}}^{emg}_{h}({x_k})}{\rm N}\left(x_k; \hat{x}_{k|k}^{\lambda_{e, j-1}}, P_{k|k}^{\lambda_{e, j-1}}\right){\rm d}{x_k}\;\approx \\ &\quad\sum\limits_{i = 0}^{2n} W_i^m{{\rm{LSTM}}^{emg}_{h}}(\chi _{i, k|k}^{{\lambda _{e, j - 1}}}) \\[-15pt]\end{split} $$ (15) $$ \begin{split} &P_{zz, k|k}^{{\lambda _{e, j}}} = \\ &\;\;\int {\int {(z_k^{emg} - \hat z_{k|k}^{emg, {\lambda _{e, j}}})} } {(z_k^{emg} - \hat z_{k|k}^{emg, {\lambda _{e, j}}})^{\rm{T}}} \;\times \\ &\;\;p({x_k}, z_k^{emg}, {\lambda _{e, j}}|{Z_{1:k - 1}}){\rm{d}}{z_k}{\rm{d}}{x_k} \;= \\ &\;\;\int {\left( {\int {z_k^{emg}} {{(z_k^{emg})}^{\rm{T}}}p(z_k^{emg}, {\Delta _j}|{x_k}){\rm{d}}{z_k}} \right)}\; \times \\ &\;\;p({x_k}, {\lambda _{e, j - 1}}|{Z_{1:k - 1}}){\rm{d}}{x_k} - \hat z_{k\mid k}^{emg, {\lambda _{e, j}}}{\left( {\hat z_{k\mid k}^{emg, {\lambda _{e, j}}}} \right)^{\rm{T}}} \approx \\ &\;\;\frac{{R_k^{emg}}}{{{\Delta _j}}} - \hat z_{k\mid k}^{emg, {\lambda _{e, j}}}{(\hat z_{k\mid k}^{emg, {\lambda _{e, j}}})^{\rm{T}}} + \int {{\rm{LSTM}}_h^{emg}\left( {{x_k}} \right)} \; \times \\ &\;\;{\left[ {{\rm{LSTM}}_h^{emg}\left( {{x_k}} \right)} \right]^{\rm{T}}}{\rm N}\left( {{x_k};\hat x_{k|k}^{{\lambda _{e, j - 1}}}, P_{k|k}^{{\lambda _{e, j - 1}}}} \right){\rm{d}}{x_k} \;= \\ &\;\;\sum\limits_{i = 0}^{2n}{W_i^c}{\rm{LSTM}}_h^{emg} \left( {\chi _{i, k|k}^{{\lambda _{e, j - 1}}}} \right) {\left[ {{\rm{LSTM}}_h^{emg} \left( {\chi _{i, k|k}^{{\lambda _{e, j - 1}}}} \right)} \right]^{\rm{T}}}+\\ &\;\;\frac{{R_k^{emg}}}{{{\Delta _j}}} - \hat z_{k|k}^{emg, {\lambda _{e, j}}}{\left( {\hat z_{k|k}^{emg, {\lambda _{e, j}}}} \right)^{\rm{T}}} \\[-15pt]\end{split} $$ (16) 计算先验状态估计值与观测预测值间的互协方差:
$$ \begin{split} &P_{xz, k|k}^{{\lambda _{e, j}}} = \int {\int {\left( {{x_k} - \hat x_{k|k}^{{\lambda _{e, j - 1}}}} \right)} } {\left( {z_k^{emg} - \hat z_{k|k}^{{emg}, {\lambda _{e, j}}}} \right)^{\rm{T}}}\;\times\\ &\qquad p({x_k}, z_k^{emg}, {\lambda _{e, j }}|{Z_{1:k - 1}}){\rm d}{z_k}{\rm d}{x_k}\;-\\ &\qquad \hat x_{k|k}^{{\lambda _{e, j - 1}}}{\left( {\hat z_{k|k}^{{emg}, {\lambda _{e, j}}}} \right)^{\rm{T}}}\approx\int {{x_k}{{\left[ {{\rm{LSTM}}_{{h}}^{{{emg}}}\left( {{x_k}} \right)} \right]}^{\rm{T}}}}\;\times\\ &\qquad {\rm N}\left( {{x_k};\hat x_{k|k}^{{\lambda _{e, j - 1}}}, P_{k|k}^{{\lambda _{e, j - 1}}}} \right){\rm d}{x_k}\; - \\ &\qquad \hat x_{k\mid k}^{{emg}, {\lambda _{e, j - 1}}}{(\hat z_{k\mid k}^{{emg}, {\lambda _{e, j}}})^{\rm{T}}}\;\approx \\ &\qquad \sum\limits_{i = 0}^{2n} {W_i^c} \chi _{i, k|k}^{{\lambda _{e, j - 1}}}{\left[ {{\rm{LSTM}}_{{h}}^{{{emg}}}\left( {\chi _{i, k|k}^{{\lambda _{e, j - 1}}}} \right)}\right]^{\rm{T}}}\; -\\ &\qquad \hat x_{k\mid k}^{{emg}, {\lambda _{e, j - 1}}}{(\hat z_{k\mid k}^{{emg}, {\lambda _{e, j}}})^{\rm{T}}}\\[-15pt] \end{split} $$ (17) 其中, $ \chi_{i, k|k}^{{\lambda_{e, j}}} $和$ {W_i^c} $为对应的sigma点与权值. 由式(15) ~ (17)可得状态估计和估计方差为:
$$ \hat x_{k|k}^{{\lambda _{e, j}}} = \hat x_{k|k}^{{\lambda _{e, j - 1}}} + K_{k|k}^{{\lambda _{e, j}}}({z_{k}^{emg}} - \hat z_{k|k}^{{{emg}, \lambda _{e, j}}}) $$ (18) $$ P_{k|k}^{{\lambda _{e, j}}} = P_{k|k}^{{\lambda _{e, j - 1}}} - K_{k|k}^{{\lambda _{e, j}}}P_{zz, k|k}^{{\lambda _{e, j}}}{(K_{k|k}^{{\lambda _{e, j}}})^{\rm{T}}} $$ (19) 其中, 渐进卡尔曼增益为:
$$ K_{k|k}^{{\lambda _{e, j}}} = P_{xz, k|k}^{{\lambda _{e, j}}}{(P_{zz, k|k}^{{\lambda _{e, j}}})^{ - 1}} $$ (20) 伪时间$ {\lambda _{e, j}} $从0走向1的过程也即从先验走向后验的过程, 对应的观测噪声协方差间接趋向 $ {R^{emg}_k} $. 从而将观测不确定性补偿问题转换为了伪时间长度的控制问题.
同理, 融合惯性量测$ {z_k^{imu}} $, 更新状态估计值和协方差:
$$ \hat x_{k|k}^{{\lambda _{i, j}}} = \hat x_{k|k}^{{\lambda _{i, j - 1}}} + K_{k|k}^{{\lambda _{i, j}}}({z_{k}^{imu}} - \hat z_{k|k}^{{{imu}, \lambda _{i, j}}}) $$ (21) $$ P_{k|k}^{{\lambda _{i, j}}} = P_{k|k}^{{\lambda _{i, j - 1}}} - K_{k|k}^{{\lambda _{i, j}}}P_{zz, k|k}^{{\lambda _{i, j}}}{(K_{k|k}^{{\lambda _{i, j}}})^{\rm{T}}} $$ (22) 且满足:
$$ \left\{ {\begin{aligned} &{\hat x_{k|k}^{{\lambda _{i, j = 0}}} = \hat x_{k|k}^{{\lambda _{e, j=N}}}}\\ &{ P_{k|k}^{{\lambda _{i, j = 0}}} = P_{k|k}^{{\lambda _{e, j=N}}}} \end{aligned}} \right. $$ (23) 其中, 渐进卡尔曼增益矩阵为:
$$ K_{k|k}^{{\lambda _{i, j}}} = P_{xz, k|k}^{{\lambda _{i, j}}}{( P_{zz, k|k}^{{\lambda _{i, j}}})^{ - 1}} $$ (24) 状态和观测互协方差, 预测观测协方差分别为:
$$ \begin{split} P_{xz, k|k}^{{\lambda _{i, j}}} \approx \;&\sum\limits_{l = 0}^{2n} {W_l^c} \left[ {\chi _{l, k|k}^{{\lambda _{i, j-1}}} - x_{k|k}^{{\lambda _{i, j - 1}}}} \right]\;\times\\ &{\left[ {{{{\rm{LSTM}}^{{{imu}}}_{h}}}(\chi _{l, k|k}^{{\lambda _{i, j-1}}}) - \hat z_{k|k}^{{imu}, {\lambda _{i, j}}}} \right]^{\rm{T}}} \end{split} $$ (25) $$ \begin{split} &P_{zz, k|k}^{{\lambda _{i, j}}}\approx\sum\limits_{l = 0}^{2n} {W_l^c} \left[ {{{\rm{LSTM}}^{{{imu}}}_{h}}(\chi _{l, k|k}^{{\lambda _{i, j-1}}}) - \hat z_{k|k}^{{{{imu}}}, {\lambda _{i, j}}}} \right]\;\times\\ &\qquad{\left[ {{{{\rm{LSTM}}^{{{imu}}}_{h}}}(\chi _{l, k|k}^{{\lambda _{i, j-1}}}) - \hat z_{k|k}^{{imu}, {\lambda _{i, j}}}} \right]^{\rm{T}}} + \frac{{R_k^{imu}}}{\Delta_j } \end{split} $$ (26) 为了保证各观测模块和噪声统计模块学习到合理的映射, 将真值与估计值的偏差作为序贯高斯滤波网络的损失:
$$ \begin{split} L\left( \theta \right) =\;& \frac{1}{T}\sum\limits_{k = 1}^T {\left( {{{\left\| {{x_k} - \hat x_{k|k - 1}^{}} \right\|}^2} \;+ } \right.} \\ &\left. {{{\left\| {{x_k} - \hat x_{k|k}^{{\lambda _{e, j = N}}}} \right\|}^2} + {{\left\| {{x_k} - \hat x_{k|k}^{{\lambda _{i, j = N}}}} \right\|}^2}} \right) \end{split} $$ (27) 其中, $ T $表示单个训练样本的时间步长, $ {x_k} $表示真值, $ {\hat x}_{k|k - 1} $表示状态预测值, $ \hat x_{k|k}^{{\lambda _{e, j=N}}} $和$ \hat x_{k|k}^{{\lambda _{i, j=N}}} $分别为$ {N} $步时肌电和惯性信号的观测更新值.
算法 1. 深度序贯渐进高斯滤波算法
1: 初始化;
2: while
3: 利用卷积网络提取观测特征;
4: 利用式(7) ~ (9)进行时间更新;
5: for $ j = 1:N $ do
6: 利用式(10) ~ (20)融合肌电观测;
7: end for
8: for $ j = 1:N $ do
9: 利用式(21) ~ (26)融合惯性观测;
10: end for
11: end while
3. 实验
为了验证该融合算法的可行性, 本文以人体上肢肘关节为例, 对$12 $名健康受试者的左右手肘关节进行了实验, 其中男性8名, 女性4名, 平均年龄为25.3 ± 4.8岁; 平均身高为165.3 ± 13.6厘米; 平均体重为68.5 ± 10.2千克. 实验前, 获得了每位受试者的书面同意.
3.1 数据采集
如图5所示, 实验采用Myo臂环作为表面肌电信号的采集系统, 其信号采样频率为100 Hz, 能采集8通道数据. 同时利用1个9轴IMU对受试者小臂的惯性信号进行采集, 采样频率100 Hz. 对于关节角度采集部分, 采用Optitrack视觉捕捉系统获取上肢关节运动特性, 分别用4个刚体描述腕部、肘部、肩部和躯体坐标, 采样频率100 Hz. 在数据采集过程中, 受试者站在Optitrack工作区间, 手臂自然下垂, 进行屈肘运动, 弯曲至最大角度位置. 在短暂停顿后进行伸展, 最后恢复到初始位置. 每次实验进行15组肘关节屈伸运动. 每个测试者进行5组重复实验, 为了防止肌肉疲劳, 每组实验之间设置5分钟的休息时间, 实验持续约35分钟.
3.2 特征提取
本文采用CNN提取原始数据的深层特征. 具体而言, 采用滑动窗口法分别获得大小为$ {{L}}\times{{C_1}} $的表面肌电信号矩阵和大小为$ {{L}}\times{C_2} $的惯性信息矩阵. 其中, $ {{L}} $表示窗口长度, $ {{C_1}} $和$ {C_2} $ 分别表示肌电传感器和惯性传感器通道数. 本文的CNN由4个卷积块和2个全连接块组成. 每个卷积块由1个卷积层、1个批归一化层、1个ReLU激活函数层、1个最大池化层和1个丢弃层组成. 卷积层内核大小为3, 步幅为1. 第1和第2个卷积块有16个核, 而第3和第4卷积块有32个核. 每个全连接块都由批归一化层、ReLU激活函数层和丢失层组成. 第1个全连接块有100个隐藏单元, 第2个全连接块有10个隐藏单元. 第2个全连接块的输出将被用作观测特征.
3.3 模型参数设置
实验中的所有网络模型都基于Python语言实现, 由Pytorch1.10库搭建, 在英特尔i7*10750H处理器以及英伟达RTX 2070显卡上完成训练和测试. 网络模型训练总轮次设置为60, 训练的批次设置为32, 选用Adam作为实验训练的优化器, CNN特征提取模块训练阶段初始学习率为0.001, 且学习率每隔10轮降为原来的一半, 所有LSTM模块均使用初始化权重, 初始学习率为0.001, 每隔5轮对学习率进行一次调整, 衰减率为0.8. 数据集前60%用于训练, 剩余40%用于测试. 为确保实验的可靠性, 在对比模型上都设置相同的超参数.
4. 实验结果与分析
本文将相关系数(R2)和均方根误差(RMSE)作为性能指标对融合模型进行评估, 并统计了各网络模型的浮点运算数 (FLOPs)和参数数量(Params). 其中, R2表明估计的曲线与测量的关节运动的相关程度, 而RMSE计算估计值与测量值之间的幅值差异. 本文选择卷积神经网络(sEMG和IMU信号为输入, 对高维特征进行拼接) 和渐进无迹卡尔曼滤波网络(分别以sEMG和IMU信号为输入, 对提取的特征向量进行建模; 将sEMG和IMU信号作为输入, 对特征融合后的特征向量进行建模)作为模型比较的基线方法. 以S1 ~ S4四名测试者右手的估计结果为例, 图6展示了四名受试者在五种模型下的肘关节角度估计和误差曲线. 五种方法都可以从表面肌电信号中有效地重建肘关节运动.
由于传感器布局、个数等因素, 基于sEMG的人体运动估计结果总体上略高于基于IMU的人体运动估计结果. PUKF-net通过利用先验知识和渐进量测对卷积神经网络提取的特征向量进行校正和不确定性补偿取得了相对光滑的估计曲线, 但由于单一信号有效信息有限, PUKF (sEMG)和PUKF(IMU)的估计结果在整体上还是低于CNN (sEMG+IMU). PUKF (sEMG+IMU)在CNN特征融合的基础上利用卡尔曼滤波框架提高了网络的估计性能和稳定性, SPGF-net在PUKF的基础上通过序贯融合肌电和惯性量测特征向量, 发挥了肌电和惯性信号的互补优势, 得到了相对光滑的曲线. 如图6(b)所示, 在18 s至26 s, CNN (sEMG+IMU)、PUKF (sEMG)和PUKF (IMU)估计测试者2的关节角度曲线都出现了不同程度的波动, 而SPGF-net的估计曲线(紫色实线)相对光滑且整体上更接近Optitrack真实值(蓝色实线). 为了定量比较几种方法的估计性能, 表1总结了CNN (sEMG+IMU)、PUKF (sEMG)、PUKF (IMU)、PUKF (sEMG+IMU)和SPGF-net五种方法的平均性能(平均值 ± 标准差). 其中, R2分别为0.854 ± 0.093、0.847 ± 0.080、0.838 ± 0.080、0.865 ± 0.080、0.884 ± 0.060, RMSE分别为14.52 ± 4.21、15.07 ± 3.54、15.64 ± 3.46、13.99 ± 3.96、12.99 ± 3.51. 与其他四种方法相比, SPGF-net通过序贯融合的方式提高了模型的精度和稳定性. 相较于PUKF (sEMG)模型而言, 在肘关节角度估计中的RMSE平均下降了13.8%, 相关系数平均提高了4.36%.
表 1 五种模型性能评价Table 1 The performance evaluation of five models测试者 均方根误差 (RMSE) 相关系数(R2) CNN
(sEMG+IMU)PUKF
(sEMG)PUKF
(IMU)PUKF
(sEMG+IMU)SPGF-net CNN
(sEMG+IMU)PUKF
(sEMG)PUKF
(IMU)PUKF
(sEMG+IMU)SPGF-net S1 9.75 11.91 12.48 9.56 9.27 0.922 0.884 0.872 0.925 0.930 S2 11.65 12.18 13.25 10.89 9.78 0.917 0.913 0.893 0.923 0.941 S3 16.18 15.90 16.42 15.63 14.15 0.864 0.868 0.859 0.876 0.896 S4 15.66 16.18 16.95 14.57 13.45 0.825 0.822 0.816 0.832 0.847 S5 24.24 23.30 23.79 22.74 18.98 0.594 0.624 0.609 0.651 0.751 S6 10.15 11.43 11.65 9.96 8.91 0.937 0.920 0.917 0.941 0.949 S7 16.31 16.62 17.19 16.13 15.90 0.856 0.851 0.847 0.860 0.869 S8 16.84 16.37 16.53 16.30 16.23 0.807 0.809 0.805 0.813 0.821 S9 9.23 9.95 10.86 8.82 7.73 0.930 0.918 0.903 0.938 0.951 S10 14.97 15.74 16.17 14.53 14.00 0.849 0.831 0.821 0.853 0.866 S11 16.86 17.19 17.66 16.62 15.78 0.852 0.846 0.838 0.857 0.864 S12 12.46 14.09 14.83 12.13 11.74 0.905 0.885 0.870 0.909 0.924 均值 14.52 15.07 15.64 13.99 12.99 0.854 0.847 0.838 0.865 0.884 标准差 4.21 3.54 3.46 3.96 3.51 0.093 0.080 0.080 0.080 0.060 为了评估各网络模型的复杂度, 本文统计了各网络模型浮点运算数(FLOPs)和网络模型参数数量(Params), 如表2所示. 由于观测网络模型的增加, 整个网络模型的计算量和参数总量也有一定程度的增加, 相较于提升的性能而言, 模型复杂度的增加在接受范围之内.
表 2 五种模型的复杂度Table 2 The complexity of five modelsCNN (sEMG+
IMU)PUKF (sEMG) PUKF (IMU) PUKF (sEMG+
IMU)SPGF-net FLOPs 1 237 714 719 448 619 828 1 328 864 1 419 176 Params 442 337 256 511 255 971 473 970 505 614 5. 结束语
本文设计了一种面向多通道表面肌电和惯性融合的序贯渐进高斯滤波网络, 实现了人体上肢运动估计. 利用卷积神经网络提取观测特征向量, 与常见的特征拼接不同, SPGF-net采用序贯融合的方式, 融合异构传感器量测. 特别地, 通过渐进量测更新的方法, 对观测网络的不确定性进行补偿. 实验结果表明所提出的融合方法可有效提高人体上肢关节角度估计的精度和稳定性. 本文仅对单个肘关节运动进行了估计, 然而多关节协同对模型要求更高. 在未来工作中, 将考虑多关节的协同和更复杂场景下的运动估计, 来评估我们的模型, 并进一步提高高斯滤波网络的自适应性, 同时将充分发挥深度学习在自适应滤波中的优势, 研究更为智能且泛用的自适应滤波策略.
-
-
[1] 柴天佑.复杂工业过程运行优化与反馈控制.自动化学报, 2013, 39(11): 1744-1757 doi: 10.3724/SP.J.1004.2013.01744Chai Tian-You. Operational optimization and feedback control for complex industrial processes. Acta Automatica Sinica, 2013, 39(11): 1744-1757 doi: 10.3724/SP.J.1004.2013.01744 [2] 高志强.自抗扰控制思想探究.控制理论与应用, 2013, 30(12): 1498-1510 doi: 10.7641/CTA.2013.31087Gao Zhi-Qiang. On the foundation of active disturbance rejection control. Control Theory and Applications, 2013, 30(12): 1498-1510 doi: 10.7641/CTA.2013.31087 [3] Minorsky N. Directional stability and automatically steered bodies. Journal of the American Society of Naval Engineers, 1922, 42(2): 280-309 http://ci.nii.ac.jp/naid/10003428066/ [4] 王维洲, 吴志伟, 柴天佑.电熔镁砂熔炼过程带输出补偿的PID控制.自动化学报, 2018, 44(7): 1282-1292 doi: 10.16383/j.aas.2018.c170620Wang Wei-Zhou, Wu Zhi-Wei, Chai Tian-You. PID control with output compensation for the fused magnesia smelting process. Acta Automatica Sinica, 2018, 44(7): 1282-1292 doi: 10.16383/j.aas.2018.c170620 [5] 张冬丽, 唐英干, 关新平.用改进的人工蜂群算法设计AVR系统最优分数阶PID控制器.自动化学报, 2014, 40(5): 973-979 doi: 10.3724/SP.J.1004.2014.00973Zhang Dong-Li, Tang Ying-Gan, Guan Xin-Ping. Optimum design of fractional order PID controller for an AVR system using an improved artificial bee colony algorithm. Acta Automatica Sinica, 2014, 40(5): 973-979 doi: 10.3724/SP.J.1004.2014.00973 [6] 赵建华, 沈永良.一种自适应PID控制算法.自动化学报, 2001, 27(03): 417-420 http://www.aas.net.cn/article/id/16426Zhao Jian-Hua, Shen Yong-Liang. An adaptive PID control algorithm. Acta Automatica Sinica, 2001, 27(03): 417-420 http://www.aas.net.cn/article/id/16426 [7] 胡包钢, 应浩.模糊PID控制技术研究发展回顾及其面临的若干重要问题.自动化学报, 2001, 27(04): 567-584 http://www.aas.net.cn/article/id/16439Hu Bao-Gang, Ying Hao. Review of fuzzy PID control techniques and some important issues. Acta Automatica Sinica, 2001, 27(04): 567-584 http://www.aas.net.cn/article/id/16439 [8] 韩京清.非线性PID控制器.自动化学报, 1994, 20(04): 487-490 http://www.aas.net.cn/article/id/14059Han Jing-Qing. Nonlinear PID controller. Acta Automatica Sinica, 1994, 20(04): 487-490 http://www.aas.net.cn/article/id/14059 [9] 罗传翼, 程桂芬, 付家才.控制工程与信号处理.北京:化学工业出版社, 2004.Luo Chuan-Yi, Cheng Gui-Fen, Fu Jia-Cai. Control engineering and signal processing. Beijing: ChemistryIndustry Press, 2004. [10] 黄德先, 江永亨, 金以慧.炼油工业过程控制的研究现状、问题与展望.自动化学报, 2017, 43(6): 902-916 doi: 10.16383/j.aas.2017.c170157Huang De-Xian, Jiang Yong-Heng, Jin Yi-Hui. Present research situation, major bottlenecks, and prospect of refinery industry process control. Acta Automatica Sinica, 2017, 43(6): 902-916 doi: 10.16383/j.aas.2017.c170157 [11] Kalman R E. On the general theory of control systems. Ire Transactions on Automatic Control, 1959, 4(3): 110-110 doi: 10.1109/TAC.1959.1104873 [12] Kalman R E. Canonical structure of linear dynamical systems. Proceedings of the National Academy of Sciences of the United States of America, 1962, 48(4): 596-600 doi: 10.1073/pnas.48.4.596 [13] 胡品慧, 袁璞.状态反馈预测控制系统的鲁棒稳定性.控制与决策, 2001, 16(1): 126-128 doi: 10.3321/j.issn:1001-0920.2001.01.034Hu Pin-Hui, Yuan Pu. Robustness of state feedback predictive control systems. Control and Decision, 2001, 16(1): 126 -128 doi: 10.3321/j.issn:1001-0920.2001.01.034 [14] 许锋, 魏小丽, 任丽红, 罗雄麟.基于多变量广义预测控制的不稳定系统控制结构选择方法.自动化学报, 2013, 39(9): 1547-1551 doi: 10.3724/SP.J.1004.2013.01547Xu Feng, Wei Xiao-Li, Ren Li-Hong, Luo Xiong-Lin. A control structure selection method based on multivariable generalized predictive control for unstable processes. Acta Automatica Sinica, 2013, 39(9): 1547-1551 doi: 10.3724/SP.J.1004.2013.01547 [15] 尹良震, 李奇, 洪志湖, 韩莹, 陈维荣. PEMFC发电系统FFRLS在线辨识和实时最优温度广义预测控制方法.中国电机工程学报, 2017, 37(11): 3223-3235 http://www.cqvip.com/QK/90021X/201711/672271672.htmlYin Liang-Zhen, Li Qi, Hong Zhi-Hu, Han Ying, Chen Wei-Rong. FFRLS online identification and real-time optimal temperature generalized predictive control method of PEMFC power generation system. Proceedings of the CSEE, 2017, 37(11): 3223-3235 http://www.cqvip.com/QK/90021X/201711/672271672.html [16] 司文杰, 董训德, 王聪.输入饱和的一类切换系统神经网络跟踪控制.自动化学报, 2017, 43(8): 1383-1392 doi: 10.16383/j.aas.2017.c160372Si Wen-Jie, Dong Xun-De, Wang Cong. Adaptive neural tracking control design for a class of uncertain switched nonlinear systems with input saturation. Acta Automatica Sinica, 2017, 43(8): 1383-1392 doi: 10.16383/j.aas.2017.c160372 [17] 朱宇轩, 李少远.双层模型预测控制系统的多包镇定域分析与系统设计.自动化学报, 2018, 44(2): 262-269 doi: 10.16383/j.aas.2018.c160394Zhu Yu-Xuan, Li Shao-Yuan. Analysis and system design of multi-convex hull stabilization domain for double-layered model predictive control system. Acta Automatica Sinica, 2018, 44(2): 262-269 doi: 10.16383/j.aas.2018.c160394 [18] 谢澜涛, 谢磊, 苏宏业.不确定系统的鲁棒与随机模型预测控制算法比较研究.自动化学报, 2017, 43(6): 969-992 doi: 10.16383/j.aas.2017.c170082Xie Lan-Tao, Xie Lei, Su Hong-Ye. A comparative study on algorithms of robust and stochastic MPC for uncertain systems. Acta Automatica Sinica, 2017, 43(6): 969-992 doi: 10.16383/j.aas.2017.c170082 [19] 刘向杰, 孔小兵.电力工业复杂系统模型预测控制—现状与发展.中国电机工程学报, 2013, 33(5): 79-85 http://d.wanfangdata.com.cn/Periodical/zgdjgcxb201305012Liu Xiang-Jie, Kong Xiao-Bing. Present situation and prospect of model predictive control application in complex power industrial process. Proceedings of the CSEE, 2013, 33(5): 79-85 http://d.wanfangdata.com.cn/Periodical/zgdjgcxb201305012 [20] 席裕庚, 李德伟, 林姝.模型预测控制—现状与挑战.自动化学报, 2013, 39(3): 222-236 doi: 10.3724/SP.J.1004.2013.00222Xi Yu-Geng, Li De-Wei, Lin Shu. Model predictive control—status and challenges. Acta Automatica Sinica, 2013, 39(3): 222-236 doi: 10.3724/SP.J.1004.2013.00222 [21] 李世卿, 丁宝苍.基于动态矩阵控制的双层结构预测控制的整体解决方案.自动化学报, 2015, 41(11): 1857-1866 doi: 10.16383/j.aas.2015.c150126Li Shi-Qing, Ding Bao-Cang. An overall solution to double-layered model predictive control based on dynamic matrix control. Acta Automatica Sinica, 2015, 41(11): 1857-1866 doi: 10.16383/j.aas.2015.c150126 [22] Eykhoff P. System Identification: Parameter and State Es-timation. Chichester, England: Wiley, 1974. [23] 鲁兴举, 郑志强.一类MIMO系统连续状态空间模型的参数辨识频域方法.自动化学报, 2016, 42(1): 145-153 doi: 10.16383/j.aas.2016.c150150Lu Xing-Ju, Zheng Zhi-Qiang. Identification of continuous state-space model parameters for a class of mimo systems: a frequency domain approach. Control Theory and Applications, 2016, 42(1): 145-153 doi: 10.16383/j.aas.2016.c150150 [24] 侯杰, 刘涛.基于新息估计和正交投影的闭环子空间模型辨识.自动化学报, 2016, 42(11): 1657-1663 doi: 10.16383/j.aas.2016.c160050Hou Jie, Liu Tao. Closed-loop subspace model identification using innovation estimation and orthogonal projection. Control Theory and Applications, 2016, 42(11): 1657-1663 doi: 10.16383/j.aas.2016.c160050 [25] 潘天红, 李少远.基于模糊聚类的PWA系统的模型辨识.自动化学报, 2007, 33(3): 327-330 doi: 10.1360/aas-007-0327Pan Tian-Hong, Li Shao-Yuan. Model identification of piecewise affine (PWA) systems based on fuzzy cluster. Acta Automatica Sinica, 2007, 33(3): 327-330 doi: 10.1360/aas-007-0327 [26] 李军, 万文军, 刘志刚, 陈世和, 张曦.一种基于时域响应的控制系统频率特性分析方法.中国电机工程学报, 2012, 32(29): 116-122 http://qikan.cqvip.com/Qikan/Article/Detail?id=43552907Li Jun, Wan Wen-Jun, Liu Zhi-Gang, Chen Shi-He, Zhang Xi. A method of frequency domain analysis for control system based on process response in time domain. Proceedings of the CSEE, 2012, 32(29): 116-122 http://qikan.cqvip.com/Qikan/Article/Detail?id=43552907 [27] 刘小斌.基于BP神经网络PID参数整定的空燃比控制策略研究.兰州工业学院学报, 2013, 20(6): 7-11 doi: 10.3969/j.issn.1009-2269.2013.06.002Liu Xiao-Bin. Study on the control strategy of air-fuel ratio of network PID parameter tuning based on BP neural. Journal of Lanzhou Higher Polytechnical College, 2013, 20(6): 7-11 doi: 10.3969/j.issn.1009-2269.2013.06.002 [28] 杨智, 陈颖.改进粒子群算法及其在PID整定中的应用.控制工程, 2016, 23(2): 161-166 http://www.cqvip.com/QK/98133A/20162/667904229.htmlYang Zhi, Chen Ying. Improved particle swarm optimization and its application in PID tuning. Control Engineering of China, 2016, 23(2): 161-166 http://www.cqvip.com/QK/98133A/20162/667904229.html [29] 徐传敬, 赵敏, 李天明.一种改进遗传算法的PID参数整定研究.计算机技术与发展, 2016, 26(9): 12-15 http://www.cqvip.com/QK/97969A/20169/669935643.htmlXu Chuan-Jing, Zhao Min, LI Tian-Ming. Research on PID parameter genetic tuning based on an improved algorithm. Computer Technology and Development, 2016, 26(9): 12-15 http://www.cqvip.com/QK/97969A/20169/669935643.html [30] 齐朝阳, 郑恩让, 侯再恩.迭代模型Smith预估控制:算法和稳定性.控制工程, 2015, 22(1): 133-138 http://www.cnki.com.cn/Article/CJFDTotal-JZDF201501025.htmQi Zhao-Yang, Zheng En-Rang, Hou Zai-En. Iterative model smith predictive control:algorithm and stability. Control Engineering of China, 2015, 22(1): 133-138 http://www.cnki.com.cn/Article/CJFDTotal-JZDF201501025.htm [31] 张宁.基于自适应Smith预估算法的再热蒸汽温度控制策略.热力发电, 2013, 42(4): 98-101 doi: 10.3969/j.issn.1002-3364.2013.04.098Zhang Ning. Self-adaptive Smith prediction algorithm based control strategy for reheat steam temperature. Thermal Power Generation, 2013, 42(4): 98-101 doi: 10.3969/j.issn.1002-3364.2013.04.098 [32] 王正齐, 刘贤兴.基于神经网络逆系统的无轴承异步电机非线性内模控制.自动化学报, 2013, 39(4): 433-439 doi: 10.3724/SP.J.1004.2013.00433Wang Zheng-Qi, Liu Xian-Xing. Nonlinear internal model control for bearingless induction motor based on neural network inversion. Acta Automatica Sinica, 2013, 39(4): 433-439 doi: 10.3724/SP.J.1004.2013.00433 [33] 黄宇, 韩璞, 李永玲.主汽温系统模糊自适应内模控制.中国电机工程学报, 2008, 28(23): 93-98 http://www.cnki.com.cn/Article/CJFDTotal-ZGDC200823018.htmHuang Yu, Han Pu, Li Yong-Ling. Fuzzy adaptive internal model control in main steam temperature system. Proceedings of the CSEE, 2008, 28(23): 93-98 http://www.cnki.com.cn/Article/CJFDTotal-ZGDC200823018.htm [34] 蔡改贫, 许琴, 曾艳祥, 杨丽荣.预磨机磨矿系统的IMC-PID串联解耦控制.北京工业大学学报, 2016, 42(1): 35-41 http://www.cqvip.com/QK/95054X/20161/667678318.htmlCai Gai-Pin, Xu Qin, Zeng Yan-Xiang, Yang Li-Rong. IMC-PID series decoupling control of the pre-mill grinding system. Journal of Beijing Polytechnic University, 2016, 42(1): 35-41 http://www.cqvip.com/QK/95054X/20161/667678318.html [35] 黄攀峰, 胡永新, 王东科, 孟中杰, 刘正雄.空间绳系机器人目标抓捕鲁棒自适应控制器设计.自动化学报, 2017, 43(4): 538-547 doi: 10.16383/j.aas.2017.c150602Huang Pan-Feng, Hu Yong-Xin, Wang Dong-Ke, Meng Zhong-Jie, Liu Zheng-Xiong. Capturing the target for a tethered space robot using robust adaptive controller. Acta Automatica Sinica, 2017, 43(4): 538-547 doi: 10.16383/j.aas.2017.c150602 [36] 陈光荣, 王军政, 汪首坤, 赵江波, 沈伟, 李静.自适应鲁棒控制器设计新方法在电液伺服系统中的应用.自动化学报, 2016, 42(3): 375-384 doi: 10.16383/j.aas.2016.c150473Chen Guang-Rong, Wang Jun-Zheng, Wang Shou-Kun, Zhao Jiang-Bo, Shen Wei, Li Jing. Application of a new adaptive robust controller design method to electro-hydraulic servo system. Acta Automatica Sinica, 2016, 42(3): 375-384 doi: 10.16383/j.aas.2016.c150473 [37] 刘斌, 孙久强, 翟志强, 李卓, 王常虹.一种改进的同伦算法与$H_{\infty}$鲁棒控制器设计.自动化学报, 2013, 39(8): 1374-1380 http://d.wanfangdata.com.cn/Periodical/zdhxb201308022Liu Bin, Sun Jiu-Qiang, Zhai Zhi-Qiang, Li Zhuo, Wang Chang-Hong. A modified homotopy method and $H_{\infty}$ robust controller design. Acta Automatica Sinica, 2013, 39(8): 1374-1380 http://d.wanfangdata.com.cn/Periodical/zdhxb201308022 [38] 刘希, 孙秀霞, 董文瀚, 杨朋松.一种新的约束变速趋近律离散滑模控制方法.自动化学报, 2013, 39(9): 1552-1557 doi: 10.3724/SP.J.1004.2013.01552Liu Xi, Sun Xiu-Xia, Dong Wen-Han, Yang Peng-Song. A new discrete-time sliding mode control method based on restricted variable trending law. Acta Automatica Sinica, 2013, 39(9): 1552-1557 doi: 10.3724/SP.J.1004.2013.01552 [39] 韩京清.控制理论—模型论还是控制论.系统科学与数学, 1989, 9(4): 328-335 http://www.cqvip.com/QK/95649X/19894/162139.htmlHan Jing-Qing. Control theory, is it a model analysis approach or a direct control approach? Journal of Systems Science and Mathematical Sciences, 1989, 9(4): 328-335 http://www.cqvip.com/QK/95649X/19894/162139.html [40] 王建宏.内模控制中的虚拟参考反馈校正设计.系统科学与数学, 2017, 37(2): 355-369 http://www.cnki.com.cn/Article/CJFDTotal-STYS201702005.htmWang Jian-Hong. Virtual reference feedback tuning design in internal model control. Journal of Systems Science and Mathematical Sciences, 2017, 37(2): 355-369 http://www.cnki.com.cn/Article/CJFDTotal-STYS201702005.htm [41] 邹涛, 王丁丁, 丁宝苍, 于海斌.积分过程预测控制的稳态分析及反馈校正.控制理论与应用, 2014, 31(2): 165-174 http://d.wanfangdata.com.cn/Periodical/kzllyyy201402005Zou Tao, Wang Ding-Ding, Ding Bao-Cang, Yu Hai-Bin. Steady-state analysis and feedback correction of model predictive control for integrating process. Control Theory and Applications, 2014, 31(2): 165-174 http://d.wanfangdata.com.cn/Periodical/kzllyyy201402005 [42] 韩京清.自抗扰控制技术:估计补偿不确定因素的控制技术.北京:国防工业出版社, 2008.Han Jing-Qing. Active Disturbance Rejection Control: the Technique for Estimating and Compensating the Uncertain-ties. Beijing: National Denfence Industry Press, 2008. [43] 孙立, 董君伊, 李东海, 薛亚丽.基于扩张状态观测器的汽轮机功频电液串级控制.中国电机工程学报, 2015, 35(7): 1697-1703 http://www.cqvip.com/QK/90021X/20157/664192326.htmlSun Li, Dong Jun-Yi, Li Dong-Hai, Xue Ya-Li. Cascaded load-frequency digital electric-hydraulic regulation of turbine via extended state observer. Proceedings of the CSEE, 2015, 35(7): 1697-1703 http://www.cqvip.com/QK/90021X/20157/664192326.html [44] Zheng Q, Gao L Q, Gao Z Q. On stability analysis of active disturbance rejection control for nonlinear time-varying plants with unknow dynamics. In: Proceedings of the 46th IEEE Conference on Decision and Control. New Orleans, LA, USA: IEEE, 2007. 3501-3506 [45] 袁东, 马晓军, 曾庆含, 邱晓波.基二阶系统线性自抗扰控制器频带特性与参数配置研究.控制理论与应用, 2013, 30(12): 1630-1640 doi: 10.7641/CTA.2013.30424Yuan Dong, Ma Xiao-Jun, Zeng Qing-Han, Qiu Xiao-Bo. Research on frequency-band characteristics and parameters configuration of linear active disturbance rejection control for second-order systems. Control Theory and Applications, 2013, 30(12): 1630-1640 doi: 10.7641/CTA.2013.30424 [46] 刘善慧, 梅雪松, 何奎, 李健.凹印机多色套准系统自抗扰解耦控制.控制理论与应用, 2014, 31(11): 1574-1579 doi: 10.7641/CTA.2014.30825Liu Shan-Hui, Mei Xue-Song, He Kui, Li Jian. Active disturbance rejection decoupling control for multi-color register system in gravure printing machine. Control Theory and Applications, 2014, 31(11): 1574-1579 doi: 10.7641/CTA.2014.30825 [47] 陈增强, 孙明玮, 杨瑞光.线性自抗扰控制器的稳定性研究.自动化学报, 2013, 39(5): 574-580 doi: 10.3724/SP.J.1004.2013.00574Chen Zeng-Qiang, Sun Ming-Wei, Yang Rui-Guang. On the stability of linear active disturbance rejection control. Acta Automatica Sinica, 2013, 39(5): 574-580 doi: 10.3724/SP.J.1004.2013.00574 [48] 李向阳, 哀薇, 田森平.惯性串联系统的自抗扰控制.自动化学报, 2018, 44(3): 562-568 doi: 10.16383/j.aas.2018.c160568Li Xiang-Yang, Ai Wei, Tian Sen-Ping. Active disturbance rejection control of cascade inertia systems. Acta Automatica Sinica, 2018, 44(3): 562-568 doi: 10.16383/j.aas.2018.c160568 [49] 李杰, 齐晓慧, 夏元清, 高志强.线性/非线性自抗扰切换控制方法研究.自动化学报, 2016, 42(2): 202-212 doi: 10.16383/j.aas.2016.c150338Li Jie, Qi Xiao-Hui, Xia Yuan-Qing, Gao Zhi-Qiang. On linear/nonlinear active disturbance rejection switching control. Acta Automatica Sinica, 2016, 42(2): 202-212 doi: 10.16383/j.aas.2016.c150338 [50] 竹瑞博, 董泽, 冉宁.自抗扰控制在火电厂主蒸汽温度控制中的应用.电力科学与工程, 2012, 28(5): 46-49 doi: 10.3969/j.issn.1672-0792.2012.05.010Zhu Rui-Bo, Dong Ze, Ran Ning. Application of active disturbance rejection control in main steam temperature control of thermal power plant. Power Science and Engineering, 2012, 28(5): 46-49 doi: 10.3969/j.issn.1672-0792.2012.05.010 [51] 楼冠男, 谭文, 郑勤玲.汽包锅炉单元机组协调系统的线性自抗扰控制.中国电机工程学报, 2011, 31(23): 94-100 http://www.cnki.com.cn/Article/CJFDTotal-ZGDC201123014.htmLou Guan-Nan, Tan Wen, Zheng Qin-Ling. Linear active disturbance rejection control for the coordinated system of drum boiler-turbine units. Proceedings of the CSEE, 2011, 31(23): 94-100 http://www.cnki.com.cn/Article/CJFDTotal-ZGDC201123014.htm [52] 刘希, 孙秀霞, 郝震, 刘宇坤.最速跟踪微分器的一种新型离散形式.信息与控制, 2013, 42(6): 729-734 http://www.cqvip.com/QK/93243X/201306/48330018.htmlLiu Xi, Sun Xiu-Xia, Hao Zhen, Liu Yu-Kun. A new discrete-time form of optimal tracking differentiator. Information and control, 2013, 42(6): 729-734 http://www.cqvip.com/QK/93243X/201306/48330018.html [53] Guo B Z, Zhao Z L. On convergence of tracking differentiator. International Journal of Control, 2011, 84(4): 693-701 doi: 10.1080/00207179.2011.569954 [54] 王艳, 刘斌.基于双曲函数的非线性跟踪微分器.系统科学与数学, 2017, 37(2): 321-327 http://d.wanfangdata.com.cn/Periodical/xtkxysx-zw201702001Wang Yan, Liu Bin. Nonlinear tracking differentiator based on the hyperbolic function. Journal of Systems Science and Mathematical Sciences, 2017, 37(2): 321-327 http://d.wanfangdata.com.cn/Periodical/xtkxysx-zw201702001 [55] Guo B Z, Han J Q, Xi F B. Linear tracking differentiator and application to online estimation of the frequency of a sinusoidal signal with random noise perturbation. Intetnational Journal of System Science, 2002, 33(5): 351-358 doi: 10.1080/00207720210121771 [56] 李军, 万文军, 王越超.一种新型线性二阶滤波器的研究与应用.控制理论与应用, 2017, 34(3): 312-320 http://www.cqvip.com/QK/90555X/20173/7000196711.htmlLi Jun, Wan Wen-Jun, Wang Yue-Chao. Research and application of a new type of linear second-order filter. Control Theory and Applications, 2017, 34(3): 312-320 http://www.cqvip.com/QK/90555X/20173/7000196711.html [57] 李军, 朱亚清, 陈文, 万文军, 陈世和, 胡康涛, 等.一种新型正弦跟踪微分器的研究与应用.控制理论与应用, 2016, 33(9): 1182-1192 http://www.cnki.com.cn/Article/CJFDTotal-KZLY201609007.htmLi Jun, Zhu Ya-Qing, Chen Wen, Wan Wen-Jun, Chen Shi-He, Hu Kang-Tao, et al. Research and application of a new type of sinusoid tracking differentiator. Control Theory and Applications, 2016, 33(9): 1182-1192 http://www.cnki.com.cn/Article/CJFDTotal-KZLY201609007.htm [58] 李军, 万文军, 胡康涛.一种基于点频滤波器的微分信号提取方法.自动化学报, 2017, 43(3): 478-486 doi: 10.16383/j.aas.2017.c160012Li Jun, Wan Wen-Jun, Hu Kang-Tao. A new method for extraction of process differential signal based onsingle-frequency-pass filter. Acta Automatica Sinica, 2017, 43(3): 478-486 doi: 10.16383/j.aas.2017.c160012 [59] 李军, 陈世和, 万文军, 王越超, 黄卫剑.一种内反馈控制器IFC的研究与应用.自动化学报, 2018, 44(9): 1706-1716 doi: 10.16383/j.aas.2018.c160815Li Jun, Chen Shi-He, Wan Wen-Jun, Wang Yue-Chao, Huang Wei-Jian.An internal feedback controller. Acta Automatica Sinica, 2018, 44(9): 1706-1716 doi: 10.16383/j.aas.2018.c160815 [60] 李军, 黄卫剑, 万文军, 朱亚清, 潘凤萍.一种新型抗扰控制方法的研究与应用.广东电力, 2018, 31(3): 1-8 http://www.cnki.com.cn/Article/CJFDTotal-GDDL201803002.htmLi Jun, Huang Wei-Jian, Wang Wen-Jun, Zhu Ya-Qing, Pan Feng-Ping. Research and application of one new-type disturbance rejection control method. Guangdong Electric Power, 2018, 31(3): 1-8 http://www.cnki.com.cn/Article/CJFDTotal-GDDL201803002.htm [61] 李军, 万文军.一种基于序列零初相位调制的新型正弦信号频率测量方法.自动化学报, 2016, 42(10): 1585-1594 doi: 10.16383/j.aas.2016.c150891Li Jun, Wan Wen-Jun. A novel sinusoidal frequency measurement method based on modulation of sequence with zero initial phase. Acta Automatica Sinica, 2016, 42(10): 1585-1594 doi: 10.16383/j.aas.2016.c150891 [62] 李军, 王越超, 李锋.一种基于序列和反褶序列精密初相位计算的新型正弦频率测量方法.电子学报, 2016, 44(10): 2370-2376 doi: 10.3969/j.issn.0372-2112.2016.10.013Li Jun, Wang Yue-Chao, Li Feng. A novel sinusoidal frequency measurement method based on precise calculation of Initial phase of sequence and deconvolution sequence. Acta Electronica Sinica, 2016, 44(10): 2370-2376 doi: 10.3969/j.issn.0372-2112.2016.10.013 [63] 朱波, 王新华, 蔡开元.双积分系统阶跃响应快速无超调控制:一种增益切换非线性PD控制.控制理论与应用, 2009, 26(10): 1111 -1117 http://www.cnki.com.cn/Article/CJFDTotal-KZLY200910014.htmZhu Bo, Wang Xin-Hua, Cai Kai-Yuan. Fast and nonovershooting control for a double-integral system with step input: nonlinear PD control based on gain-switching. Control Theory and Applications, 2009, 26(10): 1111-1117 http://www.cnki.com.cn/Article/CJFDTotal-KZLY200910014.htm [64] 黄伟煌, 胡书举, 林资旭, 付勋波, 许洪华.一种采用相位超前校正技术的电压源逆变器单环控制策略.中国电机工程学报, 2013, 33(30): 18-25 http://d.wanfangdata.com.cn/Periodical/zgdjgcxb201330005Huang Wei-Huang, Hu Shu-Ju, Lin Zi-Xu, Fu Xun-Bo, Xu Hong-Hua. A single-loop control strategy based on phase lead correction for voltage source inverters. Proceedings of the CSEE, 2013, 33(30): 18-25 http://d.wanfangdata.com.cn/Periodical/zgdjgcxb201330005 [65] 叶智, 李晓博, 康毅, 马乐, 杨新民, 高海东. FCS165现场总线控制系统实际微分PID控制器的设计.热力发电, 2011, 40(8): 38-40 doi: 10.3969/j.issn.1002-3364.2011.08.038Ye Zhi, Li Xiao-Bo, Kang Yi, Ma Le, Yang Xin-Min, Gao Hai-Dong. Design of actual differential PID controller used in FCS 165 field bus control system. Thermal Power Generation, 2011, 40(8): 38-40 doi: 10.3969/j.issn.1002-3364.2011.08.038 [66] 程赟, 陈增强, 孙明玮, 孙青林.多变量逆解耦自抗扰控制及其在精馏塔过程中的应用.自动化学报, 2017, 43(6): 1080-1088 doi: 10.16383/j.aas.2017.c170137Cheng Yun, Chen Zeng-Qiang, Sun Ming-Wei, Sun Qing-Lin. Multivariable inverted decoupling active disturbance rejection control and its application to a distillation column process. Acta Automatica Sinica, 2017, 43(6): 1080-1088 doi: 10.16383/j.aas.2017.c170137 [67] 陈烨, 李银伢, 戚国庆, 盛安冬.多通道解耦事件触发机制及其在光电传感网络中的应用.自动化学报, 2017, 43(2): 227-237 doi: 10.16383/j.aas.2017.c160088Chen Ye, Li Yin-Ya, Qi Guo-Qing, Sheng An-Dong. A multi-channel decoupled event triggered transmission mechanism and its application to optic-electric sensor network. Acta Automatica Sinica, 2017, 43(2): 227-237 doi: 10.16383/j.aas.2017.c160088 -