-
摘要: 本文从理论上分析了执行机构带宽对动态逆闭环控制系统动态特性影响, 发现较低的执行机构带宽会在伪线性系统中引入一个非线性干扰项, 为此提出了两种方法来消除这个非线性干扰项, 一个是采用参考模型的思想设计补偿器提高执行机构子系统的等效带宽, 另一个思路则是直接在非线性反馈项中引入补偿直接对消非线性干扰项. 仿真结果表明, 两类方法都能较好地消除非线性干扰项, 直接补偿方法能精确消除干扰项, 但需要准确动力学模型, 提高等效带宽的方法虽然是近似的, 但能方便地引入自适应算法, 可以抑制执行机构模型参数不确定的影响.Abstract: Through analyzing the influence of actuator bandwidth on dynamic characteristics of dynamic inverse close-loop control system, it is found that lower actuator bandwidth will introduce a nonlinear disturbance into pseudo-linear system, therefore, two methods are proposed to eliminate this nonlinear disturbance term, one is to use the idea of the reference model to design the compensator to improve the equivalent bandwidth of the actuator subsystem, the other idea is to introduce compensation directly into nonlinear feedback term to eliminate nonlinear disturbance. The simulation results show that both types of methods can eliminate nonlinear disturbance, the direct compensation method can accurately eliminate disturbance, but accurate dynamic model is needed, although the method by improving the equivalent bandwidth is approximate, it can easily introduce adaptive algorithm, which can restrain the influence of uncertain parameters of the actuator model.
-
自上世纪80年代起, 控制界开始采用非线性动态逆(Nonlinear dynamic inversion, NDI, 后面都简称动态逆)方法来设计多变量非线性系统的控制律, 这是一种利用非线性状态反馈的方式将一个非线性系统变成线性系统, 然后再利用我们熟知的线性系统设计方法对变换后的线性系统进行设计, 因此动态逆方法又称为反馈线性化方法. 动态逆最先应用在飞行控制律设计方面, 尤其是战斗机大迎角超机动控制律设计[1-4], 该方法可以通过逆模型来对消掉大迎角气动非线性和动力学非线性, 从而将一个强非线性系统变成几个独立线性系统(最常见的为一阶惯性系统), 在线性化的同时实现了多通道的解耦, 此外动态逆方法还可应用于航天飞行器的再入制导和控制[5-6], 机械臂控制[7]和倒立摆控制[8-9] (垂直起降火箭和平衡车). 动态逆方法采用非线性逆系统理论来设计控制律, 在对系统进行线性化的同时实现多变量系统解耦控制, 用动态逆方法设计的控制器可以对被控对象的控制变量在全过程进行动态特性处理, 以达到期望的特性[10]. 动态逆设计方法在设计过程中避免了大量的调参工作, 设计出来的控制律具有较强的适应性和通用性, 不像基于特征点的线性系统设计方法, 需要依据特征点的不同来调整控制律参数. 传统的动态逆方法都是采用逆模型来对消系统非线性, 当逆模型有较大不确定性时, 不仅系统非线性不能完全对消, 闭环系统稳定性也会受到影响, 因此陆续提出了一系列的具有较好鲁棒性的动态逆控制方法, 比如采用L1自适应方法与动态逆方法相结合[11-12], 用动态逆方法设计初步控制律, 在此基础上引入自适应律和一个低通滤波器来保证系统的鲁棒性, 文献[13]则采用滑模变结构方法和动态逆方法相结合, 实际控制输入由两部分组成: 动态逆控制律和滑模变结构控制律, 其中滑模变结构控制律可有效抑制模型的不确定性影响. 上述方法都是采用传统的动态逆与鲁棒控制方法相结合来增强控制系统的鲁棒性, 本质上还是以动态逆方法为基础. 文献[14-16]中的增量非线性动态逆(Incremental nonlinear dynamic inversion, INDI, 后面简称增量动态逆)方法则是以状态变化率作为反馈项, 由于模型不确定性可通过状态变化率直接体现, 因此增量动态逆与传统动态逆方法相比, 鲁棒性得到较大的提升. 然而不管是传统的动态逆方法(包括与鲁棒控制相结合)还是增量动态逆方法, 在设计非线性系统控制律时并不能有效考虑执行机构的动态特性, 尤其是当执行机构带宽与闭环等效系统带宽较为接近时, 执行机构对最后的闭环动态特性影响较大. 在动态逆控制律当中, 执行机构作为一个子系统处在逆系统和对象非线性系统之间, 通过对非线性补偿后的伪线性系统进行再设计的方式并不能有效消除执行机构动态特性影响, 最为有效的方式是直接对执行机构子系统的动态特性进行补偿, 使补偿后的子系统动态远高于闭环系统动态, 从而消除因执行机构带宽较低给非线性系统控制带来的不利影响. 文献[17-18]中在执行机构模型已知的情况下, 通过对执行机构子系统设计线性补偿器提高补偿后子系统的期望动态特性, 本文则通过引入模型参考自适应系统, 在执行机构模型未知的情况下, 将补偿后的子系统带宽提高到合适值, 此外本文还给出了一种通过修正非线性反馈项的方法来消除执行机构动态特性的影响, 并将这种方法与前面单方面提高执行机构等效带宽的方法进行了对比.
1. 问题的描述
1.1 对常规动态逆的影响
存在如下仿射非线性动力学系统:
$$ \left\{ \ \begin{aligned} &\dot{{x}}={{f}}\left({{x}}\right)+{G}\left({{x}}\right){{u}}\\ &{{y}}={{h}}\left({{x}}\right)\end{aligned}\right.$$ (1) 式中:
$ {{x}} $ 为系统状态;$ {{u}} $ 为控制输入;$ {{y}} $ 为期望的控制系统输出. 若系统相对阶为$ r $ , 对系统测量方程进行$ r $ 次微分, 由系统相对阶的定义, 有下列条件成立:$$ \left\{ \begin{aligned} &{{L}}_{g}{{L}}_{f}^{{r}-{{\rm{1}}}}{{h}}\left({{x}}\right)\ne {\bf{0}}\\ &{{L}}_{g}{{L}}_{f}^{{i}-{{\rm{1}}}}{{h}}\left({{x}}\right)={\bf{0}},\; i\le r-1\end{aligned}\right. $$ (2) 因此通过
$ r $ 次微分后, 可得到包含显式系统控制输入的方程:$$ {{{y}}}^{\left({r}\right)}={{L}}_{f}^{{r}}{{h}}\left({{x}}\right)+{{L}}_{g}{{L}}_{f}^{{r}-{\rm{1}}}{{h}}\left({{x}}\right){{u}} $$ (3) 若取如下控制规律:
$$ {{u}}={\left({{L}}_{g}{{L}}_{f}^{{r}-{\rm{1}}}{{h}}\left({{x}}\right)\right)}^{-{R}}\left({{v}}-{{L}}_{f}^{{r}}{{h}}\left({{x}}\right)\right) $$ (4) 其中
$ {{v}} $ 为虚拟控制量, 符号${\left({\cdot}\right)}^{-{{R}}}$ 表示广义右逆, 若系统满足条件相对阶$ r=1 $ 且$ {\rm{dim}}\left({{x}}\right)={\rm{d}}{\rm{i}}{\rm{m}}\left({{u}}\right) $ , 比如常见飞行器姿态动力学系统, 则动力学系统动态逆控制律可以表示为如下简易形式:$$ {{{u}}}_{{c}}={\left({G}\left({{x}}\right)\right)}^{-1}\left({\dot{{x}}}_{c}-{{f}}\left({{x}}\right)\right) $$ (5) 具体结构如图1所示:
对于如图1所示的典型非线性动态逆控制问题, 若执行机构输入
${{{u}}}_{c}$ 的频率(取决于控制律的指令动态${\dot{{x}}}_{c}$ )远小于执行机构带宽$ {\omega }_{a} $ , 则执行机构输入${{{u}}}_{c}$ 近似等于执行机构输出$ {{u}} $ , 控制器、执行机构以及被控对象的组合系统等价于单位阵, 以此单位阵为基础, 合理设计满足品质要求的状态变化率指令, 形成最终的动态逆控制律. 但是实际控制过程中, 往往由于执行机构本身物理特性限制, 控制输入${{{u}}}_{c}$ 的频率与执行机构带宽$ {\omega }_{a} $ 较为接近, 此时输入${{{u}}}_{c}$ 与输出$ {{u}} $ 在幅值和相位上都有较大的差异, 控制输入的频率与执行机构带宽越接近, 幅值和相位上的差异越大.假定执行机构动态特性为一阶惯性环节, 则有下式成立:
$$ \begin{array}{l} \left({\dot{{x}}}_{c}-{{f}}\left({{x}}\right)\right){{G}}^{-1}\left({{x}}\right)\dfrac{{\omega }_{a}}{s+{\omega }_{a}}{G}\left({{x}}\right)+{{f}}\left({{x}}\right) =\dot{{x}} \end{array} $$ (6) 经过变形后上式可以表示成:
$$ {\dot{{x}}}_{c}\frac{{\omega }_{a}}{s+{\omega }_{a}}+{{f}}\left({{x}}\right)\frac{s}{s+{\omega }_{a}}=\dot{{x}} $$ (7) 显然从上式可以看出, 若非线性反馈项
$ {{f}}\left({{x}}\right) $ 频率与执行机构带宽$ {\omega }_{a} $ 相近或超出, 式(7)中的非线性项无法忽略掉.1.2 对增量动态逆的影响
为解决常规动态逆方法鲁棒性较差的问题, Smith博士将增量思想引入到动态逆方法当中[14], 用于完整的飞行控制律设计, 具体思想是将状态方程在某个邻域内泰勒展开, 得到非线性系统的增量模型, 仍然以上节相对阶为1的非线性系统为例, 则控制机构增量与系统状态之间的关系如下[15]:
$$ \Delta {{u}}={{G}}^{-1}\left({{x}}\right)\left({\dot{{x}}}_{{c}}-\left({\dot{{x}}}_{\bf{0}}+{{f}}'\left({{x}}\right)\left({{x}}-{{x}}_{\bf{0}}\right)\right)\right) $$ (8) 其中:
$$ {\dot{{x}}}_{\bf{0}}={{f}}\left({{x}}_{\bf{0}}\right)+{G}\left({{{x}}}_{0}\right){{{u}}}_{\bf{0}} $$ (9) 若执行机构带宽和控制频率足够高, 则上式中的
${{f}}'\left({{x}}\right)\left({{x}}-{{x}}_{\bf{0}}\right)$ 项可以忽略, 增量动态逆控制结构如下图所示:依据上面的增量动态逆原理图, 有下式成立:
$$ \begin{array}{l} \left(\left({\dot{{x}}}_{c}-{\dot{{x}}}_{\rm{0}}\right){{{G}}}^{-1}\left({{x}}\right)+{{{u}}}_{\rm{0}}\right)\dfrac{{\omega }_{a}}{s+{\omega }_{a}}{G}\left({{x}}\right) +{{f}}\left({{x}}\right)=\dot{{x}} \end{array} $$ (10) 将式(9)代入上式, 可以得到
$$ \begin{split} &\left({\dot{{x}}}_{c}-{{f}}\left({{x}}_{\rm{0}}\right)-{G}\left({{{x}}}_{{\rm{0}}}\right){{{u}}}_{\rm{0}}+{G}\left({{x}}\right){{{u}}}_{\rm{0}}\right)\times\\ &\qquad\dfrac{{\omega }_{a}}{s+{\omega }_{a}}+{{f}}\left({{x}}\right)=\dot{{x}} \end{split} $$ (11) 若控制频率足够高, 有
${{x}}_{\rm{0}}\approx {{x}}$ ,${{{u}}}_{\rm{0}}\approx {{u}}$ 成立, 上式可以等价为:$$ {\dot{{x}}}_{c}\frac{{\omega }_{a}}{s+{\omega }_{a}}+{{f}}\left({{x}}\right)\frac{s}{s+{\omega }_{a}}=\dot{{x}} $$ (12) 显然此式与常规动态逆一样, 说明在满足控制频率足够高这一条件的情况下, 执行机构动态特性对最终闭环系统的影响是一样的, 都存在一个非线性干扰项. 式(12)也从另外一个侧面说明了增量动态逆方法虽然对系统本体模型不确定性或扰动有一定的抑制能力, 但是对于高于执行机构带宽的部分并不能有效抑制.
2. 非线性影响因素的消除方法
依据上一节的分析, 不管是常规动态逆方法还是增量动态逆方法, 执行结构的低带宽特性(这是相对的概念)都会导致经非线性反馈后的闭环系统不能等价于一个理想的线性系统, 而是有一个非线性干扰项的差异. 动态逆方法(包括增量动态逆)的基本思想就是通过非线性反馈形成一个理想的伪线性系统, 再在此基础上进行线性系统设计, 非线性干扰项的存在使动态逆方法无法获得理想的伪线性系统, 因此要使用动态逆方法进行控制律设计, 必须消除非线性干扰项. 从第1节的分析结果看, 消除非线性项的影响, 可以从两个方向入手, 一个是通过模型参考自适应方法设计补偿器提高执行机构子系统的带宽, 即保证补偿器和执行机构混合系统的等效带宽
${\omega }_{a}'$ 远高于非线性反馈项$ {{f}}\left({{x}}\right) $ 频率, 这个与文献[17-18]中的思想类似, 另一个思路则是直接在非线性反馈项中引入补偿项, 直接对消掉非线性干扰项, 下面就这两类方法展开讨论.2.1 提高等效带宽
参照第1节的推导结果, 若将补偿器和执行机构混合系统的等效带宽
${\omega }_{a}'$ 设定为远高于非线性反馈项$ {{f}}\left({{x}}\right) $ 频率, 则采用动态逆控制律(包括增量动态逆)的闭环系统可以表示成:$$ \dot{{x}}=\frac{{\omega }_{a}'}{s+{\omega }_{a}'}{\dot{{x}}}_{c} $$ (13) 进一步状态变化率指令相对执行机构带宽而言也是低频量, 则上述动态逆控制系统等效为单位阵. 补偿器采用一阶模型参考自适应系统实现, 如图3所示:
执行机构的补偿器分为两种形式, 一种是执行机构模型已知, 另一种是执行机构模型结构已知但参数未知. 对于模型已知的情况,
$ {K}_{{u}_{c}} $ 和$ {K}_{u} $ 可通过下式得到:$$ {K}_{{u}_{c}}=\frac{{\omega }_{a}'}{{\omega }_{a}} \;\;,\;\;\;{K}_{u}=\frac{{{\omega }_{a}-\omega }_{a}'}{{\omega }_{a}} $$ (14) 对于模型未知的情况, 则需要采用模型参考自适应的方式在线调整参数
$ {K}_{{u}_{c}} $ 和$ {K}_{u} $ , 为设计两控制参数的自适应更新律, 引入如下引理:引理 1. 考虑两个信号
$ \alpha $ 和$ {{\varphi }} $ , 它们之间有如下动态关系:$$ \alpha \left(t\right)=H\left(p\right)\left[k{{{\varphi }}}^{\rm{T}}\left({{t}}\right){{v}}\left({{t}}\right)\right] $$ (15) 其中,
$ \alpha \left(t\right) $ 为标量输出信号,$ H\left(p\right) $ 是严格正实的传递函数,$ k $ 是符号已知的未知常数,${{\varphi }}\left({{t}}\right)$ 是关于时间$ t $ 的$ m\times 1 $ 维向量,${{v}}\left({{t}}\right)$ 是可测量的$ m\times 1 $ 维向量. 如果向量${{\varphi }}\left({t}\right)$ 服从如下规律:$$ \dot{{{\varphi }}}\left({{t}}\right)=-{\rm{sgn}}\left({{k}}\right)\gamma \alpha {{v}}\left({{t}}\right) $$ (16) $ \gamma $ 是正常数.$ \alpha \left(t\right) $ 和${{\varphi }}\left({{t}}\right)$ 全局有界, 而且, 如果${{v}}\left({{t}}\right)$ 有界, 那么当$ t\to {\infty } $ 时,$ \alpha \left(t\right)\to 0 $ . 引理的具体证明过程见文献[19].记跟踪误差为:
$$ {e}_{i}={{u}_{i}-u}_{mi} $$ (17) 参数误差定义为控制器参数与理想参数的差:
$$ \tilde K\left( t \right) = \left[ {\begin{array}{*{20}{c}} {{{\tilde K}_{{u_c}}}}\\ {{{\tilde K}_u}} \end{array}} \right] = \left[ {\begin{array}{*{20}{c}} {{{\hat K}_{{u_c}}} - K_{{u_c}}^*}\\ {{{\hat K}_u} - K_u^*} \end{array}} \right] $$ (18) 其中理想参数可以表示为如下形式:
$$ {K}_{{u}_{c}}^{*}=\dfrac{{\omega }_{a}'}{{\omega }_{a}} \;\;,\;\;{K}_{u}^{*}=\dfrac{{{\omega }_{a}-\omega }_{a}'}{{\omega }_{a}} $$ (19) 根据上图中的补偿原理,
$ {u}_{mi} $ 和$ {u}_{i} $ 的动态特性可用下式表示:$$ \left\{ \begin{aligned} &{\dot{u}}_{mi}=-{\omega }_{a}'{u}_{mi}+{\omega }_{a}'{u}_{ci}\\ &{\dot{u}}_{i}=-{\omega }_{a}{u}_{i}+{\widehat{K}}_{{u}_{c}}{\omega }_{a}{u}_{ci}+{\widehat{K}}_{u}{\omega }_{a}{u}_{i}\end{aligned}\right. $$ (20) 两式相减即可得到下式(引入了
${\omega }_{a}'{u}_{i}$ 辅助项):$$ \begin{split} {\dot{e}}_{i}=\;&-{\omega }_{a}'\left({u}_{i}-{u}_{mi}\right)+\left({\omega }_{a}'-{\omega }_{a}+{\widehat{K}}_{u}{\omega }_{a}\right){u}_{i} +\\ &\left({\widehat{K}}_{{u}_{c}}{\omega }_{a}-{\omega }_{a}'\right){u}_{ci} =-\\ &{\omega }_{a}'{e}_{i}+\left(\frac{{\omega }_{a}'-{\omega }_{a}}{{\omega }_{a}}+{\widehat{K}}_{u}\right){\omega }_{a}{u}_{i} +\\ &\left({\widehat{K}}_{{u}_{c}}-\frac{{\omega }_{a}'}{{\omega }_{a}}\right){\omega }_{a}{u}_{ci}\\[-10pt] \end{split} $$ (21) 将式(18)和式(19)代入上式中, 可得到跟踪误差
$ e $ 满足如下微分方程:$$ {\dot{e}}_{i}=-{\omega }_{a}'{e}_{i}+{\omega }_{a}\left({\tilde {K}}_{{u}_{c}}{u}_{ci}+{\tilde {K}}_{u}{u}_{i}\right) $$ (22) 上式写成频域形式为:
$$ {e}_{i}=\frac{{\omega }_{a}}{s+{\omega }_{a}'}\left({\tilde {K}}_{{u}_{c}}{u}_{ci}+{\tilde {K}}_{u}{u}_{i}\right) $$ (23) 参照上面的引理参数
$ {K}_{{u}_{c}} $ 和$ {K}_{u} $ 可以有下面的自适应规律:$$ \left\{ \begin{aligned} &{\dot{\widehat{K}}}_{{u}_{c}}=-{\rm{sgn}}\left({\omega }_{a}\right)\gamma {e}_{i}{u}_{ci}\\ &{\dot{\widehat{K}}}_{u}=-{\rm{sgn}}\left({\omega }_{a}\right)\gamma {e}_{i}{u}_{i}\end{aligned}\right. $$ (24) 下面就上述执行机构动态补偿规律, 证明整个自适应系统稳定性(包含外面的动态逆环节), 具体证明思路是先利用李亚普洛夫方法证明跟踪误差
$ {e}_{i} $ 有界全局渐近收敛, 然后再证明整个闭环动态逆非线性系统的稳定性. 在证明之前先做两项假设:假设 1. 函数矩阵
$G(x) $ 各元素全局有界;假设 2. 设定等效带宽
${\omega }_{a}'$ 远高于非线性系统频率.对于假设1, 大多数物理系统都能够满足假设1, 比如飞行控制系统、机器人系统, 对于假设2则直接与等效带宽方法的思想吻合.
选取如下李亚普洛夫函数:
$$ V\left({e}_{i},K\right)=\frac{1}{2}{e}_{i}^{2}+\frac{1}{2\gamma }\left|{\omega }_{a}\right|\left({\tilde {K}}_{{u}_{c}}^{2}+{\tilde {K}}_{u}^{2}\right) $$ (25) 对李亚普洛夫函数沿系统轨线求导:
$$ \begin{array}{l} \dot{V}\left({e}_{i},K\right)={e}_{i}{\dot{e}}_{i} +\dfrac{1}{\gamma }\left|{\omega }_{a}\right|\left({\tilde {K}}_{{u}_{c}}{\dot{\tilde {K}}}_{{u}_{c}}+{\tilde {K}}_{u}{\dot{\tilde {K}}}_{u}\right) \end{array}$$ (26) 将式(22)和式(24)代入上式可以得到:
$$ \dot{V}\left({e}_{i},K\right)=-{\omega }_{a}'{e}_{i}^{2} $$ (27) 因此执行机构动态补偿子系统是全局稳定的, 即信号
$ {e}_{i} $ 、$ {\tilde {K}}_{{u}_{c}} $ 和$ {\tilde {K}}_{u} $ 都有界, 依据$ {\rm{Barbalat}} $ 引理, 可知跟踪误差$ {e}_{i} $ 全局渐近收敛.下面以跟踪误差
$ {{e}} $ 有界且全局渐近收敛为基础来证明整个自适应系统的稳定性, 根据跟踪误差的定义有下式成立:$$ \begin{split} \dot{{x}}=&{{f}}\left({{x}}\right)+{G}\left({{x}}\right){{u}}= \\ &{{f}}\left({{x}}\right)+{G}\left({{x}}\right){{{u}}}_{{m}}+{G}\left({{x}}\right){{e}} \end{split} $$ (28) 参照动态逆控制律有:
$$ {{{u}}}_{c}={{G}}^{-1}\left({{x}}\right)\left({\dot{{x}}}_{{c}}-{{f}}\left({{x}}\right)\right) $$ (29) 若取
${\dot{{x}}}_{c}={\omega }_{c}\left({{x}}_{c}-{{x}}\right)$ , 其中$ {\omega }_{c} $ 为正常数, 则上式可变为:$$ {{{u}}}_{c}={{G}}^{-1}\left({{x}}\right)\left({\omega }_{c}\left({{x}}_{c}-{{x}}\right)-{{f}}\left({{x}}\right)\right) $$ (30) 参照图3, 有下式成立:
$$ {{{u}}}_{m}=\frac{{\omega }_{a}'}{s+{\omega }_{a}'}{{{u}}}_{c} $$ (31) 将式(30)和式(31)代入式(28)中可得:
$$ \begin{array}{l} \dot{{x}}={{f}}\left({{x}}\right)+\dfrac{{\omega }_{a}'}{s+{\omega }_{a}'}\left({\omega }_{c}\left({{x}}_{c}-{{x}}\right)-{{f}}\left({{x}}\right)\right) +{G}\left({{x}}\right){{e}} \end{array}$$ (32) 参照文中等效带宽思想, 即假设2, 则上式可以简化为:
$$ \begin{split} \dot{{x}}=\;&{\omega }_{c}\left({{x}}_{c}-{{x}}\right)+{G}\left({{x}}\right){{e}} =\\ &-{\omega }_{c}{{x}}+{\omega }_{c}{{x}}_{c}+{G}\left({{x}}\right){{e}} \end{split}$$ (33) 根据上面的证明结果可知, 跟踪误差
$ {{e}} $ 有界且全局渐近收敛, 且函数矩阵$G(x) $ 各元素全局有界(假设1):$$ ||\dot{{x}}+{\omega }_{c}{{x}}||=||{\omega }_{c}{{x}}_{c}+{G}\left({{x}}\right){{e}}||\le D $$ (34) 其中
$ D $ 为一正实数, 参照上式显然有下列条件成立:$$ \left\{ \begin{aligned} &{{{\dot x}_i} < 0,\;\;\;\;\;\;\;\forall \;{x_i} > \frac{D}{{{\omega _c}}}}\\ &{{{\dot x}_i} > 0,\;\;\;\;\;\;\;\forall \;{x_i} < - \frac{D}{{{\omega _c}}}} \end{aligned} \right. $$ (35) 由上式可以得出
$$ \left|{x}_{i}\right|\le \frac{D}{{\omega }_{c}} $$ (36) 因此系统状态
$ {{x}} $ 有界, 且当$ {{e}}\to {\bf{0}} $ 时, 有${{x}}\to $ $ {{x}}_{c}$ 成立.若采用增量动态逆控制律, 则式(16)变为:
$$ {{{u}}}_{c}={{{u}}}_{\rm{0}}+{{G}}^{-1}\left({{x}}\right)\left({\dot{{x}}}_{c}-{\dot{{x}}}_{\rm{0}}\right) $$ (37) 式(19)则变为:
$$ \begin{split} \dot{{x}}=&{{f}}\left({{x}}\right)+\dfrac{{\omega }_{a}'}{s+{\omega }_{a}'}\left({G}\left({{x}}\right){{{u}}}_{\rm{0}}-{\dot{{x}}}_{\rm{0}}\right) +\\ &\dfrac{{\omega }_{a}'}{s+{\omega }_{a}'}{\omega }_{c}\left({{x}}_{c}-{{x}}\right)+{G}\left({{x}}\right){{e}} \end{split}$$ (38) 由假设2, 上式变为:
$$ \begin{array}{l} \dot{{x}}={{f}}\left({{x}}\right)+{G}\left({{x}}\right){{{u}}}_{\rm{0}}+{\omega }_{c}\left({{x}}_{c}-{{x}}\right) -{\dot{{x}}}_{\rm{0}}+{G}\left({{x}}\right){{e}} \end{array} $$ (39) 若增量动态逆控制频率一般都足够高, 因此有
${{x}}_{\rm{0}}\approx {{x}}$ ,${{{u}}}_{\rm{0}}\approx {{u}}$ 成立, 上式可变为:$$ \dot{{x}}={\omega }_{c}\left({{x}}_{c}-{{x}}\right)+{G}\left({{x}}\right){{e}} $$ (40) 上式与式(20)相同, 因此同样可以证明在增量动态逆控制律的作用下, 系统状态
$ {{x}} $ 有界, 且当${{e}}\to $ $ {\bf{0}}$ 时, 有${{x}}\to {{x}}_{c}$ 成立.2.2 直接补偿方法
对于动态逆控制方法, 若将非线性反馈项由
$ {{f}}\left({{x}}\right) $ 改为下式:$$ {{f}}_{m}\left({{x}}\right)={{f}}\left({{x}}\right)+\frac{s}{{\omega }_{a}}{{f}}\left({{x}}\right) $$ (41) 即在原来的非线性反馈项之外再补偿一个微分项, 再代入式(6), 原动态逆闭环系统等效为如下的一阶惯性环节:
$$ \dot{{x}}=\frac{{\omega }_{a}}{s+{\omega }_{a}}{\dot{{x}}}_{c} $$ (42) 对于增量动态逆控制方法, 将状态速率反馈项变为:
$$ {\dot{{x}}}_{{0}{m}}={{f}}\left({{x}}_{\rm{0}}\right)+{G}\left({{{x}}}_{0}\right){{{u}}}_{\rm{0}}+{{f}}\left({{x}}_{\rm{0}}\right)\frac{s}{{\omega }_{a}} $$ (43) 同样在原来的反馈项之外再补偿一个微分项, 代入式(10), 则增量动态逆闭环系统同样等效为如式(42)所示的一阶惯性环节.
这种直接补偿方法需要用到微分信号, 拟采用韩京清提出的非线性跟踪微分器来实现[20], 这种微分器利用二阶最速开关系统跟踪连续输入信号并提取近似微分信号. 存在如下形式的二阶系统:
$$ \left\{ \begin{aligned} &\dot{{x}_{1}}={x}_{2}\\ &\dot{{x}_{2}}=u,\;\;u\le \left|r\right|\end{aligned}\right. $$ (44) 取如下最速控制:
$$ u=-r{\rm{sgn}}\left({x}_{1}-v+\frac{{x}_{2}\left|{x}_{2}\right|}{2r}\right) $$ (45) $ {x}_{1} $ 可以最快速地跟踪信号$ v $ , 当$ {x}_{1} $ 充分接近$ v $ 时,$ {x}_{2} $ 可以作为信号$ v $ 的近似微分, 形成如下的最速跟踪微分器:$$ \left\{ \begin{aligned} &\dot{{x}_{1}}={x}_{2}\\ &\dot{{x}_{2}}=-r{\rm{sgn}}\left({x}_{1}-v+\dfrac{{x}_{2}\left|{x}_{2}\right|}{2r}\right)\end{aligned}\right. $$ (46) 上述的跟踪微分器在进入稳态时容易产生高频颤振, 将符号函数
${\rm{sgn}}$ 改为饱和线性函数${\rm{sat}}$ 也不能完全避免, 因此本文中采用如下改进形式的跟踪微分器(为便于实际应用直接给出离散形式):$$ \left\{ \begin{aligned} &{x}_{1}\left(k+1\right)={x}_{1}\left(k\right)+T{x}_{2}\left(k\right)\\ &{x}_{2}\left(k+1\right)={x}_{2}\left(k\right)+TU\end{aligned}\right. $$ (47) 其中
$ U=fst\left({x}_{1}\left(k\right)-v\left(k\right),{x}_{2}\left(k\right),r,T\right) $ ,$ fst $ 最速控制综合函数, 具体描述如下:$$ \begin{array}{l} fst\left({x}_{1},{x}_{2},r,T\right) =\left\{ \begin{aligned} &-ra/T, \;\;\;\;\;\;\;\,\left|a\right|\le d\\ &-r{\rm{sgn}}\left(a\right), \;\;\;\left|a\right|>d\end{aligned}\right. \end{array} $$ (48) 其中
$$ \left\{ \begin{aligned} &a=\left\{ \begin{aligned} &{x}_{2}+{\rm{sgn}}\left(y\right)\frac{\left({a}_{0}-d\right)}{2},\;\left|y\right|>{d}_{0}\\ &{x}_{2}+y/T , \quad\qquad\qquad\;\left|y\right|\le {d}_{0}\end{aligned}\right.\\ &{a}_{0}=\sqrt{{d}^{2}+8r\left|y\right|},\qquad\qquad\; y={x}_{1}+T{x}_{2}\\ &d=rT,\qquad\qquad\qquad\qquad\;\;\;\;{d}_{0}=r{T}^{2}\end{aligned}\right. $$ (49) 上式中
$ T $ 为时间间隔, 参数$ r $ 与信号本身频率和噪声频率相关, 可依据实际情况选取.3. 仿真验证
采用如下的单入单出的非线性系统为研究对象:
$$ \left\{ \begin{aligned} &\dot{x}={\rm{sin}}{\omega }_{n}x+{\rm{cos}}{\omega }_{n}x+\left(1+{{\rm{e}}}^{-{x}^{2}}\right)u\\ &y=x\end{aligned}\right. $$ (50) 若动态逆的动态指令信号由下式生成:
$$ {\dot{x}}_{c}={\omega }_{c}\left({x}_{c}-x\right) $$ (51) 则对于方法1 (提高等效带宽), 补偿后的理想动态特性由如下传递函数表示:
$$ {G}_{{x}_{c}\to x}=\frac{{\omega }_{c}{\omega }_{a}'}{{s}^{2}+{\omega }_{a}'s+{\omega }_{c}{\omega }_{a}'} $$ (52) 对于方法2 (直接补偿), 补偿后的理想动态特性由如下传递函数表示:
$$ {G}_{{x}_{c}\to x}=\frac{{\omega }_{c}{\omega }_{a}}{{s}^{2}+{\omega }_{a}s+{\omega }_{c}{\omega }_{a}} $$ (53) 3.1 非线性干扰项的影响仿真
首先我们来对采用动态逆控制方法时, 因执行机构低带宽导致的非线性干扰项进行仿真验证, 具体干扰机理见式(7)和式(12), 分别对应常规动态逆方法和增量动态逆方法. 仿真时动态逆控制参数和执行机构模型参数分别取为
${\omega }_{c}=2\;{\rm{rad/s}}$ 和${\omega }_{a}= $ $ 20\;{\rm{rad/s}}$ . 对$ {\omega }_{n} $ 分别取$1\;{\rm{rad/s}}$ ,$10\;{\rm{rad/s}}$ ,$20\;{\rm{rad/s}}$ , 由低到高三个值, 采用常规的动态逆控制方法进行仿真, 图4是三种情况下${{{{f}}}}\left({{x}}\right)$ 的功率谱密度, 图5是不同干扰项的仿真结果, 可见当${{{{f}}}}\left({{x}}\right)$ 含有越多高频能量时, 实际控制响应与预期的控制响应相差越大.参照前面的分析, 增量动态逆与常规动态逆在不考虑状态速率测量误差和控制频率足够高的情况下, 式(7)和式(12)的形式完全一样, 即最终的闭环系统是一致的(线性项和非线性干扰项都一样), 仿真结果如图6所示, 因此本节不再做增量动态逆控制方法的非线性干扰分析, 后面章节中关于非线性干扰项的消除仿真中, 只给出常规动态逆的仿真结果.
3.2 提高等效带宽方法仿真验证
本节主要通过仿真对第2.1节中所提出的非线性干扰抑制方法进行验证, 即提高等效带宽方法, 首先考虑如下三种情况的仿真:
$ Case1 $ 、$Case2\;$ 和$Case3 \;$ 对应的等效带宽$ \left({\omega }_{am}\right) $ 为$20\;{\rm{rad/s}}$ 、$40\;{\rm{rad/s}}$ 和$100\;{\rm{rad/s}}$ , 其他仿真参数为${\omega }_{c}=2\;{\rm{rad/s}}$ 、${\omega }_{n}=20\;{\rm{rad/s}}$ 、${\omega }_{a}= $ $ 20\;{\rm{rad/s}}$ .从图7的仿真结果看, 当等效带宽取为
$20\;{\rm{rad/s}}$ 时, 非线性干扰项的影响完全无抑制,$40\;{\rm{rad/s}}$ 时, 跟踪误差减小, 而等效带宽为$100\;{\rm{rad/s}}$ 时, 系统状态与预期响应$ -Expect $ 基本一致, 可以认为非线性干扰项的影响得到了很好的抑制.对于
$ {\omega }_{a} $ 未知的情况, 考虑如下四种情况的仿真:$ Case4 $ 、$ Case5 $ 、$ Case6 $ 和$ Case7 $ , 其中$ Case4 $ 和$ Case6 $ 对应的${\omega }_{a}=10\;{\rm{rad/s}}$ ,$ Case5 $ 和$ Case7 $ 对应的${\omega }_{a}=30\;{\rm{rad/s}}$ ,$ Case4 $ 和$ Case5 $ 没有引入等效带宽方法,$ Case6 $ 和$\;Case7$ 则是在$ {\omega }_{a} $ 未知的情况下, 引入模型参考自适应控制(Model reference adaptive control, MRAC)方法来提高执行机构的带宽, 其他仿真参数为${\omega }_{c}=2\;{\rm{rad/s}}$ 、${\omega }_{n}= $ $ 20\;{\rm{rad/s}}$ 、${\omega }_{am}=100\;{\rm{rad/s}}$ .从图8的仿真结果看, 对于相同的
$ {\omega }_{n} $ , 未实施提高等效带宽措施的情况下, 越小的$ {\omega }_{a} $ 的非线性干扰影响越大, 而引入模型参考自适应方法后,$ Case6 $ 和$ Case7 $ 的系统状态与预期响应$ -Expect $ 基本一致.3.3 直接补偿方法仿真验证
本节主要通过仿真对第2.2节中所提出的非线性干扰抑制方法进行验证. 通过修正非线性反馈项(Modified nonlinear feedback, MNF)的方式, 对非线性干扰项直接进行补偿, 补偿过程需要用到
${{f}}\left({{x}}\right)$ 项的微分信号, 鉴于微分过程对噪声有放大效应, 因此除考虑各反馈信号无测量误差的情况外, 还考虑了测量噪声对非线性干扰项补偿效果的影响. 首先考虑无噪声, 状态速率和${{f}}\left({{x}}\right)$ 项的微分信号都采用实际值, 采用两种仿真状态进行对比,$ Case1 $ 和$ Case2 $ , 仿真参数为${\omega }_{c}=2\;{\rm{rad/s}}$ 、${\omega }_{n}=20\;{\rm{rad/s}}$ 、${\omega }_{a}=20\;{\rm{rad/s}}$ , 其中$ Case1 $ 没有对非线性干扰项进行补偿,$ Case2 $ 则采用修正非线性反馈项的方式对非线性干扰性进行补偿. 从图9的仿真结果看, 修正非线性反馈项方式可以很好地消除非线性干扰项影响.上述方法虽然可以较好地消除非线性干扰项, 但是由于状态变化率通常不能直接测得, 在获取
${{f}}\left({{x}}\right)$ 项微分信号过程中需要用到的状态变化率是通过状态测量信号微分得到, 具体方法是第2.2节中的非线性跟踪微分器, 依据文献[20], 在采样频率足够高的情况下, 跟踪微分器的带宽与速度因子$ r $ 的关系如下:$$ {\omega }_{TD}=1.14\sqrt{r} $$ (54) 因此在反馈信号有用信息尽可能保留的同时, 滤掉更多高频噪声, 确保微分信号相对平滑. 仿真分四种情况,
$ Case3 $ 、$ Case4 $ 、$ Case5 $ 和$ Case6 $ , 仿真参数为$\; {\omega }_{c}=2\;{\rm{rad/s}}$ 、${\omega }_{n}=20\;{\rm{rad/s}}$ 、${\omega }_{a}=20\;{\rm{rad/s}}$ , 不同的是$ Case3 $ 和$\;Case5$ 虽然引入了跟踪滤波器, 但信号无噪声,$ Case4 $ 和$ Case6 $ 则引入了标准差$\sigma = $ $ 0.01$ 、均值$ \mu =0 $ 的高斯白噪声,$ Case3 $ 和$ Case4 $ 跟踪滤波器的速度因子$ r=30 $ , 而$ Case5 $ 和$ Case6 $ 则取为$ r=100. $ 从图10的仿真结果看, 基于跟踪微分器的直接补偿方法很好地消除了非线性干扰项的影响, 测量噪声的存在只是略微增加了控制误差, 较低的跟踪滤波器带宽
$ \left(r=30\right) $ 由于滤掉了部分有用信息, 控制误差相对较大, 较大的$ r $ 则完全保留了反馈信号的有用信息, 补偿效果较好, 但是会使过多测量噪声进入到反馈信号中, 增加执行机构负担, 所以实际使用过程中依据情况选择一个居中合理值.4. 结论
本文针对非线性动态逆控制中较低执行机构带宽导致的非线性干扰项, 从非线性干扰项的影响机理出发, 提出了两类消除非线性干扰项的方法, 并通过仿真进行了验证. 不管是提高等效带宽方法还是直接补偿方法, 都能较好地消除非线性干扰, 两者不同之处在于, 直接补偿方法是精确的消除了上面的非线性影响, 而提高等效带宽方法则是一个近似方法. 直接补偿方法需要用到
${{{{f}}}}\left({{x}}\right)$ 项的微分信号, 可通过非线性跟踪微分器得到, 只是这类方法严格依赖于系统模型和执行机构模型. 提高等效带宽的方法则在执行机构模型未知的情况, 可引入模型参考自适应方法来克服模型不确定性. -
-
[1] Meyer G, Su R, Hunt L R. Application of nonlinear transformations to automatic flight control. Automatica, 1984, 1(20): 103−107 [2] Lane S H, Stengel R F. Flight control design using nonlinear inverse dynamics. Automatica, 1988, 24(4): 471−483 doi: 10.1016/0005-1098(88)90092-1 [3] Daniel J B, Dale F E. Nonlinear control law with application to high angle-of-attack flight. Journal of Guidance, Control and Dynamics, 1992, 15(3): 761−767 doi: 10.2514/3.20902 [4] Snell S A, Nns D F, Arrard W L. Nonlinear inversion flight control for a supermaneuverable aircraft. Journal of Guidance, Control, and Dynamics, 1992, 15(4): 976−984 doi: 10.2514/3.20932 [5] Da Costa R R, Chu Q P, Mulder J A. Reentry flight controller design using nonlinear dynamic iversion. Journal of Spacecraft and Rockets, 2003, 40(1): 64−71 doi: 10.2514/2.3916 [6] Roenneke A, Well K. Nonlinear flight control for a high-lift reentry vehicle. In: Proceedings of Guidance, Navigation, and Control Conference. Munich, Germany, 1995: 1798−1805 [7] Luca A D, Lucibello P, Ulivi A G. Inversion techniques for trajectory control of flexible robotarms. Journal of Robotic Systems, 1989, 6(4): 325−344 doi: 10.1002/rob.4620060403 [8] Furuta K, Okutani T, Sone H. Computer cont-rol of a double inverted pendulum. Computer & Electrical Engineering, 1978, 5(1): 67−84 [9] Hatakeyama N, Shimada A. Movement control using zero dynamics of two-wheeled inverted pendulum robot. IEEE International Workshop on Advanced Motion Control, 2013, 44(3): 38−43 [10] Enns D, Bugajski D, Hendrick R. Dynamic inversion: an evolving methodology for flight control design. International Journal of control, 1994, 59(1): 71−91 doi: 10.1080/00207179408923070 [11] Joshua H, John V. Direct L1 adaptive nonlinear dynamic inversion control for command augmentation systems. In: Proceedings of Guidance, Navigation, and Control Conference and Exhibit. Kissimmee, Florida, USA: AIAA, 2018. [12] Geiser M, Xargay E, Hovakimyan N, Bierling T, Holzapfel F. L1 adaptive augmented dynamic inversion controller for a high agility UAV. In: Proceedings of Guidance, Navigation, and Control Conference, Portland, Oregon, USA: AIAA, 2011. [13] Yang I, Kim D, Lee D. A flight control strategy using robust dynamic inversion based on sliding mode control. In: Proceedings of Guidance, Navigation, and Control Conference and Exhibit. Mi-nneapolis, Minnesota, USA: AIAA, 2012. [14] Smith P. A simplified approach to nonlinear dynamic inversion based flight control. In: Proceedings of the 23rd Atmospheric Flight Mechanics Conference. Boston, USA: AIAA, 1998. 762−770 [15] 陈海兵, 张曙光, 方振平. 加速度反馈的隐式动态逆鲁棒非线性控制律设计. 航空学报, 2009, 30(4): 597−603 doi: 10.3321/j.issn:1000-6893.2009.04.003Chen Hai-Bing, Zhang Shu-Guang, Fang Zhen-Ping. Implitcit NDI robust nonlinear controldesign with acceleration feedback. ACTA Aeronautica et Astronautica Sinica, 2009, 30(4): 597−603 doi: 10.3321/j.issn:1000-6893.2009.04.003 [16] Grondman F, Looye G H N, Kuchar R O, Chu Q P. Design and flight testing of incremental nonlinear dynamic inversion based control laws for a passenger aircraft. In: Proceedings of Guidance, Navigation, and Control Conference and Exhibit. Kissimmee, Florida, USA: AIAA, 2018. [17] Sieberking S, Chu Q P, Mulder J A. Robust flight control using incremental nonlinear dynamic inversion and angular acceleration prediction. Journal of Guidance Control and Dynamics, 2010, 33(6): 1732−1742 doi: 10.2514/1.49978 [18] 周池军, 朱纪洪. 考虑作动器动态补偿的飞机增量滤波非线性控制. 控制理论与应用, 2017, 34(5): 594−600 doi: 10.7641/CTA.2017.60402Zhou Chi-Jun, Zhu Ji-Hong. Incremental filte-red nonlinear control for aircraft with actuator dynamics compensation. Control Theory and Applications, 2017, 34(5): 594−600 doi: 10.7641/CTA.2017.60402 [19] Slotine J J, Li W, Hall P. Applied Nonlinear Control. Englewood Cliffs, NewJersey: Prentice-Hall, Inc, 1991. 120−130 [20] 韩京清. 从PID技术到自抗扰控制技术. 控制工程, 2002, 9(3): 13−18 doi: 10.3969/j.issn.1671-7848.2002.03.003Han Jing-Qing. From PID technique to active disturbances rejection control technique. Control Engineering of China, 2002, 9(3): 13−18 doi: 10.3969/j.issn.1671-7848.2002.03.003 期刊类型引用(0)
其他类型引用(2)
-