A New Nonlinear Adaptive Switching Control Method Based on Data Driven
-
摘要: 针对一类非线性离散时间动态系统, 提出了一种新的非线性自适应切换控制方法. 该方法首先把非线性项分解为前一拍可测部分与未知增量和的形式, 并充分利用被控对象的大数据信息和知识, 把非线性项前一拍可测数据与未知增量都用于控制器设计, 分别设计了线性自适应控制器, 带有非线性项前一拍可测数据补偿的非线性自适应控制器以及带有非线性项未知增量估计与补偿的非线性自适应控制器. 三个自适应控制器通过切换函数和切换规则来协调控制被控对象. 既保证了闭环系统的稳定性, 同时又提高了闭环系统的性能. 分析了闭环切换系统的稳定性和收敛性. 最后, 通过水箱液位系统的物理实验, 实验结果验证了所提算法的有效性.Abstract: In this paper, a new nonlinear adaptive switching control method is proposed for a class of nonlinear discrete time dynamical systems. The proposed method firstly decomposes the nonlinear term into the form of the measurable part at the previous sampling instant plus its unknown increment part, and makes full use of the big data information and knowledge of the controlled plant, both the measurable part and the unknown increment of the nonlinear term are used in the controller design, the linear adaptive controller, nonlinear adaptive controller with nonlinear term measurable data compensation and nonlinear adaptive controller with nonlinear unknown increment estimation are designed respectively. Three adaptive controllers are used to the controlled plant coordinately through switching functions and switching rules, which not only ensures the stability of the closed-loop system but also improves the performance of the closed-loop system. The stability and convergence of the closed-loop switching system are analyzed. Finally, through the physical experiment of the level control system of the tank, the experimental results verify the effectiveness of the proposed algorithm.
-
Key words:
- Data driven /
- nonlinear systems /
- adaptive control /
- switching system
-
切换控制方法是解决一类难以建立精确数学模型的非线性系统的主要控制方法, 采用多模型切换控制方法的思想可追溯到20世纪70年代[1], 其特点是: 根据被控对象的不确定范围, 以多个模型来逼近对象的全局动态特性, 进而基于多个模型建立相应的控制器, 通过模型(控制器)的调度策略从而达到快速响应外界需要的目的. 自90年代以来, 该方法成为非线性系统控制领域的研究热点[2-5]. Chen和Narendra[6]针对一类零动态渐近稳定的非线性动态系统, 提出了一种带有非线性项估计与补偿的切换控制方法, 并取得了较好的控制效果. 沿着这种切换控制方法的设计思路, 文献[7-11]分别针对一类零动态不稳定的非线性系统, 采用不同的控制策略提出了非线性切换控制方法. 在上述文献中, 为了估计系统的未知非线性项, 分别采用BP (Back propagation)神经网络、高阶神经网络、神经模糊推理系统和模糊逻辑系统等智能工具对非线性项进行估计, 这种估计方法在估计非线性项时往往缺乏考虑非线性项中蕴含的可测数据信息, 造成部分可测数据信息也通过估计算法产生, 存在增大估计误差的可能性. 另外, 在设计线性控制器时, 以往的方法直接忽略非线性项, 并没有充分利用非线性的历史可测数据进行控制器设计, 造成有用数据丢失. 由于数据驱动控制方法是解决机理不明确或含不确定性机理模型的非线性系统建模与控制问题的有效方法[12], 其主要思想是直接利用被控对象的离线、在线数据来描述对象的运行规律和相关模式, 并结合反映系统参数、结构等数据, 实现非线性系统的预报、评价、调度、监控、诊断、决策、优化和控制等的各种期望功能[13-14]. 如文献[15]利用数据驱动方法, 提出了一种新的多状态空间模型状态估计方法. 文献[16]首次提出了一种基于数据驱动的非线性系统交替辨识算法. 另外, 近年来已有不少基于数据驱动的黑箱建模与控制方法(如迭代学习[17]、无模型自适应控制方法[18]和自适应动态规划方法[19-20]等)被提出. 文献[21]把基于模型的控制方法、数据驱动控制方法以及切换控制方法相结合, 优势互补, 提出了基于数据与虚拟未建模动态驱动的非线性切换控制方法, 但该方法在处理系统的虚拟未建模动态时仍然采用了智能估计算法, 该估计方法与文献[7-11]所采用的估计算法本质相同, 有待于进一步改进. 文献[22-24]提出了一种带死区的切换控制方法, 并采用了具有任意切换次数的控制策略. 文献[25-26]采用Backstepping 方法分别研究了一类具有下三角结构的非线性切换控制方法. 文献[27]提出了一种基于神经网络的非线性自适应输出反馈切换控制方法. 上述文献对特定的非线性系统都取得了较好的控制效果, 但仍然存在没有充分利用被控对象过程数据的缺陷. 文献[28-29]对于一类具有全状态约束的非线性系统, 提出一种具有随机切换的自适应智能控制方法, 为研究非线性系统提供了新思路.
综上, 本文在数据驱动控制方法、非线性切换控制方法的基础上, 提出了一种新的基于数据驱动的非线性自适应切换控制方法. 首先, 考虑到被控对象的非线性项历史数据可测, 本文把非线性项分解为前一时刻可测部分与未知增量的和, 并利用非线性项前一时刻的可测数据信息进行控制器设计, 克服了以往方法中没有充分利用非线性项可测数据信息, 造成有用数据信息丢失的不足. 在上述工作的基础上, 结合文献[9]和文献[21]中的未建模动态估计方法, 提出了一种未建模动态未知增量的估计算法, 在简化估计算法的同时, 提高估计精度. 其次, 分别设计了带有非线性项增量估计与补偿的非线性自适应控制器、带有非线性项前一拍数据补偿的非线性控制器和不带非线性补偿的线性自适应控制器, 三个自适应控制器采用改进文献[6]中的切换策略来协调控制被控对象. 这种控制方法结合了多模型切换控制的优势, 同时也充分利用了被控对象的大数据信息和知识, 通过补偿器的设计, 消除了非线性项对闭环系统的不利影响. 通过切换控制策略既保证了闭环系统的稳定性, 同时提高了闭环系统的瞬态性能. 在此基础上, 分析了闭环切换系统的稳定性和收敛性. 最后, 将所提的控制算法通过实验进行验证, 实验结果说明了该新型切换控制算法的有效性. 综上所述, 本文的主要创新点如下:
1) 针对一类难以建立精确数学模型的复杂非线性系统, 充分利用被控对象的过程大数据信息和有用知识, 提出了一种新的基于数据驱动的非线性自适应切换控制方法.
2) 利用数据驱动控制的思想, 将未建模动态的前一时刻可测数据用于控制器设计, 克服了常规切换控制算法没有充分利用数据, 造成有用数据丢失的不足.
3) 给出了所提的新型切换控制算法的设计方法, 并分析了闭环系统的稳定性和收敛性.
1. 控制问题描述
单输入单输出(Sinple-Input Sinple-Output, SISO)离散时间非线性动态系统可描述为:
$$ \begin{split} y(k + \tau ) = & f[y(k), \cdots ,y(k - {n_s} + 1),u(k),\\ &u(k - 1), \cdots ,u(k - {m_s})] \end{split} $$ (1) 其中,
$ \tau $ 为系统的时滞且$1 \le \tau < {n_s},\;$ $u(k) \in{\rm{{R} }}$ ,$y(k) \in {\rm{{R}}}$ , 分别为系统在时刻的输入和输出; 系统阶次$ {n_s} $ 和$ {m_s} $ 已知;$f( \cdot ) \in \rm{R}$ 是连续可微的非线性函数.为简单, 本文研究系统时滞
$ \tau = 1 $ 的一类非线性系统.假设原点
$ (u,y) = (0,0) $ 为上述非线性系统的平衡点, 将系统(1)在原点处Taylor展开得到如下等价模型:$$ \begin{split} y(k + 1) =\,& - {a_1}y(k) - \cdots - {a_{{n_s}}}y(k - {n_s} + 1) + \\ &{{b_0}u(k)\; \cdots + {b_{{m_s}}}u(k - {m_s}) + v[{{x}}(k)]} \end{split} $$ (2) 其中,
$ {a_i},(i = 1, \cdots ,{n_s}) $ ,$ {b_j},(j = 0, \cdots ,{m_s}) $ 为在工作点处的一阶Taylor系数, 分别为$$ \begin{split} & {a_{i} = -\left.\frac{\partial f\left[y(k-1), \cdots, u\left(k-1-n_{s}\right)\right]}{\partial y(k-i)}\right|_{y = 0 \atop u = 0}, }\\ & \qquad\qquad\qquad{ i = 0, \cdots, n_s } \end{split} $$ $$ \begin{split} & {b_{i} = -\left.\frac{\partial f\left[y(k-1), \cdots, u\left(k-1-m_{s}\right)\right]}{\partial u(k-1-j)}\right|_{y = 0 \atop u = 0},}\\ & \qquad\qquad {i = 0, \cdots, m_s } \end{split} $$ $ {{x}}(k) $ 为数据向量, 定义$$ \begin{split} & {{{x}}(k) = }\\ & {[y(k), \cdots ,y(k - {n_s} + 1),u(k), \cdots ,u(k - {m_s})]^{\rm T}} {} \end{split} $$ $ v[{{x}}(k)] $ 是由$ {{x}}(k) $ 的高阶项组成的光滑非线性函数, 称为未建模动态.注1. 若平衡点偏离或远离原点, 可用坐标变换将其移至该点.
利用单位后移算子
$ {z^{ - 1}} $ , 系统(2)可等价地写成如下形式:$$ A({z^{ - 1}})y(k + 1) = B({z^{ - 1}})u(k) + v[{{x}}(k)] $$ (3) 其中,
$ A({z^{ - 1}}) $ 和$ B({z^{ - 1}}) $ 是关于单位延迟算子$ {z^{ - 1}} $ 的多项式, 其阶次分别为$ {n_s} $ 和${m_s} ;\;$ $ A({z^{ - 1}}) $ 和$ B({z^{ - 1}}) $ 的具体表达式如下:$$ A({z^{ - 1}}) = 1 + {a_1}{z^{ - 1}} + \cdots + {a_{{n_s}}}{z^{ - {n_s}}} $$ $$ B({z^{ - 1}}) = {b_0} + {b_1}{z^{ - 1}} + \cdots + {b_{{m_s}}}{z^{ - {m_s}}} $$ 在上述非线性系统(3)中, 由于非线性项
$ v[{{x}}(k)] $ 未知, 因此, 基于此模型设计的控制器无法实现.由式(3)可知:
$$ v[{{x}}(k - 1)] = A({z^{ - 1}})y(k) - B({z^{ - 1}})u(k - 1) $$ (4) 从式(4)可以看出,
$ A({z^{ - 1}}) $ 和$ B({z^{ - 1}}) $ 可通过系统的历史数据信息获得, 从而可间接获得未建模动态前一拍的数据$ v[{{x}}(k - 1)] $ , 因此, 可充分利用$ v[{{x}}(k - 1)] $ 的可测数据信息进行控制器设计. 以往的方法没有考虑该历史数据信息, 从而造成有用数据丢失. 为此, 下面首先将非线性项等价地表示成如下形式:$$ v[{{x}}(k)] = v[{{x}}(k - 1)] + \Delta v[{{x}}(k)] $$ (5) 其中,
$ {\Delta = 1} - {z^{ - 1}} $ ,$$ \Delta v\left[ {{{x}}(k)} \right] = v\left[ {{{x}}(k)} \right] - v\left[ {{{x}}(k - 1)} \right] $$ 则系统(3)可进一步地表示为如下形式:
$$ \begin{split} A({z^{ - 1}})y(k + 1) =\,& B({z^{ - 1}})u(k) +\\ & {v[{{x}}(k - 1)] + {\Delta }v[{{x}}(k)]} \end{split} $$ (6) 假设1. 对任意的
$k ,\;$ 非线性项$ v[{{x}}(k)] $ 的增量$ \Delta v[{{x}}(k)] $ 全局有界, 即$$ \left| {\Delta v[{{x}}(k)]} \right| \le M $$ (7) 其中,
$ M > 0 $ 为已知正数.注2. 事实上, 假设1要求未建模动态的变化率有界, 实际物理系统, 如水箱液位控制系统、倒立摆控制系统, pendubot 欠驱动机械臂控制系统等, 由于受到传感器、执行器以及电子元件等物理特性的限制, 如限幅、饱和特性等, 系统的输入输出信号是有界的, 未建模动态也是有界的, 因此, 假设1是合理的.
控制目标为设计控制器使得:
1)闭环系统的输入输出信号有界, 即闭环系统BIBO (Bounded-input bounded-output)稳定.
2)系统输出渐近跟踪预先给定的有界参考信号的变化.
2. 控制器设计
2.1 系统已知时的控制器设计
由于系统运行的过程中不可避免地存在某种干扰的影响, 导致系统的工作点会偏离平衡点, 此时未建模动态如果过大将会对系统的控制精度以及稳定性和收敛性造成影响, 甚至导致系统不稳定, 因此, 须采用前馈补偿的策略抑制其对闭环系统的影响. 为此, 针对被控对象(6), 设计如图1所示的带有非线性项
$ v[{{x}}(k)] $ 前一拍数据及其未知增量补偿的非线性控制器.由图1可知, 该非线性控制器
$ u(k) $ 可表示为$$\begin{split} & {H({z^{ - 1}})u(k) + G({z^{ - 1}})y(k) = }\\ & \quad {R({z^{ - 1}})w(k + 1) -}\\ & \quad {K({z^{ - 1}})\{ v[{{x}}(k - 1)] + {\Delta }v[{{x}}(k)]\}}\\ \end{split} $$ (8) 给控制器方程(8)乘以
$ B({z^{ - 1}}) $ , 可得:$$ \begin{split} & {H({z^{ - 1}})B({z^{ - 1}})u(k) + B({z^{ - 1}})G({z^{ - 1}})y(k) = }\\ & \quad {B({z^{ - 1}})R({z^{ - 1}})w(k + 1) -}\\ & \quad {B({z^{ - 1}})K({z^{ - 1}})\{ v[{{x}}(k - 1)] + {\Delta }v[{{x}}(k)]\} } \end{split} $$ (9) 由式(6)可得:
$$ \begin{split} B({z^{ - 1}})u(k) =\,& A({z^{ - 1}})y(k + 1) - v[{{x}}(k - 1)] -\\ & { \Delta v[{{x}}(k)]} \end{split} $$ (10) 将式(10)代入式(9), 整理可得闭环系统
$$\begin{split} & {\left[A\left(z^{-1}\right) H\left(z^{-1}\right)+z^{-1} B\left(z^{-1}\right) G\left(z^{-1}\right)\right]y(k+1)}=\\ & \quad {B({z^{ - 1}})R({z^{ - 1}})w(k + 1) + [H({z^{ - 1}}) - }\\ & \quad {B({z^{ - 1}})K({z^{ - 1}})]{\kern 1pt} \{ v[{{x}}(k - 1)] + \Delta v[{{x}}(k)]\}}\\[-10pt] \end{split} $$ (11) 分析闭环系统方程(11)可以看出, 适当选择
$ H({z^{ - 1}}),G({z^{ - 1}}),R({z^{ - 1}}) $ 可以使闭环系统的特征多项式$ \dfrac{{B({z^{ - 1}})R({z^{ - 1}})}}{{H({z^{ - 1}})A({z^{ - 1}}) + {z^{ - 1}}B({z^{ - 1}})\bar G({z^{ - 1}})}} $ 的稳态增益为1. 通过选择$ K({z^{ - 1}}) $ 可以使$ H({z^{ - 1}}) $ 与$B({z^{ - 1}}) K({z^{ - 1}})$ 的差尽可能的小, 以减小未建模动态$ v[{{x}}(k)] $ 对被控对象输出的影响, 从而使被控对象的输出尽可能地跟踪理想输出.针对控制器(8), 选择控制器加权多项式
$ H({z^{ - 1}}) $ 和$ G({z^{ - 1}}) $ 的原则是在保证闭环系统稳定的前提下, 使闭环系统的输出$ y(k + 1) $ 能够很好地跟踪$ w(k + 1) $ , 即:$$ {A({z^{ - 1}})H({z^{ - 1}}) + {z^{ - 1}}B({z^{ - 1}})G({z^{ - 1}}) \ne 0,} \;\;{\left| z \right| \ge 1} $$ (12) 且
$$ {\mathop {\lim }\limits_{k \to \infty } {e_g}(k + 1) = \mathop {\lim }\limits_{k \to \infty } [y(k + 1) - w(k + 1)]} { = 0 } $$ (13) 其中,
$ {e_g}(k + 1) $ 为系统的跟踪误差, 定义为:$$ {e_g}(k + 1) = y(k + 1) - w(k + 1) $$ 从闭环系统方程(11)还可以看出, 设计补偿器
$ K({z^{ - 1}}) $ 是非线性控制器的关键, 如果系统是零动态渐近稳定的, 则选择补偿器的形式为:$$ K({z^{ - 1}}) = \frac{H({z^{ - 1}})} {B({z^{ - 1}})} $$ (14) 如果系统是零动态不稳定的, 则选择补偿器
$ K({z^{ - 1}}) $ 为使得$ H({z^{ - 1}}) $ 与$ B({z^{ - 1}})K({z^{ - 1}}) $ 近似相等的最小二乘解.对上述非线性控制器(8), 如果未建模动态的变化不是十分剧烈, 此时非线性项的增量
$ \Delta v[{{x}}(k)] $ 比较小, 可将其忽略, 直接采用前一时刻未建模动态的可测信息补偿当前时刻的未建模动态, 因此, 设计非线性控制器为$$ \begin{split} & {H({z^{ - 1}})u(k) + G({z^{ - 1}})y(k) = }\\ & \quad {R({z^{ - 1}})w(k + 1) - K({z^{ - 1}})v[{{x}}(k - 1)]} \end{split} $$ (15) 如果被控对象在工作点处运行时, 那么线性化的模型将能表示整个非线性模型的主体部分, 此时可设计不带补偿的控制器作用于被控对象. 故, 将非线性控制器(8)中的
$ v[{{x}}(k)] $ 完全忽略, 直接设计不带非线性项补偿的线性控制器:$$ {H({z^{ - 1}})u(k) + G({z^{ - 1}})y(k) =} {R({z^{ - 1}})w(k + 1)} $$ (16) 2.2 自适应控制算法
考虑到系统的阶次
$ {n_s} $ ,$ {m_s} $ 和时滞$ \tau $ 已知, 但组成$ A({z^{ - 1}}) $ ,$ B({z^{ - 1}}) $ 的参数未知, 由式(6)以及$ A({z^{ - 1}}) $ ,$ B({z^{ - 1}}) $ 多项式的定义, 利用后移算子$ {z^{ - 1}} $ 可将式(6)改写成如下等价形式:$$ \begin{split} & {y(k) = - {a_1}y(k - 1) - {a_2}y(k - 2) - \cdots - }\\ & \quad {{a_{{n_s}}}y(k - {n_s}) + {b_1}u(k - 1)+ {b_2}u(k - 2) + }\\ & \quad {\cdots - {b_{{m_s}}}u(k - {m_s}) + v[{{x}}(k - 1)] + \Delta v[{{x}}(k)]}=\\ & \quad { [ - y(k - 1), \cdots , - y(k - 2),u(k - 1), \cdots ,}\\ & \quad {u(k - {m_s})] {[{a_1}, \cdots ,{a_{{n_s}}},{b_1}, \cdots ,{b_{{m_s}}}]^{\rm T}} +}\\ & \quad {v[{{x}}(k - 1)] + \Delta v[{{x}}(k - 1)]}=\\ & \quad { {{\varphi }}{(k - 1)^{\rm T}}{{\theta }} + v[{{x}}(k - 1)] +}\\ & \quad {\Delta v[{{x}}(k - 1)]}\\[-10pt] \end{split} $$ (17) 其中,
$$ \begin{split} {{\varphi }}^{\rm T}{(k - 1)} =& [ - y(k - 1), \cdots , - y(k - 2), \\ & u(k - 1), \cdots ,u(k - {m_s})] \end{split} $$ $$ {{{\theta }}^{\rm T}} = [{a_1}, \cdots ,{a_{{n_s}}},{b_1}, \cdots ,{b_{{m_s}}}] $$ 2.2.1 线性自适应控制算法
由式(17)可知, 当采用线性控制器时, 系统的参数辨识方程定义为
$$ {\hat y_1}(k + 1) = {{\varphi }}^{\rm T}{(k)}{{\hat{{\theta }}}_1}(k) $$ (18) 其中,
$$ \begin{split} {{\hat{{\theta }}}_1^{\rm T}}{(k)} =\,&[ - {a_{1,1}}(k), \cdots , - {a_{1, {n_s}}}(k),\\ & {{b_{1,1}}(k), \cdots ,{b_{1,{m_s}}}(k)]} \end{split} $$ (19) 表示在
$ k $ 时刻对参数$ {{\theta }} $ 的估计. 采用下面改进的投影算法[6, 30]进行辨识:$$ {{\hat{{\theta }}}_1}(k) = {{\hat{{\theta }}}_1}(k - 1) + \frac{{{\mu _1}(k){{\varphi }}(k - 1){e_1}(k)}}{{1 + {{{\varphi }}^{\rm T}}(k - 1){{\varphi }}(k - 1)}} $$ (20) $$ {\mu _1}(k) = \left\{ {\begin{array}{*{20}{l}} {1,}&{{\mkern 1mu} |{e_1}(k)| > 2M}\\ {0,}&{\text{其他}} \end{array}} \right. $$ (21) $$ {e_1}(k) = y(k) - {\hat y_1}(k) $$ (22) 由式(16)可知, 线性自适应控制器通过下式获得:
$$ \begin{split} & {{\hat H_1}(k,{z^{ - 1}})u(k) + {\hat G_1}(k,{z^{ - 1}})y(k) =}\\ & \quad {{\hat R_1}(k,{z^{ - 1}})w(k + 1)} \end{split} $$ (23) 其中,
$ {\hat H_1}(k,{z^{ - 1}}) $ 、$ {\hat G_1}(k,{z^{ - 1}}) $ 和$ {\hat R_1}(k,{z^{ - 1}}) $ 通过下式在线计算:$$ \begin{split} & {{\hat H_1}(k,{z^{ - 1}}){\hat A_1}(k,{z^{ - 1}}) + {z^{ - 1}}{\hat B_1}(k,{z^{ - 1}}){\hat G_1}(k,{z^{ - 1}})}\ne 0,\\ & \quad {\left| z \right| \ge 1}\\[-10pt] \end{split} $$ (24) $$\begin{split} &{{\hat R}_1}(k,{z^{ - 1}}) \!=\\ &\dfrac{{{\hat H}_1}(k,{z^{ \!-\! 1}}){{\hat A}_1}(k,{z^{ \!-\! 1}}) \!+\! {z^{ \!-\! 1}}{{\hat B}_1}(k,{z^{ \!-\! 1}}){{\hat G}_1}(k,{z^{ \!-\! 1}})}{{{\hat B}_1}(k,{z^{ \!-\! 1}})} \end{split} $$ (25) 2.2.2 带有
$ v[{{x}}(k - 1)] $ 补偿的的非线性自适应控制算法系统(17)的参数辨识方程定义为
$$ {\hat y_2}(k + 1) = {{\varphi }}^{\rm T}{(k)}{{\hat{{\theta }}}_2}(k) + v[{{x}}(k - 1)] $$ (26) 其中,
$$ \begin{split} {{\hat{{\theta }}} _2^{\rm T}}{(k)} =\,& [ - {a_{2,1}}(k), \cdots , - {a_{2,{n_s}}}(k), \\ &{{b_{2,1}}(k), \cdots ,{b_{2,{m_s}}}(k)]} \end{split} $$ (27) 表示在
$ k $ 时刻对参数$ {{\theta }} $ 的估计. 采用类似于(18) ~ (22)的辨识算法[6, 30]得到, 不同的是辨识误差为$$ {e_2}(k) = y(k) - {\hat y_2}(k) $$ (28) 由式(15)和辨识模型(26)可知, 非线性自适应控制器通过下式获得:
$$ \begin{split} & {{\hat H_2}(k,{z^{ - 1}})u(k) + {\hat G_2}(k,{z^{ - 1}})y(k) =}\\ & \quad {{\hat R_2}(k,{z^{ - 1}})w(k + 1) -}\\ & \quad {{\hat K_2}(k,{z^{ - 1}})v[{{x}}(k - 1)]} \end{split} $$ (29) 其中,
$ {\hat H_2}(k,{z^{ - 1}}) $ 、$ {\hat G_2}(k,{z^{ - 1}}) $ 和$ {\hat R_2}(k,{z^{ - 1}}) $ 是非线性自适应控制器参数, 采用类似于式(24) ~ (25)的方式计算. 补偿器$ {\hat K_2}(k,{z^{ - 1}}) $ 通过下式在线计算:$$ {\hat K_2}(k,{z^{ - 1}}) =\frac {{{\hat H}_2}(k,{z^{ - 1}})} {{{\hat B}_2}(k,{z^{ - 1}})} $$ (30) 2.2.3 带有非线性项未知增量估计的非线性自适应控制算法
由式(17)可知, 带有非线性项增量
$ \Delta v[{{x}}(k)] $ 估计的参数辨识方程为$$ \begin{split} \hat y(k + 1) =\,& {{\varphi }}^{\rm T}{(k)}{{\hat{{\theta}}}} _{\bf{3}}(k) + v[{{x}}(k - 1)] + \\] & {\Delta \hat v[{{x}}(k)]} \end{split} $$ (31) 其中,
$ {\hat{{\theta }}}_3 $ 表示在$ k $ 时刻对参数$ {{\theta }} $ 的估计. 定义为$$ \begin{split} {{\hat{{\theta }}} _3^{\rm T}}{(k)} =\,& [ - {a_{3,1}}(k), \cdots , - {a_{3,{n_s}}}(k),\\ & {{b_{3,1}}(k), \cdots ,{b_{3,{m_s}}}(k)]} \end{split} $$ (32) 采用类似于
$ {\hat{{\theta }}} _1 $ 的辨识算法来估计$ {\hat{{\theta }}} _3 $ , 其中$$ {e_3}(k) = y(k) - {\hat y_3}(k) $$ (33) $ \Delta \hat v[{{x}}(k)] $ 是$ \Delta v[{{x}}(k)] $ 的估计值.采用文献[6]和文献[21]提出的估计算法对
$ \Delta v[{{x}}(k)] $ 进行估计. 于是, 由式(8)可知, 非线性自适应控制器为:$$ \begin{split} & {{\hat H_3}(k,{z^{ - 1}})u(k) + {\hat G_3}(k,{z^{ - 1}})y(k) = }\\ & \quad {{\hat R_3}(k,{z^{ - 1}})w(k + 1) -}\\ & \quad {{\hat K_3}(k,{z^{ - 1}})\left\{ {v[{{x}}(k - 1)] + \Delta \hat v[{{x}}(k)]} \right\}} \end{split} $$ (34) 其中,
$ {\hat H_3}(k,{z^{ - 1}}) $ 、$ {\hat G_3}(k,{z^{ - 1}}) $ 、${\hat R_3}(k,{z^{ - 1}})$ 和${\hat K_3} (k, \;{z^{ - 1}})$ 是非线性自适应控制器参数, 采用类似于式(24)~(25)的方式计算.$\Delta \hat v[{{x}}(k)] $ 的值通过估计算法获得.2.3 切换控制
上述线性自适应控制器(23)、非线性自适应控制器(29)以及带有非线性项估计和补偿的非线性自适应控制器(34) 通过下面的切换函数来协调控制被控对象(7), 从而形成一种闭环切换控制系统. 由式(22), (28)和(33)可知, 模型误差越小, 那么以该模型所设计的控制器将会使得闭环系统的输出与理想输出之间的跟踪误差越小, 同时也表明该控制器能更快收敛到以实际被控对象模型为控制器设计模型所设计的控制器. 因此将模型误差
$ {e_1}(k) $ 、${e_2}(k) \;$ 和$ {e_3}(k) $ 引入切换机制, 在某一时刻, 选择较小切换指标所对应的控制器作用于被控对象. 为此, 提出如图2所示的由$ {C_1} $ (线性自适应控制器),$ {C_2} $ (带有非线性项前一拍补偿的非线性自适应控制器),$ {C_3} $ (带有非线性项增量估计器和补偿器的非线性自适应控制器)和切换函数组成的切换控制方法, 其中,$ {C_1} $ 、$ {C_2} $ 和$ {C_3} $ 分别由(23)、(29)和(34)决定.图2中的切换函数为:
$$ \begin{split} {J_j}[{{ e}_j}(k)] =\,& \sum\limits_{l = 1}^k {\frac{{{\mu _j}(l)[{ e}_j^2(l) - 4{M^2}]}}{{2[1 + {{\varphi }}^{\rm T}{{(l - 1)}}{{\varphi }}(l - 1)]}}} +\\ &{c\sum\limits_{l = k - N + 1}^k {[1 - {\mu _j}(l)]{e}_j^2(l} ) } \end{split} $$ (35) $$ {\mu _j}(k) = \left\{ \begin{array}{*{20}{l}} \begin{aligned} & {1,}\quad {|{{ e}_j}(k)| > 2M}\\ & {0,}\quad {\text{其他}} \end{aligned}&{j{\rm{ = 1,2,3}}} \end{array} \right. $$ (36) 其中,
$ {\mu _j}(k),\;(j = 1,2,3) $ 表示死区函数; 当$ j = 1 $ 时,${{ e}_1}(k)$ 表示采用模型(18)时的误差;$ j = 2 $ 时,${{ e}_2}(k)$ 表示采用非线性模型(26)时的误差;$ j = 3 $ 时,${{ e}_3}(k)$ 表示采用非线性模型(31)时的误差.$ N $ 是正整数,$ c \ge 0 $ 是一个常数.任意时刻
$k ,\;$ 切换机制选择最小的切换函数所对应的控制器来控制系统, 即$$ {J^*}(k) ={\rm{ {min}}}\,[{J_j}[{{e}_j}(k)]],j = 1,2,3 $$ (37) 如果
${J^*}(k) = {J_1}[{{ e}_1}(k)]$ , 选择控制器(23);如果
${J^*}(k) = {J_2}[{{ e}_2}(k)]$ , 选择控制器(29);如果
${J^*}(k) = {J_3}[{{ e}_3}(k)]$ , 选择控制器(34).注3. 整个切换函数分为两部分, 第一部分为
$\displaystyle\sum\nolimits_{l = 1}^k {\dfrac{{{\mu _j}(l)[{ e}_j^2(l) - 4{M^2}]}}{{2[1 + {{\varphi }}^{\rm T}{{(l - 1)}}{{\varphi }}(l - 1)]}}}$ , 用来区分不同信号的增长速度, 可以用来保证闭环系统的鲁棒性; 第二部分为$c\displaystyle\sum\nolimits_{l = k - N + 1}^k {[1 - {\mu _j}(l)]{ e}_j^2(l} )$ , 是有限时间内辨识误差的累积, 这部分主要用于提高系统的性能. 因此, 该切换机制在保证闭环系统稳定的同时提高系统的性能.3. 稳定性和收敛性分析
下面给出运用上述非线性自适应控制器设计算法时闭环切换系统的稳定性和收敛性分析.
定理1. 当被控对象(7)满足如下条件1) ~ 3)时具有稳定性和收敛性.
1)系统(1)的零动态渐近稳定;
2)非线性项满足假设条件1;
3)根据式(23) ~ (25)和(30)给出的参数选择方案来适当选择自适应控制器(23)、(29)和(34)中的参数加权多项式
$ {\hat H_i}(k,{z^{ - 1}}) $ 、$ {\hat G_i}(k,{z^{ - 1}}) $ 、$ {\hat R_i}(k,{z^{ - 1}}) $ 和$ {\hat K_i}(k,{z^{ - 1}}) $ ,$ i = 1,2,3 $ ,$ ({\hat K_1}(k,{z^{ - 1}}) = 0) $ . 则把辨识算法(18) ~ (22), 非线性项增量的估计算法以及线性自适应控制器(23)、带有非线性项前一拍补偿的非线性自适应控制器(29)、非线性自适应控制器(34)作用于被控对象(7), 并采用本文的切换控制算法时, 闭环切换系统具有如下特性:1) 闭环系统BIBO稳定, 即:
$$ \left| {u(k)} \right| < \infty ,{\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} {\kern 1pt} \left| {y(k)} \right| < \infty $$ 2) 当
$ k \to \infty $ 时, 系统的跟踪误差有界. 即:$$ \left| {{e_g}(k)} \right| \le \delta $$ 其中, 定义系统的跟踪误差为:
$$ {{e_g}(k) = y(k) - w(k), }\;{\delta \ge 0} $$ 证明. 采用类似于文献[9]与文献[21]的方法可得结论(1) ~ (2)成立, 这里不再赘述.
4. 水箱液位控制系统实验
将本文所提的方法应用在多功能过程控制实验平台上进行水箱的液位控制实验. 如图3所示, 控制目标是通过调节水泵电压占空比, 使得水箱的液位输出值保持在预设定的高度. 实验中, 液位的指定高度为8 cm. 我们针对水箱液位系统进行物理实验, 采样周期为0.1秒. 选择切换函数中的参数
$ N = 2 $ ,$ c = 1 $ . 实验结果如图3 ~ 6 所示.图4为采用本文切换控制方法时水箱液位的实际响应曲线. 由图中可以看出, 系统的跟踪特性较好, 所设计的控制器可以达到控制目标. 由于实际系统是动态变化, 可能受到一些高频干扰或者噪声的影响, 所以系统的跟踪误差收敛到原点的小邻域内. 图5为相对应的同一时间范围内的系统输入的情况. 图6为控制器的切换序列, 从图中可以看出, 大部分时间是非线性自适应控制器在工作, 说明带有补偿的非线性自适应控制器能有效抑制未建模动态对闭环系统的影响.
5 结论
本文针对一类离散时间非线性动态系统, 提出了一种新的非线性自适应切换控制算法, 该算法在设计控制器时, 充分利用了非线性项的历史数据设计了非线性项前一拍补偿的非线性自适应控制器以及带有非线性项增量估计器和补偿器的非线性自适应控制器, 通过切换机制来协调控制系统. 理论分析表明本文提出的控制方法不仅具有稳定性和收敛性, 而且使得闭环系统具有良好的动静态特性. 通过水箱液位控制系统的物理实验, 实验结果进一步验证了所提方法的有效性和优越性.
-
-
[1] Lainiotis D G. Optimal adaptive estimation structure and parameter adaption. IEEE Transactions on Automatic Control, 1971, 16(2): 160−170 doi: 10.1109/TAC.1971.1099684 [2] Narendra K S, Parthasarathy K. Identification and control of dynamical systems using neural networks. IEEE Transactions on Neural Network, 1990, 1(1): 4−27 doi: 10.1109/72.80202 [3] Narendra K S, Balakrishnan J. Improving transient response of adaptive control systems using multiple models and switching. IEEE Transactions on Automatic Control, 1994, 39(9): 1861−1866 doi: 10.1109/9.317113 [4] Narendra K S, Balakrishnan J. Adaptive control using multiple models. IEEE Transactions on Automatic Control, 1997, 42(2): 171−187 doi: 10.1109/9.554398 [5] Narendra K S, Cheng X. Adaptive control of discrete-time systems using multiple models. IEEE Transactions on Automatic Control, 2000, 45(9): 1669−1686 doi: 10.1109/9.880617 [6] Chen L J, Narendra K S. Nonlinear adaptive control using neural networks and multiple models. Automatic, 2001, 37(8): 1245−1255 doi: 10.1016/S0005-1098(01)00072-3 [7] Fu Y, Chai T Y. Nonlinear multivariable adaptive control using multiple models and neural networks. Automatic, 2007, 43(8): 1101−1110 [8] 石宇静, 柴天佑. 基于神经网络与多模型的非线性自适应广义预测控制. 自动化学报, 2007, 33(5): 540−545Shi Yu-Jing, Chai Tian-You. Neural networks and multiple models based nonlinear adaptive generalized predictive control. Acta Automatica Sinica, 2007, 33(5): 540−545 [9] 柴天佑, 张亚军. 基于非线性项补偿的非线性自适应切换控制方法. 自动化学报, 2010, 37(7): 773−786Chai Tian-You, Zhang Ya-Jun. Nonlinear adaptive switching control method based on un-modeled dynamics compensation. Acta Automatica Sinica, 2010, 37(7): 773−786 [10] Chai T Y, Zhai L F, Yue H. Multiple models and neural networks based decoupling control of ball mill coal-pulverizing systems. Journal of Process Control, 2011, 21(3): 351−366 doi: 10.1016/j.jprocont.2010.11.007 [11] Wang Y, Chai T Y, Fu Y, Sun J, Wang H. Adaptive decoupling switching control of the forced-circulation evaporation system using neural networks. IEEE Transactions on Control Systems Technology, 2013, 21(3): 964−974 doi: 10.1109/TCST.2012.2193883 [12] 董泽, 尹二新, 韩璞. 基于迟延估计与Kalman状态跟踪的热工过程动态数据驱动建模. 动力工程学报, 2018, 38(3): 203−210Dong Ze, Yin Er-Xin, Han Pu. Dynamic data driven modeling for thermal processes based on delay estimation and Kalman state tracking. Journal of Chinese Society of Power Engineering, 2018, 38(3): 203−210 [13] Hou Z S and Xu J X. On data-driven control theory: The state of the art and perspective. Acta Automatica Sinica, 2009, 35(6): 650−667 doi: 10.3724/SP.J.1004.2009.00650 [14] Hou Z S, Wang Z. From model-based control to data-driven control: Survey, classification and perspective. Information Science, 2013, 235: 3−35 doi: 10.1016/j.ins.2012.07.014 [15] Ma Y J, Zhao S Y, Huang B. Multiple-model state estimation based on variational bayesian inference. IEEE Transactions on Automatic Control, 2018, 64(4): 1679−1685 [16] 张亚军, 柴天佑, 杨杰. 一类非线性离散时间动态系统的交替辨识算法及应用. 自动化学报, 2017, 43(1): 101−113Zhang Ya-Jun, Chai Tian-You, Yang Jie. Alternating identi?cation algorithm and its application to a class of nonlinear discrete-time dynamical systems. Acta Automatica Sinica, 2017, 43(1): 101−113 [17] He W, Meng T, He X, Ge S S. Unified iterative learning control for flexible structures with input constraints. Automatica, 2018, 96: 326−336 doi: 10.1016/j.automatica.2018.06.051 [18] Dornheim J, Link N, Gumbsch P. Model-free adaptive optimal control of sequential manufacturing processes using reinforcement learning. arXiv preprint arXiv, 2018, 1809.06646. [19] Ma Y J, Zhao S Y, Huang B. Feature extraction of constrained dynamic latent variables. IEEE Transactions on Industrial Informatics, 2019, DOI: 10.1109/TII.2019.2901934. [20] Na J, Li G, Wang B, Herrmann G, Zhan S. Robust optimal control of wave energy converters based on adaptive dynamic programming. IEEE Transactions on Sustainable Energy, 2019, 10(2): 961−970 doi: 10.1109/TSTE.2018.2856802 [21] Chai T Y, Zhang Y J, Wang H, Su C Y, Sun J. Data based virtual un-modeled dynamics driven multivariable nonlinear adaptive switching control. IEEE Transactions on Neural Network, 2011, 22(12): 2154−2172 doi: 10.1109/TNN.2011.2167685 [22] Tong S C, Sui S, Li Y M. Observed-based adaptive fuzzy tracking control for switched nonlinear systems with dead-zone. IEEE Transactions on Cybernetics, 2015, 45(12): 2816−2826 doi: 10.1109/TCYB.2014.2386912 [23] Tong S C, Li Y M. Adaptive fuzzy output feedback control for switched nonlinear systems with unmodeled dynamics. IEEE Transactions on Cybernetics, 2017, 47(2): 295−305 [24] Li Y M, Sui S, Tong S C. Adaptive fuzzy control design for stochastic nonlinear switched systems with arbitrary switchings and unmodeled dynamics. IEEE Transactions on Cybernetics, 2017, 47(2): 403−414 [25] Ma R C and Zhao J. Backstepping design for global stabilization of switched nonlinear systems in lower triangular form under arbitrary switchings. Automatica, 2010, 46(11): 1819−1823 doi: 10.1016/j.automatica.2010.06.050 [26] Liu Y J, Gao Y, Tong S C, Li Y M. Fuzzy approximation-based adaptive backstepping optimal control for a class of nonlinear discretetime systems with dead-zone. IEEE Transactions on Fuzzy Systems, 2016, 24(1): 16−28 doi: 10.1109/TFUZZ.2015.2418000 [27] Long L J, Zhao J. Adaptive output-feedback neural control of switched uncertain nonlinear systems with average dwell time. IEEE Transactions on Neural Network and Learning Systems, 2015, 26(7): 1350−1362 doi: 10.1109/TNNLS.2014.2341242 [28] Sun K K, Mou S H, Qiu J B, Wang T, Gao H J. Adaptive fuzzy control for nontriangular structural stochastic switched nonlinear systems with full state constraints. IEEE Transactions on Fuzzy Systems, 2019, 27(8): 1587−1601 doi: 10.1109/TFUZZ.2018.2883374 [29] Qiu J B, Sun K K, Imre J Rudas, Gao H J. Command filter-based adaptive NN control for MIMO nonlinear systems with full-state constraints and actuator hysteresis. IEEE Transactions on Cybernetics, 2019, 99:1-11. DOI: 10.1109/TCYB.2019.2944761 [30] Goodwin G C, Ramadge P J, Caines P E. Discrete-time multivariable adaptive control. IEEE Transactions on Automatic Control, 1980, 25(3): 449−456 期刊类型引用(9)
1. 王维佳,孙飞,王康,何安明,杨彬彬. 数据驱动的电网主设备异常运行自动控制. 信息技术. 2024(06): 154-159+167 . 百度学术 2. 王娟,朱帅东,朱全民. 基于CNF的饱和切换系统的事件触发控制. 控制与决策. 2024(08): 2631-2636 . 百度学术 3. 谌卓玲,卢绍文,张亚军,潘庆玉. 工业过程指标的平滑交替辨识预报算法. 控制理论与应用. 2024(09): 1539-1547 . 百度学术 4. 李旭生,牛宏,陶金梅. 基于深度学习的非线性广义预测控制. 信息与控制. 2023(02): 202-210 . 百度学术 5. 张超,戈勇,高建兵,孙洪涛,张玉军. 重介质分选过程的多模型切换自适应控制. 煤炭工程. 2023(05): 26-31 . 百度学术 6. 林君萍. 面向不平衡工业大数据集的SVM-tree分类算法研究. 长春师范大学学报. 2022(02): 40-46 . 百度学术 7. 殷秋雯,罗春艳,孙惠. 双体清污船综合减摇自适应控制方法. 电子设计工程. 2022(07): 96-99+104 . 百度学术 8. 姚珺,刘鑫屏. 低压缸零出力运行次末级温度模糊多模型内模控制. 电力科学与工程. 2022(06): 61-69 . 百度学术 9. 陶金梅,牛宏,张亚军,李旭生. 基于随机配置网络的非线性系统智能建模方法. 控制与决策. 2022(10): 2559-2564 . 百度学术 其他类型引用(6)