2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

数据驱动的浮选过程运行反馈解耦控制方法

姜艺 范家璐 贾瑶 柴天佑

严求真, 孙明轩, 李鹤. 任意初值非线性不确定系统的迭代学习控制. 自动化学报, 2016, 42(4): 545-555. doi: 10.16383/j.aas.2016.c150480
引用本文: 姜艺, 范家璐, 贾瑶, 柴天佑. 数据驱动的浮选过程运行反馈解耦控制方法. 自动化学报, 2019, 45(4): 759-770. doi: 10.16383/j.aas.2018.c170552
YAN Qiu-Zhen, SUN Ming-Xuan, LI He. Iterative Learning Control for Nonlinear Uncertain Systems with Arbitrary Initial State. ACTA AUTOMATICA SINICA, 2016, 42(4): 545-555. doi: 10.16383/j.aas.2016.c150480
Citation: JIANG Yi, FAN Jia-Lu, JIA Yao, CHAI Tian-You. Data-driven Flotation Process Operational Feedback Decoupling Control. ACTA AUTOMATICA SINICA, 2019, 45(4): 759-770. doi: 10.16383/j.aas.2018.c170552

数据驱动的浮选过程运行反馈解耦控制方法

doi: 10.16383/j.aas.2018.c170552
基金项目: 

国家自然科学基金 61304028

国家自然科学基金 61533015

中央高校基本科研专项资金 N160804001

国家自然科学基金 61333012

详细信息
    作者简介:

    姜艺  东北大学流程工业综合自动化国家重点实验室博士研究生.2016年获得东北大学控制理论与控制工程硕士学位.主要研究方向为工业过程运行控制, 网络控制, 自适应动态规划, 强化学习.E-mail:JY369356904@163.com

    贾瑶  东北大学流程工业综合自动化国家重点实验室博士研究生.主要研究方向为复杂工业过程控制理论及技术.E-mail:jiayaoneu@163.com

    柴天佑  中国工程院院士, 东北大学教授, IEEEFellow, IFAC Fellow.1985年获得东北大学博士学位.主要研究方向为自适应控制, 智能解耦控制, 流程工业综台自动化理论、方法与技术.E-mail:tychai@mail.neu.edu.cn

    通讯作者:

    范家璐   东北大学流程工业综合自动化国家重点实验室副教授.2011年获得浙江大学控制科学与工程系博士学位(与美国宾夕法尼亚州立大学联合培养).主要研究方向为工业过程运行控制, 工业无线传感器网络与移动社会网络.本文通信作者.E-mail:jlfan@mail.neu.edu.cn

Data-driven Flotation Process Operational Feedback Decoupling Control

Funds: 

National Natural Science Foundations of China 61304028

National Natural Science Foundations of China 61533015

the Fundamental Research Funds for the Central Universities N160804001

National Natural Science Foundations of China 61333012

More Information
    Author Bio:

      Ph. D. candidate at the State Key Laboratory of Synthetical Automation for Process Industries, Northeastern University. He received his master degree in control theory and engineering from Northeastern University in 2016. His research interest covers industrial process operational control, networked control, adaptive dynamic programming, and reinforcement learning

     Ph. D. candidate at the State Key Laboratory of Synthetical Automation for Process Industries, Northeastern University. His research interest covers process control theory and technology for complex industry process

      Academician of Chinese Academy of Engineering, professor at Northeastern University, IEEE Fellow, IFAC Fellow. He received his Ph.D. degree from Northeastern University in 1985. His research interest covers adaptive control, intelligent decoupling control, and integrated automation theory, method and technology of industrial process

    Corresponding author: FAN Jia-Lu   Associate professor at the State Key Laboratory of Synthetical Automation for Process Industries, Northeastern University. She received her Ph. D. degree from Zhejiang University in 2011. She was a visiting scholar with the Pennsylvania State University during 2009~ 2010. Her research interest covers networked operational control, industrial wireless sensor networks, and mobile social networks. Corresponding author of this paper
  • 摘要: 浮选过程是利用矿物本身的亲水或疏气性质或经药剂处理得到的亲水或疏气性质进行矿物分离的物理过程.本文通过建立以矿浆液位和矿浆流量为输入,以浮选过程的精矿品位与尾矿品位为输出的多变量、强耦合、非线性、时变的运行过程模型,利用未建模动态前一拍可测的特点,提出了包括矿物品位运行过程控制器驱动模型、PID控制器、反馈解耦控制器、未建模动态补偿器的数据驱动的一步最优未建模动态补偿PID解耦控制方法,实现了消除稳态误差、静态解耦与未建模动态的补偿,通过浮选过程运行反馈控制仿真实验验证了本文所提方法的有效性.
  • 迭代学习控制技术问世于上世纪80年代初, 适用于重复作业对象的控制器设计, 可实现在整个作业区间上的零误差跟踪 [1]. 当系统在固定区间内重复运行时, 可学习的不确定性虽然随着时间的变化而变化, 但在各次运行中呈现相同的变化规律, 沿迭代轴来看, 同一时刻对应的不确定性为一常值. 由此, 可通过学习方法对其进行估计, 并根据误差不断修正控制输入. 这样, 经过足够多次迭代运行后, 可将闭环系统中可学习的不确定性予以完全补偿, 实现系统状态对参考信号在整个作业区间上的完全跟踪 [2-7]. 至今, 这种控制技术已应用于机械臂、磁盘驱动器和逆变电路等.

    目前, 基于Lyapunov方法设计学习控制系统引起了人们的关注 [2-3]. 在设计学习控制系统过程中, 需要处理各种不确定性, 常见的有线性参数不确定、非线性参数不确定性 [8]和非参数不确定性 [9] 等. 线性参数不确定性又可分为固定常数 [10-11]、不随迭代次数变化的时变参数 [12], 以及随迭代次数变化的时变参数 [13]. 从已经发表的文献数量来看, 非线性参数不确定性和非参数不确定性方面的结果较少. 文献[14]利用界函数设计反馈项补偿非参数不确定性. 文献[15-16] 结合使用鲁棒方法与学习方法处理非参数不确定性. 傅里叶级数等逼近工具也可用于估计该类不确定 [17]. 文献[18]针对控制增益时变的非参数不确定系统, 基于Backstepping方法设计迭代学习控制系统. 文献[19]针对一类同含参数不确定性和非参数不确定性的 非线性系统, 分别提出准最优迭代学习控制算法和准最优重复学习控制算法.

    在应用常规迭代学习控制算法时, 需要在每次迭代开始前进行严格初始定位, 以使系统初态与期望轨迹的起始点完全一致 [3]. 但在实际中, 受复位条件的限制, 系统存在非零误差初值. 因此, 研究适用于任意误差初值的迭代学习控制算法, 不仅具有理论意义, 还可拓宽迭代学习控制技术的应用范围. 针对连续系统的Lyapunov方法初值问题解决方案见文献[20-22]. 文献[20]提出了时变边界层解决方案. 其控制策略是: 经过足够多次迭代后, 闭环系统的滤波误差可以收敛到与迭代初值相关的时变死区中. 文献[21] 给出误差跟踪设计方法, 并将其与参考信号初始修正方法进行对比. 文献[22]研究非参数不确定系统的误差跟踪学习控制算法. 另外, 在参考信号光滑闭合场合, 可采用重复学习控制方法设 计控制器, 该法在运行过程中勿需停顿及复位 [2, 23-24].

    设计自适应或自适应学习控制器时, 为了处理有界的不确定性, 常采用鲁棒方法予以处理. 根据界函数与符号函数设计反馈项可完全补偿不确定性, 但据此设计的控制器在实现时容易发生颤振现象. 为了克服这一不足, 可以采用饱和函数代替符号函数, 实现边界层外的切换控制和边界层内的线性反馈控制. 类似的方法还有单位向量连续化 [25]. 在一些场合, 例如根据反演方法设计控制器时, 为了设计上的方便, 可以采用双曲正切函数代替符号函数 [26]. 文献[27]利用双曲正切函数为严格反馈时变系统设计学习控制器.

    为解决参数/非参数混合不确定系统的轨迹跟踪问题, 针对任意初态的非严格复位系统, 本文 提出基于滤波误差初始修正的自适应迭代学习控制方法. 在构造修正滤波误差后, 采用Lyapunov方法设计迭代学习控制器并进行性能分析, 利用鲁棒手段确保系统变量有界, 处理非参数不确定性后, 将所得的各未知时变参数合并为两个未知时变参数向量, 并通过学习方法分别予以估计. 经过足够多次迭代后, 闭环系统的修正滤波误差在整个作业区间收敛于零, 滤波 误差在预设的部分作业区间上收敛于零. 文中所给出的修正滤波误差构造方案, 具有构造简单实现方便的特点.

    考虑有限时间区间$[0, T]$上重复运行的非线性不确定系统

    $\begin{cases} \dot{x}_{ik}=x_{i+1k}, i=1, 2, \cdots, n-1\\dot{x}_{nk}=f( x_k, t)+g( x_k, t)u_k \end{cases}\label{01cssys} $

    (1)

    式中, $k=0, 1, 2, \cdots$为重复作业次数. ${x}_k=[x_{1k}$, ${x}_{2k}, \cdots, x_{nk}]^{\rm T}\in R^n$为状态向量, $u_k\in R$为控制输入, $f( x_k, t)$与$g( x_k, t)$为不确定性, 未知实数 $g( x_k, t)>0$. 参考信号为${x_d} = {[{x_d}, {{\dot x}_d}, {{\ddot x}_d}, \cdots , {x_d}^{(n - 1)}]^{\rm{T}}}, {x_d}^{(n)}$存在.

    本文考虑系统状态初值$ x_k(0)$, $k=0, 1, 2, \cdots$, 任意情形下的学习控制算法, 拟构造修正滤波误差设计控制器, 在足够多次迭代后, 实现闭环系统的$ x_k$ 在部分作业区间上精确跟踪$ x_d$. 因控制器设计需要, 做如下假设.

    假设 1. 函数

    $f( x_k, t)= \theta^{\rm T}(t) \varphi( x_k, t)+\Delta f( x_k, t) $

    (2)

    其中, $ \theta(t)\in R^m$为未知时变常数, $ \varphi( x_k, t)$为与$ \theta(t)$同维的连续向量, $\Delta f( x_k, t)$满足

    $|\Delta f({\xi _1}, t) - \Delta f({\xi _2}, t)| \le {\alpha _f}({\xi _1}, {\xi _2}, t){\xi _1} - {\xi _2}, \forall {\xi _1} \in {R^n}, \forall {\xi _2} \in {R^n}$

    此处, $\alpha_f(\cdot, \cdot, \cdot)$为非负连续函数.

    假设 2. 函数$g(\cdot, \cdot)$满足

    $|g({\xi _1}, t) - g({\xi _2}, t)| \le {\alpha _g}({\xi _1}, {\xi _2}, t){\xi _1} - {\xi _2}, \forall {\xi _1} \in {R^n}, \forall {\xi _2} \in {R^n}{\rm{ }}$

    其中, $\alpha_g(\cdot, \cdot, \cdot)$为非负连续函数, 且 存在连续函数$g_{m}( x_k, t)$, 满足$0<g_{m}( x_k, t)\leq g( x_k, t)$.

    假设 3. $\partial g({x_k}, t)\partial {x_k} < + \infty $.

    参数不确定性和非参数不确定性是系统中常见的不确定性, 本文在假设性方面的要求较文献[28]低. 为叙述简便, 下文记$g_{m}( x_k, t)$, $ \varphi( x_k, t)$, $\Delta f( x_k, t)$, $g( x_k, t)$, $\Delta f( x_d, t)$, $g( x_d, t)$, $\alpha_f( x_k, x_d$, $t)$, $\alpha_g( x_k, x_d, t)$分别为$g_{mk}$, $ \varphi_k$, $\Delta f_k$, gk, $\Delta f_d$, gd, $\alpha_{fk}$, $\alpha_{gk}$. 在不引起歧义时, 函数的自变量t常被略去.

    ${e_k} = {[{e_{1k}}, {e_{2k}}, \cdots , {e_{nk}}]^{\rm{T}}} = {x_k} - {x_d}{s_k} = {c_1}{e_{1k}} + \cdots + {c_{n - 1}}{e_{n - 1k}} + {e_{nk}}$

    (3)

    选取合适的参数$c_1$, $\cdots$, $c_{n-1}$, 使得多项式$\Delta(p)=$ $p^{n-1}$ $+$ $c_{n-1}p^{n-2}+\cdots+c_2p+c_1$为Hurwitz多项式.

    定义 1.

    $s_{\phi k}=s_k-\phi(t)s_k(0) \label{sfkdef} $

    (4)

    其中, $\phi(t)$为一类连续可导的单调递减函数, 满足$\phi(0)=1$, $\phi(t)=0$ $(\forall t\in [t_1, T])$. 一种可选的$\phi(t)$ 构造方案为 {\small

    $\phi (t) = \left\{ {\matrix{ {{{10{{({t_1} - t)}^3}} \over {t_1^3}} - {{15{{({t_1} - t)}^4}} \over {t_1^4}} + {{6{{({t_1} - t)}^5}} \over {t_1^5}}, } \hfill&{0 \le t \le {t_1}\;0, } \hfill&{{t_1}} \hfill&{ < t \le T\;} \hfill \cr } } \right.$

    本文称$s_{\phi k}$为修正滤波误差, 其与误差$ e_k$的关系满足引理1.

    引理 1. 对于任意$\mu>0$及取值任意的系统初态$ x_k(0)$, 不等式

    $\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} \mu |{s_{\phi k}}|{e_k}{\rm{d}}\tau \le \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _1}(\mu , t)s_{\phi k}^2{\rm{d}}\tau + \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _2}(\tau )\mu |{s_{\phi k}}|{\rm{d}}\tau $

    成立. 其中, $\beta_1(\mu, t)=[\mu+t\|A\|{\rm e}^{\|A\| t}(1+\mu)^2]$, $\beta_2(t)$ $=$ $t\|A \|{\rm e}^{t\|A\|} (|s_k(0)|+\|{ e}_{k}(0)-bs_k(0)\|) +\|{ e}_{k}(0)$ $+$ $ b(\phi(t)-1) s_k(0)\|$, $ b=[0, 0, \cdots, 0, 1]^{\rm T}$,

    $A = \left( {\matrix{ 0&1&0& \cdots &{} \cr 0&0&1& \cdots &{} \cr \vdots & \vdots & \vdots & \ddots & \vdots \cr 0&{ - {c_1}}&{ - {c_2}}& \cdots &{} \cr } } \right)$

    (5)

    证明 . 由式(4)知,

    $\eqalign{ &{{\dot s}_{\phi k}} = {c^{\rm{T}}}{e_k} + {{\dot e}_{nk}} - \eta (t){s_k}(0) \cr &{{\dot e}_k} = A{e_k} + b({{\dot s}_{\phi k}} + \eta (t){s_k}(0)) \cr} $

    (6)

    式中, $ c=[0, c_1, c_2, \cdots, c_{n-1}]^{\rm T}$, $\eta(t)= \dfrac{{\rm d}\phi}{{\rm d}t}$. 对式(6)两边定积分, 可得

    $\eqalign{ &{e_k} = \int_0^t A {e_k}{\rm{d}}\tau + b{s_{\phi k}} + {e_k}(0) - \cr &b{s_{\phi k}}(0) + b{s_k}(0)\int_0^t \eta (\tau ){\rm{d}}\tau = \int_0^t A {e_k}{\rm{d}}\tau + b{s_{\phi k}} + {e_k}(0) + b(\phi (t) - 1){s_k}(0) \cr} $

    (7)

    两边取范数

    ${e_k} \le \int_0^t {A} {e_k}{\rm{d}}\tau + |{s_{\phi k}}| + {e_k}(0) + b(\phi (t) - 1){s_k}(0)$

    利用Bellman引理%

    ${e_k} \le A{{\rm{e}}^{tA}}\int_0^t | {s_{\phi k}}|{\rm{d}}\tau + |{s_{\phi k}}| + {\beta _2}$

    (8)

    在式(8)的两边同乘以${\rm e}^{-\lambda t}\mu|{s}_{\phi k}|$后取定积分, 根据柯西不等式可以推得

    $\eqalign{ &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} \mu |{s_{\phi k}}|{e_k}{\rm{d}}\tau \le A{{\rm{e}}^{At}} \cr &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} \mu (\tau )|{s_{\phi k}}(\tau )|\int_0^v | {s_{\phi k}}(v)|{\rm{d}}v{\rm{d}}\tau + \cr &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} \mu s_{\phi k}^2{\rm{d}}\tau + \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _2}(\tau )\mu |{s_{\phi k}}|{\rm{d}}\tau \le \cr &A{{\rm{e}}^{At}}{[\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} (1 + \mu (\tau ))|{s_{\phi k}}(\tau )|{\rm{d}}\tau ]^2} + \cr &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} \mu s_{\phi k}^2{\rm{d}}\tau + \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _2}(\tau )\mu |{s_{\phi k}}|{\rm{d}}\tau \le \cr &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} [\mu + tA{{\rm{e}}^{At}}{(1 + \mu )^2}]s_{\phi k}^2{\rm{d}}\tau + \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _2}(\tau )\mu |{s_{\phi k}}|{\rm{d}}\tau \cr} $

    文给出了修正滤波误差与系统误差之间的不等式关系, 在下文的控制器设计和收敛性分析中, 将利用该不等式关系处理不确定性.

    对$V_{1k}=\dfrac{1}{2g_k}{\rm e}^{-\lambda t}s_{\phi k}^2$求关于时间的导数, 得

    $\eqalign{ &{{\dot V}_{1k}} = - \lambda {1 \over {2{g_k}}}{{\rm{e}}^{ - \lambda t}}s_{\phi k}^2 + {{\rm{e}}^{ - \lambda t}}[ - {1 \over {2g_k^2}}{{\dot g}_k}s_{\phi k}^2 + {s_{\phi k}}g_k^{ - 1}({c^{\rm{T}}}{e_k} - {x_d}^{(n)} - \eta (t){s_k} \cr &(0) + {\theta ^{\rm{T}}}{\varphi _k}) + {s_{\phi k}}(g_k^{ - 1}\Delta {f_k} + {u_k})] \cr} $

    根据假设1和假设2, 可以推出

    $\begin{align} &{{s}_{\phi k}}{{({{g}_{k}})}^{-1}}\Delta {{f}_{k}}={{s}_{\phi k}}[g_{d}^{-1}\Delta {{f}_{d}}+g_{d}^{-1}(\Delta {{f}_{k}}-\Delta {{f}_{d}})+ \\ &g_{k}^{-1}g_{d}^{-1}({{g}_{d}}-{{g}_{k}})\Delta {{f}_{d}}+g_{k}^{-1}g_{d}^{-1}({{g}_{d}}-{{g}_{k}})(\Delta {{f}_{k}}-\Delta {{f}_{d}})] \\ &\le {{s}_{\phi k}}g_{d}^{-1}\Delta {{f}_{d}}+|{{s}_{\phi k}}|g_{d}^{-1}{{\alpha }_{fk}}{{e}_{k}}+|{{s}_{\phi k}}|g_{k}^{-1}g_{d}^{-1}|\Delta {{f}_{d}}|{{\alpha }_{gk}}{{e}_{k}}+|{{s}_{\phi k}}| \\ &g_{k}^{-1}g_{d}^{-1}{{\alpha }_{fk}}{{e}_{k}}{{\alpha }_{gk}}{{e}_{k}} \\ \end{align}$

    ${{s}_{\phi k}}{{({{g}_{k}})}^{-1}}({{c}^{\text{T}}}{{e}_{k}}+{{\theta }^{\text{T}}}{{\varphi }_{k}}-{{x}_{d}}^{(n)}-\eta (t){{s}_{k}}(0))$

    $\eqalign{ &{s_{\phi k}}{({g_k})^{ - 1}}({c^{\rm{T}}}{e_k} + {\theta ^{\rm{T}}}{\varphi _k} - {x_d}^{(n)} - \eta (t){s_k}(0)) \le {s_{\phi k}}g_d^{ - 1} \cr &({c^{\rm{T}}}{e_k} + {\theta ^{\rm{T}}}{\varphi _k} - {x_d}^{(n)} - \eta (t){s_k}(0)) + \cr &|{s_{\phi k}}|{({g_k}{g_d})^{ - 1}}{e_k}{\alpha _{gk}}|{c^{\rm{T}}}{e_k} + {\theta ^{\rm{T}}}{\varphi _k} - {x_d}^{(n)} - \eta (t){s_k}(0)| \cr} $

    结合以上三式, 有

    $\eqalign{ &{V_{1k}} \le \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} [ - {\lambda \over {2{g_k}}}s_{\phi k}^2 - {1 \over {2g_k^2}}{{\dot g}_k}s_k^2 + \cr &_{\phi k}({p^{\rm{T}}}{\psi _{1k}} + {u_k})]{\rm{d}}\tau + \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\rho _k}|{s_{\phi k}}|{e_k}{\rm{d}}\tau \cr} $

    (9)

    其中,

    $\eqalign{ &{\rho _k} = g_d^{ - 1}{\alpha _{fk}} + g_{mk}^{ - 1}g_d^{ - 1}|\Delta {f_d}|{\alpha _{gk}} + g_{mk}^{ - 1}g_d^{ - 1}{\alpha _{fk}}{\alpha _{gk}}{e_k} \cr & + {({g_{mk}}{g_d})^{ - 1}}{\alpha _{gk}}|{c^{\rm{T}}}{e_k} - {x_d}^{(n)} - \eta (t){s_k}(0)| + {({g_{mk}}{g_d})^{ - 1}}{\alpha _{gk}} \cr &\theta {\varphi _k}\;p = {\left( {\matrix{ {g_d^{ - 1}\Delta {f_d}}&{g_d^{ - 1}}&{g_d^{ - 1}{\theta ^{\rm{T}}}\;} \cr } } \right)^{\rm{T}}}\;{\psi _{1k}} = \cr &1{c^{\rm{T}}}{e_k} - {x_d}^{(n)} - \eta (t){s_k}(0){\varphi _k}^{\rm{T}} \cr} $

    根据引理1,

    $\eqalign{ &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\rho _k}|{s_{\phi k}}|{e_k}{\rm{d}}\tau \le \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _1}({\rho _k}, t)s_{\phi k}^2{\rm{d}}\tau + \cr &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _2}(\tau ){\rho _k}|{s_{\phi k}}|{\rm{d}}\tau = \int_0^t {{{\rm{e}}^{ - \lambda \tau }}} {\beta _1}({\rho _k}, t)s_{\phi k}^2{\rm{d}}\tau + \cr &\int_0^t {{{\rm{e}}^{ - \lambda \tau }}} |{s_{\phi k}}|{\vartheta ^{\rm{T}}}(\tau ){\psi _{2k}}{\rm{d}}\tau \cr} $

    成立. 其中

    $\begin{align} &\vartheta (t)=[g_{d}^{-1}{{l}_{1}}{{\beta }_{5}}, g_{d}^{-1}|\Delta {{f}_{d}}|{{l}_{1}}{{\beta }_{5}}, g_{d}^{-1}\| \\ &\theta \|{{l}_{1}}{{\beta }_{5}}, g_{d}^{-1}{{\beta }_{5}}, g_{d}^{-1}|\Delta {{f}_{d}}|{{\beta }_{5}}, g_{d}^{-1}\|\theta \|{{\beta }_{5}}|{{]}^{\text{T}}} \\ &{{\psi }_{2k}}=\left[ {{l}_{2}}\frac{{{\beta }_{3}}}{{{\beta }_{5}}}, g_{mk}^{-1}{{\alpha }_{gk}}\frac{{{\beta }_{3}}}{{{\beta }_{5}}}, g_{mk}^{-1}{{\alpha }_{gk}}\|{{\varphi }_{k}}\|\frac{{{\beta }_{3}}}{{{\beta }_{5}}}, \right. \\ &{{\left. {{l}_{2}}\frac{{{\beta }_{4}}}{{{\beta }_{5}}}, g_{mk}^{-1}{{\alpha }_{gk}}\frac{{{\beta }_{4}}}{{{\beta }_{5}}}, g_{mk}^{-1}{{\alpha }_{gk}}\|{{\varphi }_{k}}\|\frac{{{\beta }_{4}}}{{{\beta }_{5}}} \right]}^{\text{T}}} \\ &\ {{l}_{1}}=t\|A\|{{\text{e}}^{t\|A\|}}\ \\ &{{l}_{2}}={{\alpha }_{fk}}+g_{mk}^{-1}{{\alpha }_{fk}}{{\alpha }_{gk}}\|{{e}_{k}}\|+g_{mk}^{-1}{{\alpha }_{gk}}|{{c}^{\text{T}}}{{e}_{k}}-\eta (t){{s}_{k}}(0)-{{x}_{d}}^{(n)}| \\ \end{align}$

    其中, $\beta_1$与$\beta_2$的含义见引理1, $\beta_3(t)=(|s_k(0)|$ $+$ $\|{ e}_{k}(0)$ $-$ $ bs_k(0)\|)$, $\beta_4= \|{ e}_{k}(0)+ b(\phi(t)-1) s_k(0)\|$, $\beta_5$ $>$ $0$ 为设计参数.

    将上式的结果应用于式(9), 有

    $\begin{align} &{{V}_{1k}}\le \int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}[\frac{-\lambda }{2{{g}_{k}}}s_{\phi k}^{2}\frac{1}{2g_{k}^{2}}{{{\dot{g}}}_{k}}s_{k}^{2}+{{s}_{\phi k}}({{p}^{\text{T}}}{{\psi }_{1k}}+{{u}_{k}})] \\ &\text{d}\tau +\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}{{\beta }_{1}}({{\rho }_{k}}, t)s_{\phi k}^{2}\text{d}\tau +\int_{0}^{t}{|}{{s}_{\phi k}}|{{\vartheta }^{\text{T}}}{{\psi }_{2k}}\text{d}\tau \\ \end{align}$

    (10)

    由此, 设计控制律

    $\begin{align} &{{u}_{k}}=-p_{k}^{\text{T}}{{\psi }_{1k}}-\vartheta _{k}^{\text{T}}{{\psi }_{2k}}\text{tanh}({{\gamma }_{1}}(k+1)\times \\ &(k+2)\vartheta _{k}^{\text{T}}{{\psi }_{2k}}{{s}_{\phi k}})-\frac{{{s}_{\phi k}}\|{{\psi }_{1k}}\|}{\varepsilon }-\frac{{{s}_{\phi k}}}{\varepsilon {{g}_{mk}}}(1+|{{c}^{\text{T}}}{{e}_{k}}|+\|{{\varphi }_{k}}\|+{{\alpha }_{fk}}\|{{e}_{k}}\|) \\ \end{align}$

    (11)

    其中,

    $\begin{align} & {{p}_{k}}=\text{sat}({{{\hat{p}}}_{k}}) \\ & {{{\hat{p}}}_{k}}=\text{sat}({{{\hat{p}}}_{k-1}})+{{\gamma }_{2}}{{s}_{\phi k}}{{\psi }_{1k}}, {{{\hat{p}}}_{-1}}=0 \\ \end{align}$

    (12)

    $\begin{align} & {{\vartheta }_{k}}=\text{sat}({{{\hat{\vartheta }}}_{k}}) \\ & {{{\hat{\vartheta }}}_{k}}=\text{sat}({{{\hat{\vartheta }}}_{k}}-1)+{{\gamma }_{3}}|{{s}_{\phi k}}|{{\psi }_{2k}}, {{{\hat{\vartheta }}}_{-1}}=0 \\ \end{align}$

    (13)

    式中, $ p_{k}$为对$ p$的估计, $ \vartheta_k$为对$ \vartheta$的估计, $\gamma_1>0$, $\gamma_2$ $>$ $0$, $\gamma_3>0$, $\varepsilon\gg 0$. 对于$\hat a \in R$,

    $\text{sat}(\hat{a})=\left\{ \begin{align} &\bar{a}, |\hat{a}|\text{sgn}(\hat{a})>\bar{a} \\ &\hat{a}, 其他 \\ \end{align} \right.\ $

    (14)

    $\bar{a}$为对应的限幅, 对于向量$\hat { a}$, ${\rm sat}(\hat { a})$ 表示对向量中的各元素进行上述限幅运算.

    在上文的设计过程中, 系统中原有的参数不确定性$ \theta$和非参数不确定性$\Delta f_k$, gk被转化为新的参数不确定性$ p$, $ \vartheta$, 即非参数不确定性的补偿问题被转化为未知时变参数的估计问题. 利用学习方法估计线性时变参数不确定性的已有成果较多, 可以采用部分限幅学习、完全限幅学习或无限幅学习的方法对未知时变参数进行估计. 本文采用的是完全限幅学习方案.

    闭环系统具有的稳定性与收敛性方面的性质可总结为定理1.

    定理1. 在$ x_k(0)$, $k=0, 1, 2, \cdots$, 取值任意的情况下, 将控制律(11)施加于系统(1), 足够多次迭代后, 可使sk在区间$[t_1, T]$上收敛于零, 即

    $\lim_{k\rightarrow +\infty} s_k(t)=0, t\in [t_1, T] $

    (15)

    并保证闭环系统所有信号有界.

    证明 1) 系统变量的有界性 对Lyapunov函数$V_{2k}=\dfrac{1}{2}s_{\phi k}^2$求导

    $\begin{align} &{{{\dot{V}}}_{2k}}={{s}_{\phi k}}({{c}^{\text{T}}}{{e}_{k}}-{{x}_{d}}^{(n)}-\eta {{s}_{k}}(0)+{{\theta }^{\text{T}}}{{\varphi }_{k}}+{{f}_{k}}+{{g}_{k}}{{u}_{k}})\le \\ &|{{s}_{\phi k}}||{{c}^{\text{T}}}{{e}_{k}}|+|{{s}_{\phi k}}|(|{{x}_{d}}^{(n)}|+|{{f}_{d}}|+|\eta {{s}_{k}}(0)|)+|{{s}_{\phi k}}| \\ &\|\theta \|\|{{\varphi }_{k}}\|+|{{s}_{\phi k}}|{{\alpha }_{fk}}\|{{e}_{k}}\|+|{{s}_{\phi k}}|{{g}_{k}}\|{{p}_{k}}\|\|{{\psi }_{1k}}\| \\ &-\frac{{{g}_{k}}s_{\phi k}^{2}}{\varepsilon {{g}_{mk}}}(1+|{{c}^{\text{T}}}{{e}_{k}}|+\|{{\varphi }_{k}}\|+{{\alpha }_{fk}}\|{{e}_{k}}\|)-{{g}_{k}}\frac{s_{\phi k}^{2}\|{{\psi }_{1k}}\|}{\varepsilon } \\ &-{{s}_{\phi k}}\vartheta _{k}^{\text{T}}{{\psi }_{2k}}\text{tanh}({{\gamma }_{1}}(k+1)(k+2)\vartheta _{k}^{\text{T}}{{\psi }_{2k}}{{s}_{\phi k}}) \\ \end{align}$

    (16)

    当$|s_{\phi k}|\geq \varepsilon $时,

    $|{{s}_{\phi k}}||{{c}^{\text{T}}}{{e}_{k}}|-\frac{{{g}_{k}}s_{\phi k}^{2}}{\varepsilon {{g}_{mk}}}|{{c}^{\text{T}}}{{e}_{k}}|\le 0$

    (17)

    $|{{s}_{\phi k}}|{{\alpha }_{fk}}\|{{e}_{k}}\|-\frac{{{g}_{k}}s_{\phi k}^{2}}{\varepsilon {{g}_{mk}}}{{\alpha }_{fk}}\|{{e}_{k}}\|\le 0$

    (18)

    当$|{{s}_{\phi k}}|\ge \varepsilon (|{{x}_{d}}^{(n)}|+|{{f}_{d}}|+|\eta {{s}_{k}}(0)|)$时,

    $|{{s}_{\phi k}}|(|{{x}_{d}}^{(n)}|+|{{f}_{d}}|)-\frac{{{g}_{k}}s_{\phi k}^{2}}{\varepsilon {{g}_{mk}}}\le 0$

    (19)

    当$|s_{\phi k}|\geq \varepsilon \| p_{k}\| $时,

    $|s_{\phi k}|g_k \| p_{k}\| \| \psi_{1k} \| -g_k\frac{s_{\phi k}^2\| \psi_{1k}\|}{\varepsilon }\leq 0 $

    (20)

    当$|s_{\phi k}|\geq \varepsilon \| \theta\| $时,

    $|s_{\phi k}| \| \theta\| \| \varphi_k\| -\frac{g_k s_{\phi k}^2}{\varepsilon g_{mk}}\| \varphi_k\|\leq 0 $

    (21)

    综合式(16) $\sim$ (21), 可知当

    $|{{s}_{\phi k}}|\ge \max (\varepsilon , \varepsilon (|{{x}_{d}}^{(n)}|+|{{f}_{d}}|+|\eta {{s}_{k}}(0)|), \varepsilon \|{{p}_{k}}\|, \varepsilon \|\theta \|)$

    (22)

    时,

    ${{{\dot{V}}}_{2k}}\le -{{s}_{\phi k}}\vartheta _{k}^{\text{T}}{{\psi }_{2k}}\text{tanh}({{\gamma }_{1}}(k+1)(k+2)\vartheta _{k}^{\text{T}}{{\psi }_{2k}}{{s}_{\phi k}})$

    根据双曲函数的性质可知

    ${{\gamma }_{1}}(k+1)(k+2){{s}_{\phi k}}\vartheta _{k}^{\text{T}}{{\psi }_{2k}}\times \text{tanh}({{\gamma }_{1}}(k+1)(k+2)\vartheta _{k}^{\text{T}}{{\psi }_{2k}}{{s}_{\phi }}k)\ge 0$

    结合以上两式, 可以推出满足条件(22)时

    $\dot V_{2k}\leq 0 $

    (23)

    由此可以得到$s_{\phi k}$的有界性, 在此基础上, 结合饱和函数的性质, 易得其他变量也为有界.

    2) 误差的收敛性 选择Lyapunov泛函

    ${{L}_{k}}={{V}_{1k}}+\frac{1}{2{{\gamma }_{2}}}\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}\tilde{p}_{k}^{\text{T}}{{{\tilde{p}}}_{k}}\text{d}\tau \frac{1}{2{{\gamma }_{3}}}\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}\tilde{\vartheta }_{k}^{\text{T}}{{{\tilde{\vartheta }}}_{k}}\text{d}\tau $

    (24)

    式中, $\tilde{ p}_{k}= p-p_{k}$, $\tilde{ \vartheta}_{k}= \vartheta-\vartheta_{k}$.

    前文已证闭环系统变量均为有界, 结合假设3, 可知取足够大的$\lambda$, 由式(10)和式(11), 可得

    $\begin{align} &{{V}_{1k}}\le \int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}[{{s}_{\phi k}}\tilde{p}_{k}^{\text{T}}{{\psi }_{1k}}+|{{s}_{\phi k}}|\tilde{\vartheta }_{k}^{\text{T}}{{\psi }_{2k}}+ \\ &|{{s}_{\phi k}}|\vartheta _{k}^{\text{T}}{{\psi }_{2k}}-{{s}_{\phi k}}\vartheta _{k}^{\text{T}}{{\psi }_{2k}}\times \text{tanh}({{\gamma }_{1}}(k+1)(k+2)\vartheta _{k}^{\text{T}}{{\psi }_{2k}}{{s}_{\phi k}})]\text{d}\tau \\ \end{align}$

    对于$a\in R$, $\varepsilon>0$, 不等式$0\le |a|-a\text{tanh}({{a}_{\varepsilon }})\le {{\delta }_{\varepsilon }}$成立 [26-27], 式中$\delta$为一常数, 满足$\delta ={{\text{e}}^{-}}(\delta +1)$, 其值为0.2785. 于是, 可知

    $\begin{align} &|{{s}_{\phi k}}|\vartheta _{k}^{\text{T}}{{\psi }_{2k}}-{{s}_{\phi k}}\vartheta _{k}^{\text{T}}{{\psi }_{2k}}\text{tanh}({{\gamma }_{1}}(k+1)\times (k+2)\vartheta _{k}^{\text{T}}{{\psi }_{2k}}{{s}_{\phi k}}) \\ &\le \delta {{\gamma }_{1}}(k+1)(k+2) \\ \end{align}$

    (25)

    成立. 据此, 可以推出

    ${{V}_{1k}}\le \int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}({{s}_{\phi k}}\tilde{p}_{k}^{\text{T}}{{\psi }_{1k}}+|{{s}_{\phi k}}|\tilde{\vartheta }_{k}^{\text{T}}{{\psi }_{2k}})\text{d}\tau +\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}{{\gamma }_{1}}(k+1)(k+2)\text{d}\tau $

    (26)

    由式(26)及式(24), 知

    $\begin{align} &{{L}_{k}}-{{L}_{k-1}}\le \int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}({{s}_{\phi k}}\tilde{p}_{k}^{\text{T}}{{\psi }_{1k}}+|{{s}_{\phi k}}|\tilde{\vartheta }_{k}^{\text{T}}{{\psi }_{2k}})\text{d}\tau + \\ &\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}\delta {{\gamma }_{1}}(k+1)(k+2)\text{d}\tau -{{V}_{1k-1}}+\frac{1}{2{{\gamma }_{2}}}\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}(\tilde{p}_{k}^{\text{T}}{{{\tilde{p}}}_{k}}-\tilde{p}_{k-1}^{\text{T}}{{{\tilde{p}}}_{k-1}})\text{d}\tau + \\ &\frac{1}{2{{\gamma }_{3}}}\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}(\tilde{\vartheta }_{k}^{\text{T}}{{{\tilde{\vartheta }}}_{k}}-\tilde{\vartheta }_{k-1}^{\text{T}}{{{\tilde{\vartheta }}}_{k-1}})\text{d}\tau \\ \end{align}$

    (27)

    利用学习律(12)和(13), 分别可以推出

    $\begin{align} &\frac{1}{2{{\gamma }_{2}}}\left( \tilde{p}_{k}^{\text{T}}{{{\tilde{p}}}_{k}}-\tilde{p}_{k-1}^{\text{T}}{{{\tilde{p}}}_{k-1}} \right)+{{s}_{\phi k}}\tilde{p}_{k}^{\text{T}}{{\psi }_{1k}}\le \\ &-\frac{1}{{{\gamma }_{2}}}(p-{{p}_{k{{)}^{\text{T}}}(p}}_{k}-{{p}_{k-1}})+{{s}_{\phi k}}\tilde{p}_{k}^{\text{T}}{{\psi }_{1k}}= \\ &\frac{1}{{{\gamma }_{2}}}{{(p-{{p}_{k}})}^{\text{T}}}(-{{p}_{k}}+{{p}_{k-1}}+{{\gamma }_{2}}{{s}_{\phi k}}{{\psi }_{1k}})= \\ &\frac{1}{{{\gamma }_{2}}}{{(p-\text{sat}({{{\hat{p}}}_{k}}))}^{\text{T}}}({{{\hat{p}}}_{k}}-\text{sat}({{{\hat{p}}}_{k}}))\le 0 \\ \end{align}$

    (28)

    $\begin{align} &\frac{1}{2{{\gamma }_{3}}}\left( \tilde{\vartheta }_{k}^{\text{T}}{{{\tilde{\vartheta }}}_{k}}-\tilde{\vartheta }_{k-1}^{\text{T}}{{{\tilde{\vartheta }}}_{k-1}} \right)+|{{s}_{\phi k}}|{{{\tilde{\vartheta }}}_{k}}{{\psi }_{2k}}\le -\frac{1}{{{\gamma }_{3}}}{{({{\vartheta }_{k}}-{{\vartheta }_{k-1}})}^{\text{T}}}{{{\tilde{\vartheta }}}_{k}}+ \\ &|{{s}_{\phi k}}|{{{\tilde{\vartheta }}}_{k}}{{\psi }_{2k}}=\frac{1}{{{\gamma }_{3}}}{{(-{{\vartheta }_{k}}+{{\vartheta }_{k-1}}+{{\gamma }_{3}}|{{s}_{\phi k}}|)}^{\text{T}}}{{{\tilde{\vartheta }}}_{k}}{{\psi }_{2k}}= \\ &\frac{1}{{{\gamma }_{3}}}{{({{{\hat{\vartheta }}}_{k}}-\text{sat}({{{\hat{\vartheta }}}_{k}}))}^{\text{T}}}(\vartheta -\text{sat}({{{\hat{\vartheta }}}_{k}}))\le 0 \\ \end{align}$

    (29)

    将式(28)和式(29)的结果应用于式(27)

    ${{L}_{k}}-{{L}_{k-1}}\le {{\int }_{0}}^{t}{{\text{e}}^{-\lambda \tau }}\delta {{\gamma }_{1}}(k+1)(k+2)\text{d}\tau -{{V}_{1k-1}}$

    进一步地

    ${{L}_{k}}\le {{L}_{0}}+\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}\sum\limits_{i=1}^{k}{\delta {{\gamma }_{1}}}(i+1)(i+2)\text{d}\tau -\sum\limits_{i=0}^{k-1}{\left( \frac{1}{2{{g}_{i}}}{{\text{e}}^{-\lambda t}}s_{\phi i}^{2} \right)}$

    由于$L_0$为非负有界量, 且

    $\begin{align} &\underset{k\to +\infty }{\mathop{\lim }}\,\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}\sum\limits_{i=1}^{k}{\delta {{\gamma }_{1}}}(i+1)(i+2)\text{d}\tau =\frac{\delta }{{{\gamma }_{1}}\lambda }\left( 1-{{\text{e}}^{-\lambda t}} \right) \\ &\underset{k\to +\infty }{\mathop{\lim }}\,\left( \frac{1}{2}-\frac{1}{3}+\frac{1}{3}-\cdots - \right.\left. \frac{1}{k+1}+\frac{1}{k+1}-\frac{1}{k+2} \right)<{{\frac{\delta }{2{{\gamma }_{1}}\lambda }}_{k}} \\ \end{align}$

    (30)

    是有界的, 故根据数列收敛的必要性, 可知

    $\lim_{k\rightarrow +\infty}s_{\phi k}=0 $

    (31)

    至此, 根据$s_{\phi k}$的定义, 可得

    $\lim_{k\rightarrow +\infty} s_k(t)= 0, t\in [t_1, T] $

    上文给出了基于滤波误差初始修正的自适应迭代学习控制方法, 适用于系统初态任意情形. 经过足够多次迭代后, 籍由$s_{\phi k}$在整个作业区间收敛于零, 实现了sk 在预设的部分作业区间收敛于零.

    应该注意的是, 严格复位即$ x_k(0)= x_d(0)$, $k=$ $0, 1, 2, \cdots$ 情形, 属本文所考虑情形的一种特殊情况. 在此情况下, $s_k(0)=0$, $ e_k(0)=0$, $s_{\phi k}=s_k$, 引理1结论中的$\beta_2=0$, 控制律(11)中的$ \psi_{2k}= 0$. 引理1的结论及控制律(11)分别退化为

    $\int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}{{\mu }_{k}}|{{s}_{\phi k}}|\|{{e}_{k}}\|\text{d}\tau \le \int_{0}^{t}{{{\text{e}}^{-\lambda \tau }}}{{\beta }_{1}}({{\mu }_{k}}, t)s_{\phi k}^{2}\text{d}\tau $

    ${{u}_{k}}=-p_{k}^{\text{T}}{{\psi }_{1k}}-\frac{{{s}_{k}}\|{{\psi }_{1k}}\|}{\varepsilon }-\frac{{{s}_{k}}}{\varepsilon {{g}_{mk}}}(1+|{{c}^{\text{T}}}{{e}_{k}}|+\|{{\varphi }_{k}}\|+{{\alpha }_{fk}}\|{{e}_{k}}\|)$

    (32)

    其中, $ p_{k}$的取值同式(12). 相应的收敛性质可总结为定理2.

    定理2. 在$ x_k(0)= x_d(0)$, $k=0, 1, 2, \cdots$ 情形下, 将控制律(32)施加于系统(1), 足够多次迭代后, 可使sk在整个作业区间$[0, T]$上收敛于零, 即

    $\lim_{k\rightarrow + \infty} s_k(t)= 0, t\in [0, T] $

    (33)

    并保证闭环系统中的所有信号有界.

    容易看出, 修正滤波误差的构造方法简单. 由上文的设计和分析过程可以看出, 采用滤波误差初始修正方法设计控制器, 勿需进行分类讨论, 由此具有使用上的便捷性. 经过足够多次迭代后, 可实现滤波误差在预设的部分作业区间收敛于零.

    考虑如下倒立摆系统

    $\begin{align} &{{{\dot{x}}}_{1k}}={{x}_{2k}}dot{{x}_{2k}}=g\sin {{x}_{1k}}-\frac{mlx_{2k}^{2}\cos {{x}_{1k}}\sin {{x}_{1k}}}{{{m}_{c}}+m} \\ &l\left( \frac{4}{3}-\frac{m{{\cos }^{2}}{{x}_{1k}}}{{{m}_{c}}+m} \right)+\frac{\cos {{x}_{1k}}}{{{m}_{c}}+m}l\left( \frac{4}{3}-\frac{m\text{co}{{\text{s}}^{2}}{{x}_{1k}}}{{{m}_{c}}+m} \right){{u}_{k}} \\ \end{align}$

    (34)

    这里, $x_{1k}$和$x_{2k}$分别是倒立摆的角位移与角速度, $x_{1k}(0)=1.2+0.1(r_1-0.5)$, $x_{2k}(0)=$ $-0.2$ $+$ $0.05r_2$, $r_1$和$r_2$均为0 $\sim$ 1之间的随机数. $g=9.8 {\rm m}/{\rm s}^2$为重力加速度, $m_c=1$ kg是小车的质量, $m=0.1$ kg为摆的质量, $l=0.5$ m为摆长的一半, uk为小车的推力. 参考信号是$[{\cos}(\pi t), -\pi{\sin} (\pi t)]^{\rm T}$. $[x_{1 k}(0), x_{2k}(0)]^{\rm T}\neq[1, 0]^{\rm T}$. 视 $g\sin {{x}_{1k}}-\frac{mlx_{2k}^{2}\cos {{x}_{1k}}\sin {{x}_{1k}}}{{{m}_{c}}+m}l(\frac{4}{3}-m{{\cos }^{2}}{{x}_{1k}}{{m}_{c}}+m)$和 $\frac{\cos {{x}_{1k}}}{{{m}_{c}}+m}l(\frac{4}{3}-m{{\cos }^{2}}{{x}_{1k}}{{m}_{c}}+m)$分别为$\Delta f_k$和gk. 考虑到实际系统存在的多种不确定性和扰动, 设各参数与标称值存在$\pm 40 % $的偏差, 取

    $\begin{align} &{{g}_{mk}}=\frac{|{{\cos }_{1k}}|}{1.44+0.23\cos _{1k}^{2}}{{\alpha }_{fk}}= \\ &\frac{ml\max (|{{x}_{2k}}|, |{{{\dot{x}}}_{d}}|){{m}_{c}}+m}{l}{{\left( \frac{4}{3}-\frac{m}{{{m}_{c}}+m} \right)}^{2}} \\ &+g+ml\max (x_{2k}^{2}, \dot{x}_{d}^{2})2({{m}_{c}}+m)l\left( \frac{4}{3}-\frac{m}{{{m}_{c}}+m} \right)+ \\ &\max (x_{2k}^{2}, \dot{x}_{d}^{2})2({{m}_{c}}+m)l{{\left( \frac{4}{3}-\frac{m}{{{m}_{c}}+m} \right)}^{2}}\times \frac{m}{{{m}_{c}}+m}{{\alpha }_{gk}}= \\ &\frac{1}{{{m}_{c}}+m}l\left( \frac{4}{3}-\frac{m}{{{m}_{c}}+m} \right)+\frac{\frac{1}{{{m}_{c}}+m}}{l{{\left( \frac{4}{3}-\frac{m}{{{m}_{c}}+m} \right)}^{2}}} \\ \end{align}$

    采用控制律(11)及相应学习律进行仿真. 仿真参数取 $\gamma_1=1$, $\gamma_2=5$, $\gamma_3=0.01$, $\varepsilon=100$, $\bar{p}=20$, $\bar{ \vartheta}$ $=$ $80$, $c_1=10$, $T=2$, $t_1=0.3$, $\beta_5=10$, $\beta_1$, $\beta_2$, $\beta_3$, $\beta_4$的含义见前文. 采用第2节给出的方案构造$\phi(t)$. 迭代30 次后, 仿真结果如图 1 $\sim$ 图 6所示. 图 1图 2是第30次迭代时的系统状态情况. 图 3图 4分别是第30次迭代过程中的状态误差和控制输入情况. 图 5是在$k=1, 5, 10, 20, 30$ 等次迭代过程中的滤波误差情况, 可以看出, 经过足够多次迭代后, 可实现滤波误差sk在$[t_1, T]$上的取值为零. 图 6Jk的收敛过程, 在该图中, $J_{k}= \max_{t\in[0, T]} |s_{\phi k}(t)| $.

    图 1  x1 及其期望轨迹x1d
    Fig. 1  x1 and its desired trajectory x1d
    图 2  x2 及其期望轨迹x2d
    Fig. 2  x2 and its desired trajectory x2d
    图 3  误差e1e2
    Fig. 3  The errors e1 and e2
    图 4  控制输入
    Fig. 4  Control input
    图 5  滤波误差sk
    Fig. 5  Filtering-error sk
    图 6  Jk 收敛过程
    Fig. 6  The convergence performance of Jk

    本文与文献[22]采用仿真模型相同, 在上文的仿真中, 参数学习律的增益取值为5, 而在文献[22]的仿真中, 学习律的增益取值为30. 对比之下, 本文所提方法在学习增益较小的情况下, 仍具有较快的误差收敛速度.

    为了进一步说明本文所提设计方法的有效性, 下面采用文献[20]所提的时变边界层方案解决相同问题, 迭代学习模糊控制器取

    $u_k=u_{1k}+u_{2k} $

    (35)

    其中,

    $\begin{align} &{{u}_{1k}}=w_{fk}^{\text{T}}(t){{z}_{f}}({{x}_{k}})+w_{gk}^{\text{T}}(t){{z}_{g}}({{x}_{k}}){{\varpi }_{k}}- \\ &\text{sat}\left( \frac{{{s}_{k}}}{{{v}_{k}}} \right){{\epsilon }_{k}}(1+{{\varpi }_{k}}){{u}_{2k}}=-{{\gamma }_{4}}{{s}_{vk}}z_{f}^{\text{T}}({{x}_{k}}){{z}_{f}}({{x}_{k}})- \\ &{{\gamma }_{5}}{{s}_{vk}}z_{g}^{\text{T}}({{x}_{k}}){{z}_{g}}({{x}_{k}})\varpi _{k}^{2}-{{\gamma }_{6}}{{s}_{vk}}{{(1+{{\varpi }_{k}})}^{2}}{{\varpi }_{k}}= \\ &-{{c}_{1}}{{e}_{2k}}+{{{\ddot{x}}}_{d}}-{{\gamma }_{7}}{{s}_{vk}}\ {{w}_{fk}}={{{\hat{w}}}_{fk}}=\text{sat}({{{\hat{w}}}_{fk-1}})-{{\gamma }_{8}}{{s}_{vk}}{{z}_{f}}({{x}_{k}}), {{{\hat{w}}}_{f-1}}=0 \\ &{{w}_{gk}}=\text{sat}({{{\hat{w}}}_{gk}}){{{\hat{w}}}_{gk}}=\text{sat}({{{\hat{w}}}_{gk-1}})-{{\gamma }_{9}}{{s}_{vk}}{{z}_{g}}({{x}_{k}}), \\ &{{{\hat{w}}}_{g-1}}=0{{n}_{k}}=\text{sat}({{\epsilon }_{k}}=\text{sat}({{{\hat{\epsilon }}}_{k}})+{{\gamma }_{10}}{{s}_{vk}}(1+|{{\omega }_{k}}|), {{{\hat{\epsilon }}}_{-1}}=0 \\ \end{align}$

    (36)

    式中, $s_{vk} =s_k-v_k{\rm sat}({s_k}/{v_k})$, $v_k=|c_1e_{1k}(0)+e_{2k}(0)|{\rm e}^{-\sigma t}$, $\sigma>0$.

    模糊基函数$ z_{f}( x_k)$与$ z_{g}( x_k)$ 均采用下述属函数构造

    $\begin{align} &{{\mu }_{1}}({{x}_{i}})=1+{{\text{e}}^{5({{x}_{i}}+2)}} \\ &{{\mu }_{2}}({{x}_{i}})={{\text{e}}^{-{{({{x}_{i}}+1.5)}^{2}}}} \\ &{{\mu }_{3}}({{x}_{i}})={{\text{e}}^{-{{({{x}_{i}}+0.5)}^{2}}}} \\ &{{\mu }_{4}}({{x}_{i}})={{\text{e}}^{-{{({{x}_{i}}-0.5)}^{2}}}} \\ &{{\mu }_{5}}({{x}_{i}})={{\text{e}}^{-{{({{x}_{i}}-1.5)}^{2}}}} \\ &{{\mu }_{6}}({{x}_{i}})=1+{{\text{e}}^{-5({{x}_{i}}-2)}} \\ \end{align}$

    $i=1, 2$. 具体构造方法见文献[20]的第2节. 不难看出, $ z_{f}( x_k)$与$ z_{g}( x_k)$ 均为36维的向量.

    仿真参数取 $\gamma_4=\gamma_5=\gamma_6=\gamma_7=\gamma_8=\gamma_9=5$, $\gamma_{10}$ $=$ $0.01$, $\bar{w}_f=100$, $\bar{w}_g=100$, $\bar{\epsilon}=30$, $\sigma=5$, $c_1$的取值同前. 迭代30 次后, 仿真结果如图 7 $\sim$ 图 11所示. 图 7图 8是第30次迭代时的系统状态情况. 图 9图 10分别是第30次迭代过程中的状态误差和控制输入情况. 图 11Jk的收敛过 程, 在该图中, $J_{k}= \max_{t\in[0, T]} |s_{v k}(t)| $.

    图 7  x1 及其期望轨迹x1d
    Fig. 7  x1 and its desired trajectory x1d
    图 8  x2 及其期望轨迹x2d
    Fig. 8  x2 and its desired trajectory x2d
    图 9  误差e1 和e2
    Fig. 9  The errors e1 and e2
    图 10  控制输入
    Fig. 10  Control input
    图 11  Jk 收敛过程
    Fig. 11  The convergence performance of Jk

    对比图 1图 2图 7图 8, 可以看出 本文提出的基于滤波误差初始修正学习控制方法和文献[20]所提的基于时变边界层的模糊学习控制方法, 均可用于解决迭代学习控制的初值问题, 实现系统状态对参考信号在部分作业区间上的精确跟踪. 在作业周期的后半段, 本文所提方法具有较好的误差收敛性能, 由图 3可见, 误差曲线在作业周期后半段几乎完全为零, 且曲线几乎没有波动; 而在图 9中, 误差曲线在作业区间后半段存在一定幅度的波动. 该现象产生的原因与修正滤波误差/时变边界层的构造方式有关. $s_{\phi k}(t)=0$, $t\in [0, T]$ 蕴含

    $s_k(t)=0, t\in [t_1, T] $

    (37)

    但$s_{v k}(t)=0$, $t\in [0, T]$ 则意味着$s_k(t)\leq |s_k(0)|{\rm e}^{-\sigma t}$, $t\in [0, T]$. 对比图 7图 11可以看出, 本文所提方法在不使用高增益反馈的情况下, 仍然具有较快的误差收敛速度和较好的控制精度.

    仿真结果表明, 利用本文给出的滤波误差初始修正方法设计学习控制器, 可用于解决参数/非参数不确定学习控制系统的初值问题. 使用这种方法进行控制器设计时, 可以比较方便地构造出修正滤波误差, 由其设计的控制器具有较快的误差收敛速度, 能够获得较好的控制精度. 修正滤波误差的使用较为方便. 上述结果说明了本文所提控制方法的有效性.

    本文提出基于滤波误差初始修正的自适应迭代学习控制方法, 解决参数/非参数混合不确定系统在任意初态情形下的轨迹跟踪问题. 这种设计方法处理非参数不确定性后, 将系统中原有的非参数不确定性补偿问题转化为线性时变参数估计问题, 达到简化设计的目的. 文中所构造的修正滤波误差兼具构造和使用方面的便捷性. 仿真结果表明, 对比已有主流方法, 本文所提方案可获得较快的误差收敛速度和较好的控制精度.


  • 本文责任编委  侯忠生
  • 图  1  单浮选槽原理图

    Fig.  1  Schematic diagram of single flotation cell

    图  2  数据驱动一步最优未建模动态补偿PID解耦控制结构图

    Fig.  2  Structure diagram of data driven one-step optimal unmodeled dynamic compensation PID decoupling control

    图  3  线性模型下PID解耦控制的矿物品位跟踪曲线

    Fig.  3  Ore grade tracking curve with PID decoupling control under linear model

    图  4  线性模型下PID解耦控制的控制输入

    Fig.  4  Control input curve with PID decoupling control under linear model

    图  5  线性模型下模型预测控制控制的矿物品位跟踪曲线

    Fig.  5  Ore grade tracking curve with MPC under linear model

    图  6  线性模型下模型预测控制的控制输入

    Fig.  6  Control input curve with MPC under linear model

    图  7  参数扰动曲线

    Fig.  7  Parameter disturbance curve

    图  8  非线性模型下数据驱动一步最优未建模动态补偿的PID解耦控制的矿物品位跟踪曲线

    Fig.  8  Ore grade tracking curve with data driven one step optimal unmolded dynamic compensation PID decoupling control under nonlinear model

    图  9  非线性模型下数据驱动一步最优未建模动态补偿的PID解耦控制的控制输入

    Fig.  9  Control input curve with data driven one step optimal unmolded dynamic compensation PID decoupling control under nonlinear model

    图  10  未建模动态的值

    Fig.  10  Value of unmolded dynamic

    图  11  非线性模型下模型预测控制的矿物品位跟踪曲线

    Fig.  11  Ore grade tracking curve with MPC under nonlinear model

    图  12  非线性模型下模型预测控制的控制输入

    Fig.  12  Control input curve with MPC under nonlinear model

    表  1  浮选过程符号表

    Table  1  Flotation process symbol table

    符号 物理含义
    $k_p^1$ 黄铜矿浮选率
    $k_e^1$ 黄铜矿排放率
    $g_{a}$ 原矿浆黄铜矿品位
    $X_a^2$ 脉石矿浆浓度
    $H$ 浮选槽高度
    $L_{cu}$ 黄铜矿矿物品位
    $g_{cp}^1$ 黄铜矿浆的
    黄铜矿品位
    $k_p^2$ 脉石浮选率
    $k_e^2$ 脉石排放率
    $X_a^1$ 黄铜矿浆浓度
    $A$ 浮选槽底面积
    ${q_T}$ 尾矿流量
    ${q_c}$ 精矿流量
    $g_{cp}^2$ 脉石矿浆的
    黄铜矿品位
    下载: 导出CSV

    表  2  对比实验评价指标

    Table  2  Performance index of comparison experiment

    IAE MSE
    本文$r_1$ 0.2078 $3.3073\times10^{-5}$
    本文$r_2$ 0.1803 $2.396\times10^{-5}$
    MPC $r_1$ 18.1797 0.0601
    MPC $r_2$ 37.4461 0.2563
    下载: 导出CSV
  • [1] 柴天佑.复杂工业过程运行优化与反馈控制.自动化学报, 2013, 39(11):1744-1757 http://www.aas.net.cn/CN/abstract/abstract18214.shtml

    Chai Tian-You. Operational optimization and feedback control for complex industrial processes. Acta Automatica Sinica, 2013, 39(11):1744-1757 http://www.aas.net.cn/CN/abstract/abstract18214.shtml
    [2] 范家璐, 姜艺, 柴天佑.无线网络环境下工业过程运行反馈控制方法.自动化学报, 2016, 42(8):1166-1174 http://www.aas.net.cn/CN/abstract/abstract18906.shtml

    Fan Jia-Lu, Jiang Yi, Chai Tian-You. Operational feedback control of industrial processes in a wireless network environment. Acta Automatica Sinica, 2016, 42(8):1166-1174 http://www.aas.net.cn/CN/abstract/abstract18906.shtml
    [3] Chai T Y, Qin S J, Wang H. Optimal operational control for complex industrial processes. Annual Reviews in Control, 2014, 38(1):81-92 doi: 10.1016/j.arcontrol.2014.03.005
    [4] 杨亚茹, 李少远.切换非线性系统全局优化运行的经济预测控制.自动化学报, 2017, 43(6):1017-1027 http://www.aas.net.cn/CN/abstract/abstract19077.shtml

    Yang Ya-Ru, Li Shao-Yuan. Economic model predictive control for global optimal operation of nonlinear switching systems. Acta Automatica Sinica, 2017, 43(6):1017-1027 http://www.aas.net.cn/CN/abstract/abstract19077.shtml
    [5] 张翔宇, 李继庚, 周平, 张占波, 刘焕彬, 王宏.制浆氯漂过程运行优化控制系统.控制工程, 2014, 21(2):303-308 doi: 10.3969/j.issn.1671-7848.2014.02.032

    Zhang Xiang-Yu, Li Ji-Geng, Zhou Ping, Zhang Zhan-Bo, Liu Huan-Bin, Wang Hong. Operational optimization control system for pulp chlorination process. Control Engineering of China, 2014, 21(2):303-308 doi: 10.3969/j.issn.1671-7848.2014.02.032
    [6] 刘晓青, 程全, 李晋, 周小东.浮选生产过程综合自动化系统.控制工程, 2016, 23(11):1702-1706 http://d.old.wanfangdata.com.cn/Periodical/jczdh201611011

    Liu Xiao-Qing, Cheng Quan, Li Jin, Zhou Xiao-Dong. Integrated automation system for flotation processes. Control Engineering of China, 2016, 23(11):1702-1706 http://d.old.wanfangdata.com.cn/Periodical/jczdh201611011
    [7] Wang R H, Qiu M J, Zhao K L, Qian Y. Optimal RTO timer for best transmission efficiency of DTN protocol in deep-space vehicle communications. IEEE Transactions on Vehicular Technology, 2017, 66(3):2536-2550 doi: 10.1109/TVT.2016.2572079
    [8] 潘红光, 高海南, 孙耀, 张英, 丁宝苍.基于多优先级稳态优化的双层结构预测控制算法及软件实现.自动化学报, 2014, 40(3):405-414 http://www.aas.net.cn/CN/abstract/abstract18305.shtml

    Pan Hong-Guang, Gao Hai-Nan, Sun Yao, Zhang Ying, Ding Bao-Cang. The algorithm and software implementation for double-layered model predictive control based on multi-priority rank steady-state optimization. Acta Automatica Sinica, 2014, 40(3):405-414 http://www.aas.net.cn/CN/abstract/abstract18305.shtml
    [9] Ding J L, Modares H, Chai T, Lewis F L. Data-based multiobjective plant-wide performance optimization of industrial processes under dynamic environments. IEEE Transactions on Industrial Informatics, 2016, 12(2):454-465 doi: 10.1109/TII.2016.2516973
    [10] Wang T, Gao H J, Qiu J B. A combined adaptive neural network and nonlinear model predictive control for multirate networked industrial process control. IEEE Transactions on Neural Networks and Learning Systems, 2016, 27(2):416-425 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=4d9bb8f6ad6ba73ffa67e57947d5211f
    [11] Yang X P, Chen Y R. Intelligent control and optimization of the coal slime flotation. Advanced Materials Research, 2012, 524-527:1007-1010 doi: 10.4028/www.scientific.net/AMR.524-527
    [12] Li H B, Chai T Y, Zhang L Y. Hybrid intelligent optimal control for flotation processes. In: Proceedings of the 2012 American Control Conference (ACC). Montreal, QC, Canada: IEEE, 2012. 4891-4896
    [13] Jiang Y, Fan J L, Chai T Y, Li J N, Lewis F L. Data-driven flotation industrial process operational optimal control based on reinforcement learning. IEEE Transactions on Industrial Informatics, 2018, 14(5):1974-1989 doi: 10.1109/TII.2017.2761852
    [14] Jiang Y, Fan J L, Chai T Y, Lewis F L. Dual-rate operational optimal control for flotation industrial process with unknown operational model. IEEE Transactions on Industrial Electronics, 2019, 66(6):4587-4599 doi: 10.1109/TIE.2018.2856198
    [15] Rojas D, Cipriano A. Model based predictive control of a rougher flotation circuit considering grade estimation in intermediate cells. Dyna, 2011, 78(166):29-37 http://d.old.wanfangdata.com.cn/OAPaper/oai_doaj-articles_a93b7dd58593186e6d3c37cdada94186
    [16] Jiang Y, Fan J L, Chai T Y, Chen T W. Setpoint dynamic compensation via output feedback control with network induced time delays. In: Proceedings of the 2015 American Control Conference (ACC). Chicago, IL, USA: IEEE, 2015: 5384-5389
    [17] Wang T, Gao H J, Qiu J B. A combined fault-tolerant and predictive control for network-based industrial processes. IEEE Transactions on Industrial Electronics, 2016, 63(4):2529-2536 http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=b49c2d011b2aa58addfb405f23a867fc
    [18] Fan J L, Jiang Y, Chai T Y. MPC-based setpoint compensation with unreliable wireless communications and constrained operational conditions. Neurocomputing, 2017, 270:110-121 doi: 10.1016/j.neucom.2016.10.098
    [19] Jury E I. Inners and Stability of Dynamic Systems. Malabar, Florida, India:Krieger Pub Co, 1982.
    [20] 柴天佑.多变量自适应解耦控制及应用.北京:科学出版社, 2001.

    Chai Tian-You. Multivariable Adaptive Decoupling Control and Its Application. Beijing:Science Press, 2001.
    [21] Chai T Y, Zhai L F, Yue H. Multiple models and neural networks based decoupling control of ball mill coal-pulverizing systems. Journal of Process Control, 2011, 21(3):351-366 doi: 10.1016/j.jprocont.2010.11.007
    [22] 贾瑶, 岳恒, 柴天佑.高压酸浸过程多工况切换控制方法.控制理论与应用, 2014, 31(10):1318-1326 doi: 10.7641/CTA.2014.30886

    Jia Yao, Yue Heng, Chai Tian-You. Multi-operation condition switching control for high pressure acid leaching process. Control Theory and Applications, 2014, 31(10):1318-1326 doi: 10.7641/CTA.2014.30886
    [23] Hägglund T. A control-loop performance monitor. Control Engineering Practice, 1995, 3(11):1543-1551 doi: 10.1016/0967-0661(95)00164-P
    [24] 贾瑶, 柴天佑.汽水板式换热过程区间串级智能控制方法.自动化学报, 2016, 42(1):37-46 http://www.aas.net.cn/CN/abstract/abstract18794.shtml

    Jia Yao, Chai Tian-You. Interval cascade intelligent control in vaper-water plate-type heat exchange process. Acta Automatica Sinica, 2016, 42(1):37-46 http://www.aas.net.cn/CN/abstract/abstract18794.shtml
    [25] Jia Y, Chai T Y. A data-driven dual-rate control method for a heat exchanging process. IEEE Transactions on Industrial Electronics, 2017, 64(5):4158-4168 doi: 10.1109/TIE.2016.2608878
    [26] 王兰豪, 贾瑶, 柴天佑.再磨过程的泵池液位和给矿压力双速率区间控制.自动化学报, 2017, 43(6):993-1006 http://www.aas.net.cn/CN/abstract/abstract19075.shtml

    Wang Lan-Hao, Jia Yao, Chai Tian-You. Dual-rate interval control of pump pool level and feeding pressure during regrinding. Acta Automatica Sinica, 2017, 43(6):993-1006 http://www.aas.net.cn/CN/abstract/abstract19075.shtml
  • 加载中
  • 图(12) / 表(2)
    计量
    • 文章访问数:  2971
    • HTML全文浏览量:  423
    • PDF下载量:  719
    • 被引次数: 0
    出版历程
    • 收稿日期:  2017-09-27
    • 录用日期:  2017-10-20
    • 刊出日期:  2019-04-20

    目录

    /

    返回文章
    返回