A Semi-supervised Encoder Generative Adversarial Networks Model for Image Classification
-
摘要: 在实际应用中, 为分类模型提供大量的人工标签越来越困难, 因此, 近几年基于半监督的图像分类问题获得了越来越多的关注.而大量实验表明, 在生成对抗网络(Generative adversarial network, GANs)的训练过程中, 引入少量的标签数据能获得更好的分类效果, 但在该类模型的框架中并没有考虑用于提取图像特征的结构, 为了进一步利用其模型的学习能力, 本文提出一种新的半监督分类模型.该模型在原生成对抗网络模型中添加了一个编码器结构, 用于直接提取图像特征, 并构造了一种新的半监督训练方式, 获得了突出的分类效果.本模型分别在标准的手写体识别数据库MNIST、街牌号数据库SVHN和自然图像数据库CIFAR-10上完成了数值实验, 并与其他半监督模型进行了对比, 结果表明本文所提模型在使用少量带标数据情况下得到了更高的分类精度.Abstract: The semi-supervised image classification task has attracted more and more attention recently owing to the problem that adequate labeled data is hard to acquire from industrial applications. Meanwhile, considerable works demonstrate that the improved generative adversarial networks (GANs) can achieve great classification performance with only few labeled images. Intuitively, GAN is a generative model, there is no semantic feature extractor in the main framework. In order to further utilize the ability of GANs, we propose to add an encoder in the framework to extract features of images directly, and simultaneously to use a new semi-supervised training method to train this new image classification model. The classification results of experiments have shown the state-of-the-art accuracy performance in semi-supervised MNIST, SVHN and CIFAR-10.
-
Key words:
- Deep learning /
- generative adversarial network (GAN) /
- image classification /
- semi-supervised learning
-
旋转起重机作为常见的起重机械, 由于其结构简单、占用空间小、无需大型行走设备等优点, 因此被广泛地应用于建筑工地、矿山、港口等场合.然而, 旋臂的加减速会使负载产生摆动, 不仅降低了生产效率, 而且会损坏货物, 造成人员伤亡等.针对该问题, 已经有学者作了大量的研究, 并且提出了许多有效的方法[1-19].但是, 当负载形状不规则或者吊钩的质量不能忽视时, 该摆动会呈现出更加复杂的两级摆动现象.该现象极大地增加了系统特性分析和控制器设计的难度, 因此如何设计出可以有效抑制两级摆动的控制算法问题已经成为学术界和产业界研究的难点和热点.
近年来, 已经有学者针对起重机系统双摆抑制问题展开了一些研究[20-35]. Tang等针对2-D双摆桥式起重机系统中由于台车运动和外部风干扰而引起的荷载摆动, 提出了结合两种运动轨迹的方法, 即其中一个轨迹用来抑制台车运动引起的摆动, 另一个轨迹用来抑制风干扰引起的摆动, 仿真与实验验证了该方法的有效性[20].陈鹤等针对双摆桥式吊车系统提出了一种时间最优轨迹规划方法, 该方法在构造以时间为代价函数的基础上, 将优化问题转化成非线性规划问题, 通过仿真与实验验证了该方法的有效性[21]. Zhang等针对双摆桥式起重机在线规划了一条台车轨道, 该轨道由两部分组成分别实现双摆抑制和台车定位, 仿真验证了该轨道对于参数变化和外部干扰具有鲁棒性[22]. Huang等针对2-D双摆桥式起重机系统提出了一种新型指令整形方法, 仿真与实验验证了该方法的有效性[23].孙宁等针对双摆桥式吊车系统提出了一种基于轨迹规划的消摆定位控制方法, 该方法在充分考虑系统安全性(摆动幅值)等物理约束基础上, 通过构造新颖的平坦输出信号, 将施加在台车运动和两级摆动上的约束/指标转化为对平坦输出的约束, 从而将轨迹规划转化为凸优化问题, 通过数值仿真验证了该方法的有效性[24]. Masoud等针对双摆桥式起重机系统提出了一种频率调制输入整形方法, 该方法是由一个基于闭环系统的第一阶摆动频率的输入整形器和一个虚拟反馈控制环节构成, 仿真与实验验证了该方法的有效性[25]. Maleki等针对双摆旋转起重机系统中存在两级摆动模态的问题, 提出了一种两级模态特定不敏感输入整形器, 通过与两级模态零摆动输入整形器的比较验证了该方法的有效性, 同时也证明了其对旋臂旋转角速度与角加速度变化具有鲁棒性[26]. Masoud等针对双摆桥式起重机系统将输入整形法和闭环控制法相结合, 具体而言, 首先基于假设的双摆系统第一阶模态设计基础整形器, 再设计一个虚拟的带有积分器反馈控制器消除由第一阶模态引起的残留摆动, 通过仿真与实验验证了该方法的有效性[27]. Manning等针对2-D双摆桥式起重机系统设计了一个SI2M (Two-mode specified-insensitivity)输入整形器, 并通过与ZV2M (Two-mode zero vibration)输入整形器比较验证了所提方法对于绳长变化更具有鲁棒性[28]. Sung等针对2-D双摆桥式起重机系统中应用输入整形技术进行消摆控制时关于参数变化的鲁棒性问题, 通过比较仿真和实验指出SI2M整形器性能最好[29]. Qian等针对双摆桥式起重机消摆控制问题, 提出了一种基于SIRMs (Single-input-rule modules)的模糊控制器, 比较仿真验证了该方法的有效性[30]. Ouyang等提出了一种基于LMI (Linear matrix inequality)的简易鲁棒控制器解决双摆桥式起重机消摆控制问题[31]. Zhang等考虑了起重机系统中参数不确定性等对控制性能的影响, 提出了一个自适应控制器, 系统稳定性通过李雅普诺夫定理和芭芭拉特引理进行分析, 仿真结果验证了其有效性[32]. Tuan等针对双摆桥式起重机消摆控制问题, 提出了一个传统滑模控制器和一个多层滑模控制器, 仿真结果验证了其有效性[33]. Sun等针对双摆桥式起重机消摆控制问题, 提出了一种饱和非线性输出反馈控制器和一种非线性准PID控制, 实验结果验证了其有效性[34-35].开环控制方式[20-29], 即在设计控制器时不反馈摆角信息, 如轨迹规划法和基于输入整形技术已经应用于双摆桥式起重机系统.这些方法虽然具有控制器结构简单, 易于实现等优点, 但是它们过于依赖系统精确模型, 当系统受到外部干扰后控制性能会降低.另一方面, 虽然如文献[30-35]所提出的闭环控制方式可以为起重机系统提供鲁棒或自适应控制算法, 但是由于它们的系统阻尼比大都设定为常数.因此很难同时实现旋臂的高精度定位和两级摆角的抑制.为此, 本文将提出一种变阻尼的算法从而实现前述问题.进一步而言, 不同于2-D桥式起重机的平面摆动, 旋转起重机系统中的双摆均为圆锥摆, 系统特性更加复杂.据笔者所知, 到目前为止, 尚无针对双摆旋转起重机摆角抑制的相关报道.
本文在建立双摆旋转起重机动力学模型的基础上, 采用干扰观测器将其解耦成两个独立的线性系统, 即起伏子系统和旋转子系统.其次, 基于此线性模型分别为其设计含有非线性滑模面的滑模控制器, 并通过李雅普诺夫定理分析其稳定性.最后比较仿真和定量分析验证本文所提方法的有效性.
综上, 本文的主要创新之处可总结为如下几点:
1) 据笔者所知, 首次将具有非线性滑模面的滑模控制器应用于双摆旋转起重机系统.
2) 不同于传统的线性滑模面, 本文所提出的非线性滑模面可以为闭环系统提供一个可变的阻尼比, 从而在提高旋臂定位精度的同时实现对两级摆角的抑制.
1. 双摆旋转起重机模型
在图 1所示旋转起重机模型中$M_{0}$, $m_{1}$和$m_{2}$分别表示旋臂质量、吊钩质量和负载质量; $L$, $l_{1}$和$l_{2}$分别表示旋臂长度、悬绳长度和吊绳长度; $\theta_{1}$和$\theta_{3}$分别表示吊钩摆角和负载摆角在旋臂起伏方向上的分量; $\theta_{2}$和$\theta_{4}$分别表示吊钩摆角和负载摆角在旋臂起伏方向上的分量; $\theta_{5}$和$\theta_{6}$则表示旋臂起伏角和旋转角.
为了进一步分析和设计控制系统, 对旋转起重机做如下几点合理假设[1-3, 6-8, 28-31]:
1) 吊钩和负载均看作质点, 悬绳和吊绳的拉力和质量忽略不计.
2) 由于摆角$\theta_{i}~(i=1, 2, 3, 4)$在旋臂到达目标位置时较小, 因此$\cos\theta_{i}=1$, $\sin\theta_{i}=\theta_{i}$, $\dot\theta_{i}=0$, $\dot\theta_{i}^2=0$以及$\ddot\theta_{i}=0$等均成立.
根据拉格朗日运动方程, 双摆旋转起重机系统动力学模型如下所示:
$ \begin{align} (m_{1}+&m_{2})l_{1}^{2}(1+\theta_{1}^{2})\ddot\theta_{1}+(m_{1} +m_{2})l_{1}^{2}\theta_{1}\theta_{2}\ddot{\theta}_{2}+ \nonumber\\ &m_{2}l_{1}l_{2}(1+\theta_{1}\theta_{3})\ddot{\theta}_{3}+ m_{2}l_{1}l_{2}\theta_{1}\theta_{4}\ddot{\theta}_{4} + \nonumber\\ &(m_{1}+m_{2})l_{1}L(\cos\theta_{5}-\theta_{1}\sin\theta_{5})\ddot\theta_{5} -\nonumber\\ &\Big((m_{1}+m_{2})l_{1}^{2}\theta_{2}+m_{2}l_{1}l_{2}\theta_{4}\Big) \ddot\theta_{6}+\nonumber\\ &(m_{1}+m_{2})l_{1}^2\theta_{1}\dot\theta_{1}^2+m_{2}l_1l_2\theta_{1} \dot\theta_{3}^2+ \nonumber\\ &\Big((m_{1}+m_{2})l_{1}^2\theta_{1}\dot\theta_{2}-2(m_{1}+ m_{2})l_{1}^{2}\dot\theta_{6}\Big)\dot\theta_{2} +\nonumber\\ &(m_{2}l_{1}l_{2}\theta_{1}\dot\theta_{4}-2m_{2}l_1l_2\dot\theta_{6}) \dot\theta_{4}- \nonumber\\ &(m_1+m_2)l_1L(\sin\theta_{5}+\theta_1\cos\theta_{5})\dot\theta_{5}^2 -\nonumber\\ &\Big((m_1+m_2)l_1^2\theta_1+m_2l_1l_2\theta_3\Big)\dot\theta_6^2- \nonumber\\ &\Big((m_1+m_2)l_1L\sin\theta_5\Big)\dot\theta_6^2+\nonumber\\ &(m_1+m_2)l_1g\theta_1=0 \end{align} $
(1) $ \begin{align} (m_{1}+&m_{2})l_{1}^{2}\theta_1\theta_2\ddot\theta_{1}+(m_{1}+ m_{2})l_{1}^{2}(1+\theta_{2}^2)\ddot{\theta}_{2}+ \nonumber\\ &m_{2}l_{1}l_{2}\theta_2\theta_3\ddot{\theta}_{3}+m_{2}l_{1}l_{2} (1+\theta_{2}\theta_{4})\ddot{\theta}_{4}- \nonumber\\ &(m_{1}+m_{2})l_{1}L\theta_2\sin\theta_5\ddot\theta_{5}+ (m_{1}+m_{2})l_{1}^{2}\theta_{1}\ddot\theta_{6} +\nonumber\\ &\Big((m_{1}+m_{2})l_1L\sin\theta_5+m_{2}l_{1}l_{2}\theta_{3}\Big)\ddot\theta_{6}+ \nonumber\\ &\left((m_{1}+m_{2})l_{1}^2\theta_{2}\dot\theta_{1}+2(m_1+m_2)l_1^2\dot\theta_6\right)\dot\theta_1 + \nonumber\\ &(m_1+m_2)l_1^2\theta_2\dot\theta_{2}^2+m_2l_1l_2\theta_2\dot\theta_{4}^2+ \nonumber\\ &(m_2l_1l_2\theta_2\dot\theta_3+2m_2l_1l_2\dot\theta_6)\dot\theta_{3}+ \nonumber\\ &\left((m_1+m_2)l_1L\cos\theta_5(2\dot\theta_6-\theta_2\dot\theta_5)\right)\dot\theta_5- \nonumber\\ &\Big((m_1+m_2)l_1^2\theta_2+m_2l_1l_2\theta_4\Big)\dot\theta_6^2 +\nonumber\\ &(m_1+m_2)l_1g\theta_2=0 \end{align} $
(2) $ \begin{align} m_2l_1l_2&(1+\theta_1\theta_3)\ddot\theta_1+m_2l_1l_2\theta_2\theta_3\ddot\theta_2 +\nonumber\\ &m_2l_2^2(1+\theta_3^2)\ddot\theta_3+m_2l_2^2\theta_3\theta_4\ddot\theta_4 +\nonumber\\ &m_2l_2L(\cos\theta_5-\theta_3\sin\theta_5)\ddot\theta_5 -\nonumber\\ &(m_2l_2^2\theta_4+m_2l_1l_2\theta_2)\ddot\theta_6+ m_2l_1l_2\theta_3\dot\theta_1^2 +\nonumber\\ &(m_2l_1l_2\theta_3\dot\theta_2-2m_2l_1l_2\dot\theta_6)\dot\theta_2+m_2l_2^2\theta_3\dot\theta_3^2 +\nonumber\\ &(m_2l_2^2\theta_3\dot\theta_4-2m_2l_2^2\dot\theta_6)\dot\theta_4 -\nonumber\\ &m_2l_2L(\sin\theta_5+\theta_3\cos\theta_5)\dot\theta_5^2 -\nonumber\\ &(m_2l_2^2\theta_3+m_2l_1l_2\theta_1+m_2l_2L\sin\theta_5)\dot\theta_6^2 +\nonumber\\ &m_2l_2g\theta_3=0\end{align} $
(3) $ \begin{align} m_2l_1l_2&\theta_1\theta_4\ddot\theta_1+m_2l_1l_2(1+\theta_2 \theta_4)\ddot\theta_2 +m_2l_2^2\theta_3\theta_4\ddot\theta_3+\nonumber\\ &m_2l_2^2(1+\theta_4^2)\ddot\theta_4-m_2l_2L\theta_4\sin\theta_5\ddot\theta_5 +\nonumber\\ &(m_2l_2^2\theta_3+m_2l_2L\sin\theta_5+m_2l_1l_2\theta_1)\ddot\theta_6 +\nonumber\\ &(m_2l_1l_2\theta_4\dot\theta_1+2m_2l_1l_2\dot\theta_6)\dot\theta_1+m_2l_1l_2\theta_4\dot\theta_2^2 +\nonumber\\ &(m_2l_2^2\theta_4\dot\theta_3+2m_2l_2^2\dot\theta_6)\dot\theta_3+m_2l_2^2\theta_4\dot\theta_4^2 +\nonumber\\ &(2m_2l_2L\cos\theta_5\dot\theta_6-m_2l_2L\theta_4\cos\theta_5\dot\theta_5)\dot\theta_5 - \nonumber\\ &(m_2l_1l_2\theta_2+m_2l_2^2\theta_4)\dot\theta_6^2+m_2l_2g\theta_4=0 \end{align} $
(4) $ J_{k+4}\ddot{\theta}_{k+4}+d_{k+4}=\gamma_{k+4}, k=1, 2 $
(5) 其中, $g$, $\dot\theta_{i}$, $\ddot\theta_{i}~(i=1, 2, 3, 4, 5, 6), $ $J_{k+4}$, $d_{k+4}$和$\gamma_{k+4}$分别表示重力加速度、起伏方向和旋转方向的摆角角速度, 起伏和旋转角速度及其对应的角加速度, 起伏和旋转方向的转动惯量, 包括了摩擦项和其他被忽略的非线性项的系统外界干扰以及各电机的驱动力矩.
为了方便设计控制器, 采用了如图 2所示的干扰观测器(Disturbance observer, DOB)[11, 17, 36-40].
图 2中$\hat{d}_{k+4}$和$\omega_{k+4}$分别为干扰项的观测值和低通滤波器的截止频率.为了获得良好的控制性能, 该参数由试凑法可得$\omega_{k+4}=40 \rm Hz$.笔者已经验证了其在低频域可对干扰项$d_{k+4}$进行很好的补偿[11].因此, 可得:
$ \begin{align} \ddot{\theta}_{i+4}=v_{k+4}, \hspace{0.2cm}k=1, 2 \end{align} $
(6) 式中, $v_{k+4}$表示起伏子系统和旋转子系统的控制输入.
根据前述假设, 结合式(1)~(4)和式(6), 可得,
$ (m_1+m_2)l_1^2\ddot\theta_1+m_2l_1l_2\ddot\theta_3+(m_1+m_2)\times \nonumber \\ \qquad l_1L\cos\theta_{5f}\ddot\theta_5=-(m_1+m_2)l_1g\theta_1 $
(7) $ m_2l_1l_2\ddot\theta_1+m_2l_2^2\ddot\theta_3+m_2l_2 \times \nonumber \\ \qquad L\cos\theta_{5f}\ddot{\theta}_5=-m_2l_2g\theta_3 $
(8) $ \ddot\theta_5=v_5 $
(9) $(m_1+m_2)l_1^2\ddot\theta_2+m_2l_1l_2\ddot\theta_4+(m_1+m_2)\times \nonumber \\ \qquad l_1L\sin\theta_{5f}\ddot\theta_6=-(m_1+m_2)l_1g\theta_2 $
(10) $ m_2l_1l_2\ddot\theta_2+m_2l_2^2\ddot\theta_4+m_2l_2\times \nonumber \\ \qquad L\sin\theta_{5f}\ddot{\theta}_6=-m_2l_2g\theta_4 $
(11) $ \ddot\theta_6=v_6 $
(12) 其中, $\theta_{5f}$为起伏角的目标值.
式(7)~(12)写成矩阵形式可得,
$ M_1\ddot{z}_1+G_1z_1=v_5 $
(13) $ \begin{align} &M_{1}=\left[ \begin{array}{ccccccc} 1 & \dfrac{m_2l_2}{(m_1+m_2)l_1} & \dfrac{L\cos\theta_{5f}}{l_1} \\ \dfrac{l_1}{l_2} & 1 & \dfrac{L\cos\theta_{5f}}{l_2} \\ 0 & 0 & 1 \\ \end{array} \right] \nonumber \\ &G_1=\left[ \begin{array}{ccccccc} \dfrac{g}{l_1} & 0 & 0 \\ 0 & \dfrac{g}{l_2} & 0 \\ 0 & 0 & 0 \\ \end{array} \right] \nonumber \\ &\ddot{z}_{1}=\left[ \begin{array}{cccccc} \ddot{\theta}_{1} & \ddot{\theta}_{3} & \ddot{\theta}_{5} \\ \end{array} \right]^{\rm T}, z_{1}=\left[ \begin{array}{cccccc} \theta_{1} & \theta_{3} & \theta_{5} \\ \end{array} \right]^{\rm T} \nonumber \end{align} $
(14) $ \begin{align} &M_2\ddot{z}_2+G_2z_2=v_6 \\ &M_{2}=\left[ \begin{array}{ccccccc} 1 & \dfrac{m_2l_2}{(m_1+m_2)l_1} & \dfrac{L\sin\theta_{5f}}{l_1} \\ \dfrac{l_1}{l_2} & 1 & \dfrac{L\sin\theta_{5f}}{l_2} \\ 0 & 0 & 1 \\ \end{array} \right], \nonumber \\ &G_2=\left[ \begin{array}{ccccccc} \dfrac{g}{l_1} & 0 & 0 \\ 0 & \dfrac{g}{l_2} & 0 \\ 0 & 0 & 0 \\ \end{array} \right] \nonumber \\ &\ddot{z}_{2}=\left[ \begin{array}{cccccc} \ddot{\theta}_{2} & \ddot{\theta}_{4} & \ddot{\theta}_{6} \\ \end{array} \right]^{\rm T}, z_{2}=\left[ \begin{array}{cccccc} \theta_{2} & \theta_{4} & \theta_{6} \\ \end{array} \right]^{\rm T} \nonumber \end{align} $
由式(13)和式(14)可知, 起伏子系统和旋转子系统拥有非常相似的结构, 因此本文可以为其设计相似的控制器.
2. 新型滑模控制器设计和稳定性分析
2.1 含有非线性滑模面的滑模控制器设计
本节将为双摆旋转起重机设计一种新型含有非线性滑模面的滑模控制器从而同时实现旋臂高精度跟踪和摆角抑制.不同于传统的线性滑模面, 本节所提出的非线性滑模面可以使闭环系统的阻尼比从最初的较小值变化为最终的较大值.较小的阻尼比可以为系统提供较快的响应速度而较大的阻尼比则可减小超调量从而使得旋臂更加精确地跟踪给定轨迹.
基于式(13)和式(14)所示起重机线性模型, 本文所提出的非线性滑模面如下所示:
$ \begin{align} &S_k=(\Gamma_k-\Phi_kP_k)e_{1k}+\dot{e}_{1k}, \hspace{0.2cm}k=1, 2 \\ &e_{1k}=\left[ \begin{array}{cccc} \theta_{k} \\ \theta_{k+2} \\ \theta_{k+4}-\theta_{(k+4)d} \\ \end{array} \right] \nonumber \\ &\dot{e}_{1k}=\left[ \begin{array}{cccc} \dot{\theta}_{k} \\ \dot{\theta}_{k+2} \\ \dot{\theta}_{k+4}-\dot{\theta}_{(k+4)d} \\ \end{array} \right] \nonumber \end{align} $
(15) 其中, $\theta_{(k+4)d}$和$\dot{\theta}_{(k+4)d}$分别表示旋臂起伏角和旋转角的目标位移轨迹和目标速度轨迹. $P_k$是正定矩阵并满足如下所示的李雅普诺夫方程:
$ \begin{align} P_k\Gamma_k^{\rm T}+\Gamma_kP_k=-W_k, \hspace{0.2cm}k=1, 2 \end{align} $
(16) 其中, $W_k$也是正定矩阵.选取合适的满秩矩阵$\Gamma_k$使得其满足赫尔维茨定理并为闭环系统提供一个较小的初始阻尼比.非线性函数$\Phi_k$则要根据系统的输出(即, 旋臂的起伏角、旋转角以及各方向第一、二级摆角)进行选择并可用来调节闭环系统的阻尼比.虽然该函数的选取并不唯一, 但是必须满足以下两个性质:
1) 必须对于系统输出可微并保证滑动模态存在.
2) 必须从$0$变化成一个负值.
因此, 本文采用如下所示的非线性函数进行控制器的设计[36]
$ \begin{align} &\Phi_k=\left[ \begin{array}{cccc} \phi_1 & 0 & 0 \\ 0 & \phi_2 & 0 \\ 0 & 0 & \phi_3 \\ \end{array} \right] \\ &\phi_1=-\lambda_{1k}{\rm e}^{-\theta_{k}^{2}}, \phi_2=-\lambda_{2k}{\rm e}^{-\theta_{k+2}^{2}} \nonumber \\ &\phi_3=-\lambda_{3k}{\rm e}^{-(\theta_{k+4}-\theta_{(k+4)d})^{2}} \nonumber \end{align} $
(17) 式中, $\lambda_{ik}$ ($i=1, 2, 3, k=1, 2$)为正值, 而$e^{(\cdot)}$表示指数函数.
通过设计合适的控制律, 系统的所有状态量都可以进入预期的滑模面上.当处于滑模面时, 即$S_k=0$, 可得:
$ \begin{align} (\Gamma_k-\Phi_kP_k)e_{1k}+\dot{e}_{1k}=0 \end{align} $
(18) 进一步整理可得:
$ \begin{align} \dot{e}_{1k}= &-\Gamma_ke_{1k}+\Phi_kP_ke_{1k} =\nonumber\\ &(-\Gamma_k+\Phi_kP_k)e_{1k} \end{align} $
(19) 由于所设计矩阵$\Gamma_k$, $\Phi_k$和$P_k$都是可逆的, 因此上式所示系数矩阵也是可逆的, 即该矩阵是非奇异的.
为了验证所提出滑模面的稳定性, 考虑如下所示的李雅普诺夫函数:
$ \begin{align} V_{1k}=e_{1k}^{\rm T}P_ke_{1k} \end{align} $
(20) 取上式一阶时间导数, 可得:
$ \begin{align} \dot{V}_{1k}= &e_{1k}^{\rm T}P_{k}\dot{e}_{1k}+\dot{e}_{1k}^{\rm T}P_{k}e_{1k}= \nonumber\\ &e_{1k}^{\rm T}P_k(-\Gamma_k+\Phi_kP_k)e_{1k} +\nonumber \\ &e_{1k}^{\rm T}(-\Gamma_k+\Phi_kP_k)^{\rm T}P_ke_{1k} = \nonumber \\ &-e_{1k}^{\rm T}W_ke_{1k}+2U_k\Phi_k U_k^{\rm T} \end{align} $
(21) 其中, $U=e_{1k}^{\rm T}P$.因为$W_k>0$和$\Phi_k < 0$成立, 所以得证$\dot{V}_{1k} < 0$.
接下来, 基于上述所设计的非线性滑模面并采用指数趋近律, 可得:
$ \begin{align} \dot{S}_k= &\Big((\Gamma_k-\Phi_kP_k)\dot{e}_{1k}-\frac{{\rm d}\Phi_k}{{\rm d}t}P_ke_{1k}+\ddot{e}_{1k}\Big)= \nonumber \\ &-K_kS_k-Q_k{\rm sgn}(S_k) \end{align} $
(22) 其中, $K_k$和$Q_k$为系数矩阵, 并满足$K_k>0$, $Q_k>0$.
本文控制目标是实现旋臂高精度跟踪给定目标轨迹和消除两级摆角(即, $\lim_{t \to \infty}e_{1k}=0$和$\lim_{t \to \infty}\dot{e}_{1k}=0$).为此结合式(22), 可得如下控制器:
$ \begin{align} v_{k+4}= &-M_k\Big((\Gamma_k-\Phi_kP_k)\dot{e}_{1k}-\frac{{\rm d}\Phi_k}{{\rm d}t}P_ke_{1k} -\nonumber\\ &\ddot{z}_{k{\rm d}}+K_kS_k+Q_k{\rm sgn}(S_k)\Big)+G_zz_k \end{align} $
(23) 其中, . $\ddot{\theta}_{(k+4)d}$为起伏角和旋转角的目标加速度轨迹. $M_k$、$G_k$以及$z_k$ ($k=1, 2$)可参见式(13)和式(14).经验证, $M_k$是可逆矩阵.
2.2 稳定性分析
本节进行系统稳定性分析, 并考虑如下所示的李雅普诺夫函数:
$ \begin{align} V_k=\frac{1}{2}S_k^{\rm T}S_k \end{align} $
(24) 取上式一阶时间导数, 可得:
$ \begin{align} \dot{V_k}= &S_k^{\rm T}\Big((\Gamma_k-\Phi_kP_k)\dot{e}_{1k}- \frac{{\rm d}\Phi_k}{{\rm d}t}P_ke_{1k}+\ddot{e}_{1k}\Big)= \nonumber\\& S_k^{\rm T}\Big((\Gamma_k-\Phi_kP_k)\dot{e}_{1k}- \frac{{\rm d}\Phi_k}{{\rm d}t}P_ke_{1k}- \nonumber\\ &\ddot{z}_{kd}+M_k^{-1}(v_{k+4}-G_kz_k)\Big) \end{align} $
(25) 将式(23)代入式(25), 可得:
$ \begin{align} \dot{V_k}=S_k^{\rm T}\Big(-K_kS_k-Q_k{\rm sgn}(S_k)\Big) <0 \end{align} $
(26) 由于$V_k>0$, 且$\dot{V_k} < 0$, 因此可证系统是稳定的.
进一步, 设$S_k(t)$初值$S_k(0)>0$, 求解式(22)可得:
$ \begin{align} S_{k}=\Big(S_{k}(0)+\frac{Q_k}{K_k}\Big){\rm e}^{-K_kt}-\frac{Q_k}{K_k} \end{align} $
(27) 最终系统从初始状态到达滑模面($S_k=0$)所需时间为,
$ \begin{align} t=\frac{1}{K_k}\ln \Big(1+\frac{K_k|S_k(0)|}{Q_k}\Big) \end{align} $
(28) 综上, 采用如式(23)所示控制律能使变量$S_k$在有限时间内收敛到零, 并维持在零点.基于此, 则可证$\lim_{t \to \infty}e_{1k}=0$和$\lim_{t \to \infty}\dot{e}_{1k}=0$成立[41].
值得注意的是, 由于符号函数的不连续性, 式(23)所示控制器会导致系统产生抖振[33].为此, 在实际应用时采用饱和函数来替代符号函数, 则
$ \begin{align} v_{k+4}= &-M_k\Big((\Gamma_k-\Phi_kP_k)\dot{e}_{1k}- \frac{{\rm d}\Phi_k}{{\rm d}t}P_ke_{1k} \nonumber \\ &-\ddot{z}_{kd}+K_kS_k+Q_k{\rm sat}(S_k)\Big)+G_zz_k\nonumber \\ &{\rm sat}(S_k)=\left\{ \begin{array}{ll} {\rm sgn}(S_k), \hspace{0.65cm} |S_k| \geq \epsilon \\ \dfrac{S_k}{\epsilon}, \hspace{1.2cm} |S_k| < \epsilon \end{array} \right. \end{align} $
(29) 其中, $\epsilon$表示边界层的厚度且满足$\epsilon>0$.
注1. 进一步讨论新控制器对系统稳定性的影响, 将式(29)代入式(25), 可得:
$ \begin{align} \dot{V_k}=S_k^{\rm T}\Big(-K_kS_k-Q_k{\rm sat}(S_k)\Big) \end{align} $
(30) 当$|S_k| \geq \epsilon$, 则有$\dot{V}_k=S_k^{\rm T}(-K_kS_k-Q_k{\rm sgn}(S_k)) < 0$; 当$|S_k| < \epsilon$, 则有$\dot{V}_k=S_k^{\rm T}(-K_kS_k-Q_k\frac{S_k}{\epsilon}) < 0$.因此系统仍然稳定.
3. 仿真分析结果和讨论
3.1 仿真条件
从理论上讲, 阶跃信号、摆线以及输入整形曲线等均可作为旋臂的目标轨迹, 从而进行控制性能的评价.然而, 阶跃信号具有不连续性, 容易对起重机系统造成冲击, 因此在实际工程中很少直接使用.另外, 当系统参数发生变化时, 输入整形曲线往往需要进行重新设计.而摆线可以在初始点和终点处提供零加速度, 从而减轻对系统的冲击.因此, 采用如下所示的摆线作为旋臂运动的期望轨迹:
$ \begin{align} \theta_{(k+4)d}= &(\theta_{(k+4)f}-\theta_{(k+4)0}) \times\nonumber\\ & \left\{\frac{t}{t_{s}}-\frac{1}{2\pi}\sin\left(2\pi \frac{t}{t_{s}}\right)\right\}+\theta_{(k+4)0} \end{align} $
(31) 其中, $\theta_{(k+4)f}$, $\theta_{(k+4)0}$, $t_{s}$和$t_{f}$分别表示旋臂起伏角和旋转角的目标值, 初始值, 到达时间和最终时间.同时设定$\theta_{5f}=40°$, $\theta_{6f}=45°$, $\theta_{50}=\theta_{60}=0°$, $t_{s}=3$ s和$t_{f}=10$ s, 并设定当时间$t$属于区间$(t_{s}, t_{f}]$时, $\theta_{(k+4)f}=\theta_{(k+4)d}$成立.系统参数如表 1所示.而控制器参数则如表 2和表 3所示, 其中参数$\lambda_{ik}$主要影响着控制性能, 具体分析详见附录A.
表 1 起重机系统模型参数Table 1 Parameters of crane system$M_0$ (kg) $m_1$ (kg) $m_2$ (kg) $L$ (m) $l_{1}$ (m) $l_{2}$ (m) $J_5$ (kg${\rm{m}}^{2}$) $J_6$ (kg${\rm{m}}^{2}$) $g$ (m/${\rm{s}}^{2}$) 0.86 2.00 0.56 0.65 0.50 0.20 0.52 0.52 9.80 表 2 起伏子系统控制器参数Table 2 Parameters of controller in vertical subsystem$\Gamma_1$ $P_1$ $K_1$ $Q_1$ $\lambda_{i1}$ NLSS ${\rm{diag}}\{1.0, 1.0, 0.5\}$ ${\rm{diag}}\{1.0, 1.0, 1.4\}$ ${\rm{diag}}\{0.5, 0.5, 0.8\}$ ${\rm{diag}}\{1.0, 1.0, 1.5\}$ ${\rm{diag}}\{1.2, 1.5, 0.7\}$ LSS ${\rm{diag}}\{1.0, 1.0, 0.5\}$ ${\rm{diag}}\{1.0, 1.0, 1.4\}$ ${\rm{diag}}\{0.5, 0.5, 0.8\}$ ${\rm{diag}}\{1.0, 1.0, 1.5\}$ — 表 3 旋转子系统控制器参数Table 3 Parameters of controller in horizontal subsystem$\Gamma_2$ $P_2$ $K_2$ $Q_2$ $\lambda_{i2}$ NLSS ${\rm{diag}}\{1.0, 1.0, 1.5\}$ ${\rm{diag}}\{1.0, 1.0, 1.4\}$ ${\rm{diag}}\{0.5, 0.5, 0.9\}$ ${\rm{diag}}\{1.0, 1.0, 1.4\}$ ${\rm{diag}}\{1.2, 1.5, 0.8\}$ LSS ${\rm{diag}}\{1.0, 1.0, 1.5\}$ ${\rm{diag}}\{1.0, 1.0, 1.4\}$ ${\rm{diag}}\{0.5, 0.5, 0.9\}$ ${\rm{diag}}\{1.0, 1.0, 1.4\}$ — 3.2 仿真结果
本文所提方法的仿真结果和传统线性滑模面(即$\Phi_k=0$)的结果进行比较.吊绳长度分别设定为$l_{2}=0.1$ m, $l_{2}=0.2$ m和$l_{1}=0.3$ m.对起伏角$\theta_5$、起伏角跟踪误差$e_5$、旋转角$\theta_6$、旋转角跟踪误差$e_6$、摆角$\theta_{1}$, $\theta_{3}$, $\theta_{2}$和$\theta_{4}$的仿真结果分别如图 3~5所示.
为了进行定量分析, 分别将本文所提方法和传统方法应用于旋转起重机时的最大起伏角误差$e_{5\max}$ (deg), 最大旋转角误差$e_{6\max}$ (deg), 起伏方向第一级摆角最大值$\theta_{1\max}$ (deg), 起伏方向第二级摆角最大值$\theta_{3\max}$ (deg), 旋转方向第一级摆角最大值$\theta_{2\max}$ (deg)和旋转方向第二级摆角最大值$\theta_{4\max}$ (deg)如表 4~表 6所示.由这些图与表可知, 虽然两种方法对于悬绳长度变化都具有鲁棒性, 但是使用本文所提方法可以分别减小大约$40 \%$的起伏角最大跟踪误差和$52 \%$的旋转角最大跟踪误差.另外, 对于所有的情况, 荷载摆动都得到了良好的抑制, 并且随着悬绳长度的增加摆角也逐渐增大.这些结果验证了本文所提方法既具有较好的鲁棒性还具有较好的跟踪性能, 同时不降低摆角抑制性能.
表 4 定量分析($l_2=0.1$ m)Table 4 Quantitative analysis ($l_2=0.1$ m)最大起伏角误差 最大旋转角误差 最大摆角 最大摆角 最大摆角 最大摆角 $e_{5\max}$ (deg) $e_{6\max}$ (deg) $\theta_{1\max}$ (deg) $\theta_{2\max}$ (deg) $\theta_{3\max}$ (deg) $\theta_{4\max}$ (deg) NLSS 1.21 1.91 2.91 2.75 3.15 3.21 LSS 1.68 2.91 2.77 2.81 3.11 3.18 表 5 定量分析($l_2=0.2$ m)Table 5 Quantitative analysis ($l_2=0.2$ m)最大起伏角误差 最大旋转角误差 最大摆角 最大摆角 最大摆角 最大摆角 $e_{5\max}$ (deg) $e_{6\max}$ (deg) $\theta_{1\max}$ (deg) $\theta_{2\max}$ (deg) $\theta_{3\max}$ (deg) $\theta_{4\max}$ (deg) NLSS 1.21 1.81 3.03 2.94 3.69 4.21 LSS 1.61 2.81 2.79 2.83 3.41 4.11 表 6 定量分析($l_2=0.3$ m)Table 6 Quantitative analysis ($l_2=0.3$ m)最大起伏角误差 最大旋转角误差 最大摆角 最大摆角 最大摆角 最大摆角 $e_{5\max}$ (deg) $e_{6\max}$ (deg) $\theta_{1\max}$ (deg) $\theta_{2\max} $(deg) $\theta_{3\max}$ (deg) $\theta_{4\max}$ (deg) NLSS 1.41 1.99 2.93 2.94 2.93 5.22 LSS 1.81 2.99 2.52 2.92 4.27 5.02 4. 结论
本文为了同时实现双摆旋转起重机高精度跟踪和摆角抑制, 首先, 建立含有双摆效应的起重机动力学模型, 并采用干扰观测器进行解耦线性化.其次, 基于此线性模型分别为其设计含有非线性滑模面的滑模控制器, 并通过李雅普诺夫定理分析其稳定性.通过采用本文所提方法, 无论吊绳长度$l_2=0.1$ m, $l_2=0.2$ m或者$l_2=0.3$ m, 都实现了旋臂起伏角和旋转角的跟踪和两级残留摆角的抑制.通过与传统线性滑模比较, 在不改变控制器摆角抑制性能的前提下, 起伏角和旋转角的跟踪误差分别降低了大约$40 \%$和$52 \%$.
然而, 如果起重机系统的状态量$e_{1k}$和$\dot{e}_{1k}$能够在有限时间内收敛到闭环系统的平衡点的话, 将会进一步提高起重机的运输效率.因此, 下一阶段将就此问题展开研究.
附录A. 不同非线性滑模面参数对控制性能影响分析
本节通过仿真对非线性滑模面参数选取进行分析, 并获得其对控制性能的影响.在图A示的结果中, 实线对应参数表 2中$\lambda_{ik}$值, 点线分别对应$\lambda_{11}=12$, $\lambda_{21}=15$, $\lambda_{31}=7$, $\lambda_{12}=12$, $\lambda_{22}=15$和$\lambda_{32}=8$.而点划线则对应$\lambda_{11}=120$, $\lambda_{21}=150$, $\lambda_{31}=70$, $\lambda_{12}=120$, $\lambda_{22}=150$和$\lambda_{32}=80$.由图可知, 虽然随着$\lambda_{ik}$的增大, 旋臂的定位精度会大大提高, 但是同时也降低摆角抑制性能.
-
表 1 MNIST数据库上不同数量带标数据的半监督训练分类准确率
Table 1 Using different number of labeled data when semi-supervised training on MNIST
表 2 SVHN数据库上不同数量带标数据的半监督训练分类准确率
Table 2 Using different number of labeled data when semi-supervised training on SVHN
表 3 CIFAR-10数据库上不同数量带标数据的半监督训练分类准确率
Table 3 Using different number of labeled data when semi-supervised training on CIFAR-10
-
[1] 张号逵, 李映, 姜晔楠.深度学习在高光谱图像分类领域的研究现状与展望.自动化学报, 2018, 44(6): 961-977 doi: 10.16383/j.aas.2018.c170190Zhang Hao-Kui, Li Ying, Jiang Ye-Nan. Deep learning for hyperspectral imagery classification: the state of the art and prospects. Acta Automatica Sinica, 2018, 44(6): 961-977 doi: 10.16383/j.aas.2018.c170190 [2] Suddarth S C, Kergosien Y L. Rule-injection hints as a means of improving network performance and learning time. Neural Networks. EURASIP 1990, 1990. 120-129 [3] 李敏, 禹龙, 田生伟, 吐尔根·依布拉音, 赵建国.基于深度学习的维吾尔语名词短语指代消解.自动化学报, 2017, 43(11): 1984- 1992 doi: 10.16383/j.aas.2017.c160330Li Min, Yu Long, Tian Sheng-Wei, Ibrahim T, Zhao Jian-Guo. Coreference resolution of uyghur noun phrases based on deep learning. Acta Automatica Sinica, 2017, 43(11): 1984-1992 doi: 10.16383/j.aas.2017.c160330 [4] 王坤峰, 左旺孟, 谭营, 秦涛, 李力, 王飞跃.生成式对抗网络:从生成数据到创造智能.自动化学报, 2018, 44(5): 769-774 doi: 10.16383/j.aas.2018.y000001Wang Kun-Feng, Zuo Wang-Meng, Tan Ying, Qin Tao, Li Li, Wang Fei-Yue. Generative adversarial networks: from generating data to creating intelligence. Acta Automatica Sinica, 2018, 44(5): 769-774 doi: 10.16383/j.aas.2018.y000001 [5] Dosovitskiy A, Fischer P, Springenberg J T, Riedmiller M, Brox T. Discriminative unsupervised feature learning with exemplar convolutional neural networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2016, 38(9): 1734-1747 doi: 10.1109/TPAMI.2015.2496141 [6] Rasmus A, Valpola H, Honkala M, Berglund M, Raiko T. Semi-supervised learning with ladder networks. arXiv: 1507. 02672, 2015. [7] Miyato T, Maeda S, Ishii S, Koyama M. Virtual adversarial training: a regularization method for supervised and semi-supervised learning. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, DOI: 10.1109/TPAMI.2018. 2858821 [8] Kingma D P, Rezende D J, Mohamed S, Welling M. Semi-supervised learning with deep generative models. In: Proceedings of the 2014 Neural Information Processing Systems. Massachusetts, USA: MIT Press, 2014. 3581-3589 [9] Springenberg J T. Unsupervised and semi-supervised learning with categorical generative adversarial networks. arXiv: 1511.06390, 2015. [10] Salimans T, Goodfellow I, Zaremba W, Cheung V, Radford A, Chen X. Improved techniques for training GANs. In: Proceedings of the 2016 Neural Information Processing Systems. Massachusetts, USA: MIT Press, 2016. 1-10 [11] Saatchi Y, Wilson A G. Bayesian GAN. In: Proceedings of the 2017 Neural Information Processing Systems. Massachusetts, USA: MIT Press, 2017. 1-16 [12] Radford A, Metz L, Chintala S. Unsupervised representation learning with deep convolutional generative adversarial networks. In: Proceedings of the 2016 International Conference on Learning Representations. Piscataway, USA: IEEE, 2016. 1-16 [13] Donahue J, Krähenbühl P, Darrell T. Adversarial feature learning. In: Proceedings of the 2017 International Conference on Learning Representations. Piscataway, USA: IEEE, 2017. 111-128 [14] Tenenbaum J B, de Silva V, Langford J C. A global geometric framework for nonlinear dimensionality reduction. Science, 2000, 290(5500): 2319-2323 doi: 10.1126/science.290.5500.2319 [15] Ioffe S, Szegedy C. Batch normalization: accelerating deep network training by reducing internal covariate shift. In: Proceedings of the 2015 International Conference on Machine Learning. Piscataway, USA: IEEE, 2015. 11-21 [16] Zheng L, Wang S J, Tian L, He F, Liu Z Q, Tian Q. Query-adaptive late fusion for image search and person re-identification. In: Proceedings of the 2015 IEEE Conference on Computer Vision and Pattern Recognition. Piscataway, USA: IEEE, 2015. 1741-1750 [17] LeCun Y, Bottou L, Bengio Y, Haffner P. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 1998, 86(11): 2278-2324 doi: 10.1109/5.726791 [18] Netzer Y, Wang T, Coates A, Bissacco A, Wu B, Na A Y. Reading digits in natural images with unsupervised feature learning. In: Proceedings of the 2011 Neural Information Processing Systems. Massachusetts, USA: MIT Press, 2011. 5-16 [19] Krizhevsky A. Learning Multiple Layers of Features from Tiny Images [Ph. D. dissertation], University of Toronto, Toronto, Canada, 2009. [20] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks. In: Proceedings of the 2012 Neural Information Processing Systems. Massachusetts, USA: MIT Press, 2012. 1106-1114 [21] Dumoulin V, Belghazi I, Poole B, Mastropietro O, Lamb A, Arjovsky M, et al. Adversarially Learned Inference. In: Proceedings of the 2017 International Conference on Learning Representations. Piscataway, USA: IEEE, 2017. 111-128 [22] Kilinc O, Uysal I. GAR: an efficient and scalable graph-based activity regularization for semi-supervised learning. Neurocomputing, 2018, 296: 46-54 doi: 10.1016/j.neucom.2018.03.028 [23] Miyato T, Maeda S, Koyama M, Nakae K, Ishii S. Distributional smoothing with virtual adversarial training. In: Proceedings of the 2016 International Conference on Learning Representations. Piscataway, USA: IEEE, 2016. 1-12 -