2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于模糊不确定观测器的四旋翼飞行器自适应动态面轨迹跟踪控制

王宁 王永

杨刚, 王乐, 戴丽珍, 杨辉. 基于连接自组织发育的稀疏跨越-侧抑制神经网络设计. 自动化学报, 2019, 45(4): 808-818. doi: 10.16383/j.aas.2018.c170374
引用本文: 王宁, 王永. 基于模糊不确定观测器的四旋翼飞行器自适应动态面轨迹跟踪控制. 自动化学报, 2018, 44(4): 685-695. doi: 10.16383/j.aas.2017.c160481
YANG Gang, WANG Le, DAI Li-Zhen, YANG Hui. Design of Sparse Span-lateral Inhibition Neural Network Based on Connection Self-organization Development. ACTA AUTOMATICA SINICA, 2019, 45(4): 808-818. doi: 10.16383/j.aas.2018.c170374
Citation: WANG Ning, WANG Yong. Fuzzy Uncertainty Observer Based Adaptive Dynamic Surface Control for Trajectory Tracking of a Quadrotor. ACTA AUTOMATICA SINICA, 2018, 44(4): 685-695. doi: 10.16383/j.aas.2017.c160481

基于模糊不确定观测器的四旋翼飞行器自适应动态面轨迹跟踪控制

doi: 10.16383/j.aas.2017.c160481
基金项目: 

中央高校科研基本业务费专项资金项目 3132016314

大连市杰出青年科技人才支持计划 2016RJ10

大连市高层次人才创新支持计划 2015R065

国家自然科学基金 51379002

国家自然科学基金 51009017

详细信息
    作者简介:

    王永, 大连海事大学船舶电气工程学院硕士研究生.主要研究方向为自主飞行器控制.E-mail:15241192269@163.com

    通讯作者:

    王宁, 大连海事大学船舶电气工程学院教授.主要研究方向为自主系统与控制, 智能建模与控制, 自主制导与控制.本文通信作者.E-mail:n.wang.dmu.cn@gmail.com

Fuzzy Uncertainty Observer Based Adaptive Dynamic Surface Control for Trajectory Tracking of a Quadrotor

Funds: 

Fundamental Research Funds for the Central Universities 3132016314

Fund for Dalian Distinguished Young Scholars 2016RJ10

Innovation Support Plan for Dalian Highlevel Talents 2015R065

Supported by National Natural Science Foundation of China 51379002

Supported by National Natural Science Foundation of China 51009017

More Information
    Author Bio:

    Master student at the School of Marine Electrical Engineering, Dalian Maritime University. His research interest covers control of autonomous aerial vehicles

    Corresponding author: WANG Ning Professor at the School of Marine Electrical Engineering, Dalian Maritime University. His research interest covers autonomous systems and control, intelligent modeling and control, and autonomous guidance and control. Corresponding author of this paper
  • 摘要: 针对具有未知外界扰动和系统不确定性的四旋翼飞行器,提出了一种基于模糊不确定观测器(Fuzzy uncertainty observer,FUO)的自适应动态面轨迹跟踪控制方法.通过将四旋翼飞行器系统分解为位置、姿态角和角速率三个动态子系统,使得各子系统虚拟控制器能够充分考虑欠驱动约束;采用一阶低通滤波器重构虚拟控制信号及其一阶导数,实现四旋翼跟踪控制设计的迭代解耦;设计了一种模糊不确定观测器,用以估计和补偿未知外界扰动与系统不确定性,从而确保闭环系统的稳定性和跟踪误差与其他系统信号的一致有界性.仿真研究验证了所提出的控制方法的有效性和优越性.
  • 众所周知, 聚类, 支持向量机及神经元网络等常见分类方法都属于浅层分类方法, 在处理蕴藏隐含信息的样本分类问题方面还存在不足.传统的聚类方法对于高维数据来说, 数据样本较低维数据聚类时分布更为稀疏, 且每个数据间的距离都可能相当, 因此难以找到聚类中心, 从而不容易进行分类[1]; SVM属于有监督学习算法, 在处理小样本分类时有一定优势, 然而该方法过于依赖样本数据尺度, 且算法复杂度较高.并且SVM中核函数的选择往往决定了分类的精度和收敛速度, 分类结果存在不确定性[2]; 此外, 由于神经网络缺乏预训练机制, 难以深度挖掘数据中的隐含信息[3].然而深度学习方法以"无监督训练-有监督调解全局网络参数"的框架, 从理论上避免了传统神经元网络易陷入局部极值的缺点[4], 且在挖掘数据隐含信息方面具有独特优势, 尤其是在面临大规模样本数据的时候, 有更加突出的表现.常见的深度学习分为自动编码器, 卷积神经网络和深度置信网络等模型.通过查阅文献, 深度置信网络建模方法在图像处理[5-6]、软测量技术[7]、计算智能[8]等诸多领域得到成功应用, 建模精确度普遍有所提升, 上述理论的成功应用, 为构建基于高维数据非线性特征提取的深度置信网络分类器提供了重要的理论和方法支撑.值得一提的是, 面向含非线性特征的高维数据的深度置信网络建模问题, 信息量上的冗余往往给网络带来不必要的负荷.因此预先对样本数据做特征提取十分必要.

    过程变量的特征提取的目的是找到数据之间的线性以及非线性关系表达, 而后利用提取的低维特征数据表征原有的高维数据.故数据之间的线性以及非线性关系的提取是提取特征的关键.常见的过程数据特征提取方法有主成分分析方法(PCA), 独立主元分析(ICA), 偏最小二乘法(PLS)等.其中, PCA利用高斯分布数据的特征, 将数据映射到正交的低维子空间上, 保留数据的特征[9]; ICA根据已经存在的统计值, 进行独立主成分正交变换[10]; PLS利用线性拟合对多变量建模, 减少变量个数[11].以上方法在数据满足高斯分布和有线性关系的情况下适用, 且效果很好, 但是, 在一类多变量数据且变量分布不定, 且存在非线性关系时, 以上方法并不奏效.所以, 本文应用一类基于输入训练神经网络表征非线性主元分析的方法, 旨在解决在多变量过程中的非线性特征提取问题, 并且实现数据降维, 为后续构建一类新的深度置信网络提供数据预处理的方法支撑.

    空气固体细微污染物PM2.5的形成, 受众多复杂因素影响(已知影响因素超过20种)[12-13].就产生过程而言, PM2.5可以由污染源直接排出(称为一次粒子), 也可以是各污染源排出的气态污染物经过冷凝或在大气中发生复杂的化学反应而生成(称为二次粒子).特别地, 在已知的众多理化因素中, 有别于湿度、风速、降雨等, O$_3$属于驱散因子, 其浓度与PM2.5浓度之间呈指数衰减规律, 此外, 其他因素(光照等)与PM2.5浓度的关系还有待探索[14].因此, PM2.5浓度预测是一类典型的数据维度高, 且数据含非线性特征的建模问题, 传统的基于浅层学习的数据驱动建模方法[15-17]在预测精度上还有待提升, 且不具备对PM2.5浓度影响因素进行诊断的功能.

    受上述讨论启发, 针对过程变量数据维数高, 且含复杂非线性特征, 数据间隐含信息难以利用等特点, 本文提出一类基于非线性特征提取的深度置信网模型, 旨在解决高维数据非线性特征提取以及数据特征中隐含信息挖掘的问题, 并对影响模型输出的关键变量进行诊断.最后, 以一类具体的多变量建模和诊断问题讨论所提方法的应用.本文结构安排如下:第1节展示了基于非线性特征提取的深度置信网络的建模过程; 第2节基于信息熵理论, 对改进后的深度置信网络的建模复杂度优势进行论证; 第3节以河北省某市的PM2.5监测数据为对象, 验证本文所提方法的有效性; 第4节给出结论与工作展望.

    本节提出一类基于非线特征提取的深度置信网网络模型.基于非线性PCA提取原始数据特征, 实现数据预处理.同时计算各变量的统计量, 作为影响因素诊断依据.同时, 将预处理后的数据作为深度置信网的输入以构建预测模型.改进的深度置信网络结构在下文中具体介绍.

    高维多变量过程数据(维度为$N$)之间存在的线性关系可以利用主成分分析的方法, 进行数据特征提取, 实现降维目的.然而, 数据之间存在复杂的非线性关系时, 理论上同样可以利用$A$个主元($A<N$)就可以反映出过程的主要信息.非线性PCA就是一种对${X}$的估计量${\hat{X}}$的非线性表示即:

    $ \begin{equation} {X}={\hat{X}}+{E}=F({T_N})+{E} \end{equation} $

    (1)

    其中, $\hat{X}$是$X$的估计矩阵, ${E}$是残差矩阵, $F(\cdot)$是一个非线性函数, ${T_N}$我们称之为非线性主元得分矩阵.基于Tan等提出的输入训练(Input-training, IT)神经网络的方法[18].本文将IT网络的输入作为非线性主元得分矩阵, IT网络的输出作为原始样本的估计值, 网络调节权值的时候, 不仅调节网络内部的参数, 输入也随之变换.当网络训练完成的时候, 便可以得到${T_N}$, 同时也得到了非线性函数$F(\cdot)$.本文采用三层的输入训练网络, 如图 1所示.

    图 1  三层输入训练神经网络结构图
    Fig. 1  An input training neural network structure with three layers

    整体网络采用快速下降法调节网络间的连接权值.网络的目标函数为$J$:

    $ \begin{eqnarray*} J=\frac{1}{2}\sum\limits_{j=1}^{N}\sum\limits_{i=1}^{M}(X_{ij}-{\hat{X}}_{ij})^2=\frac{1}{2}\sum\limits_{j=1}^{N}{e}^2_j \end{eqnarray*} $

    (2)

    $i$表示变量的维度, $j$表示输出数据的组数, $e_j$则表示每组训练数据的绝对误差.

    深度学习是Hinton等在2006年提出的一种基于概率表达网络模型[19].深度学习的技术可以分为两部分:第一部分是利用无监督的学习来预训练每一层, 第二部分是全网络自上而下的微调权值.由于无监督的方式, 使用所有无标签数据, 所以过程变量包含监督学习所不能表达的隐含信息.本文所提出基于深度置信网的预测模型中, 网络输入是上一级降维后的非线性主元得分矩阵, 输出是预测分类结果.其网络结构如下图所示.本文采用三层的输入训练网络, 如图 1所示.

    图 2  深度置信网的结构
    Fig. 2  The structure of DBN

    自上而下是多层的限制性玻尔兹曼机, 隐含层中每一层的输出, 作为下一层的输入.在这个训练阶段, 在可视层会产生一个向量${\pmb v} $, 通过它将值传递到隐层.反过来, 可视层的输入会去重构原始的输入信号[20].我们定义联合概率分布:

    $ \begin{align} P({\pmb v}\mid {\pmb h})=\, &\dfrac{{\rm exp}(-E({\pmb v}, {\pmb h}))}{{\pmb z}}= \nonumber\\ &\dfrac{1}{{\pmb z}}\prod\limits_{ij}{\rm e}^{W_{ij}v_ih_j}\prod\limits_{i}{\rm e}^{b_iv_j}\prod\limits_{j}{\rm e}^{a_jh_j} \end{align} $

    (3)

    其中${\pmb z}$为:

    $ \begin{equation} {\pmb z}=\sum\limits_{{\pmb h}, {\pmb v}}{\rm exp}(-E({\pmb v}, {\pmb h})) \end{equation} $

    (4)

    $v_i$表示可视层第$i$个节点的输出, $h_j$表示隐含层第$j$个节点的输出.整体网络的参数$\theta=\{W, a, b\}$, $W$是权值参数$a$和$b$分别表示可视层和隐含层的偏置变量.给定可视层的前提下, 隐含层的概率为:

    $ \begin{align} P({\pmb h}\mid{\pmb v})=\, &\prod\limits_{j}p(h_j\mid {\pmb v})p(h_j=1\mid {\pmb v})= \nonumber\\ & \dfrac{1}{1+{\rm exp}(\sum\limits_{i}W_{ij}v_i-a_j)} \end{align} $

    (5)

    这样我们就建立了可视层与隐含层之间的概率表示.同样的, 隐含层之间的概率可表示为:

    $ \begin{align} P({\pmb v}, h_1, &h_2, h_3)=\nonumber \\ &P({\pmb v}\mid h_1)P(h_1\mid h_2)P(h_2 \mid h_3)\end{align} $

    (6)

    对于RBM的学习算法我们采用梯度衰减法.可视层表达的是输入数据的特征, 所以学习算法的目标函数是将可视层的概率最大化.所以有如下最大似然的概率表示:

    $ \begin{align} \frac{\partial {\rm log_e}P({\pmb v})}{\partial \theta }=\, &\frac{\partial {\rm log_e}\sum\limits_{\pmb h}P({\pmb v}, {\pmb h})}{\partial \theta}=\nonumber\\ & \frac{\sum\limits_{\pmb h}{\rm e}^{-energy({\pmb v}, {\pmb h}) \frac{\partial(-energy({\pmb v}, {\pmb h}) }{\partial \theta}}}{\sum\limits_{\pmb h}-energy({\pmb v}, {\pmb h}))} - \nonumber\\ & \frac{\sum\limits_{\pmb v}\sum\limits_{\pmb h}{\rm e}^{(-energy({\pmb v}, {\pmb h})\frac{\partial energy({\pmb v}, {\pmb h}) }{\partial \theta})} }{\sum\limits_{\pmb v}\sum\limits_{\pmb h}(-energy({\pmb v}, {\pmb h}))} \end{align} $

    (7)

    对于标准化的高斯RBM,

    $ \begin{align} energy({\pmb v}, {\pmb h})= \frac{1}{2}{\pmb v}^{\rm T}{\pmb v}-{ a}^{\rm T}{\pmb v}-{ b}^{\rm T}{\pmb h}-{\pmb h}^{\rm T}W{\pmb v}\nonumber\end{align} $

    得到:

    $ \begin{align} \frac{\partial P({\pmb v})}{\partial \theta }=\, &\sum\limits_{\pmb h}P({\pmb h}\mid {\pmb v}) \frac{\partial (-energy({\pmb v}, {\pmb h}) )}{\partial \theta}-\nonumber\\ & \sum\limits_{\pmb v}\sum\limits_{\pmb h}P({\pmb v}, {\pmb h})\frac{\partial (-energy({\pmb v}, {\pmb h})) }{\partial \theta} \end{align} $

    (8)

    由以上的表达式中, 我们可以将前一部分定义为激励部分, 表示为$v$节点的期望值表示; 后一部分作为抑制部分, 表示在联合概率下的期望表示.

    在完成上述数据降维与非线性特征提取之后, 对影响因素进行诊断.其中, 本文采用偏导数表示该变量对${T_N}$变化的贡献率大小, 因此对于某一个数据$X_0$, 它对的贡献率[21] $K$为:

    $ \begin{equation} K=\frac{\partial {T_N}}{\partial {X}}\mid _{{X=X_0}} \end{equation} $

    (9)

    基于非线性特征提取的深度置信网络的建立步骤为:

    1) 通过机理确定变量.

    2) 对输入数据进行移除异常值以及零均值归一化.

    3) 设计IT网络以及深度置信网的网络结构.

    4) 选择数据训练IT网络, 得到非线性PCA降维模型, 并计算各变量的统计量, 作为影响因素诊断依据.

    5) 将降维数据输入深度置信网训练网络.

    6) 用检测数据对整个模型进行检验.如果效果不满意, 则返回3).

    整体分类器模型结构如图 3所示.

    图 3  NPCA-DBN模型分类与诊断结构图
    Fig. 3  The classification and diagnosis model with NPCA-DBN

    为深刻揭示本文所提改进型DBN在网络结构和算法复杂度方面的优势, 本节从如下两个方面进行分析:

    1) 网络结构复杂度

    信息熵的概念是1958年香农借鉴热力学上分子混乱程度来描述信息源含信息量的不确定度.从信息学的角度出发, 可以论证所提方法在优化网络结构上的优势, 采用隐含层的信息熵来体现网络的结构性和组织性[22].武妍等在论述提高网络泛化能力优化网络结构中提出通过正则化(惩罚函数)的方法, 来控制网络的"有效复杂度"[23]. Deco等通过构建基于互信息熵的正则函数, 来等效网络的"有效复杂度", 并进行网络结构优化.其中输入层和隐含层之间的互信息熵[24]定义为:

    $ \begin{eqnarray*} H=-\sum\limits_{j=1}^Qc_j{\rm log}c_j+\frac{l}{P}\sum\limits_{l=1}^Q\sum\limits_{j=1}^Qc_{jl}{\rm log}c_{jl} \end{eqnarray*} $

    (10)

    其中, $P$为输入样本数, $Q$为隐含层节点数, $c_{jl}$为第$l$个样本对第$j$个隐含单元的归一化输出, $c_j$为平均值.熵的单位取决于定义用到对数的底, 当底数为2, 熵的单位是bit; 当底数为e, 熵的单位是nat; 而当底数为10, 熵的单位是Hart.

    定理1. 面向具有相同特征的样本数据设计的两个训练深度网络net1和net2, 若网络"有效复杂度"相同($H_{\rm net1}$=$H_{\rm net2}$), 当网络的输入层节点$P_{\rm net1}$ $<$ $P_{\rm net2}$时, 则有, 网络的隐含层节点总和$Q_{\rm net1}$ $<$ $Q_{\rm net2}$.

    证明. 假设原DBN网络(net1)的互信息熵函数已是最小化, 其中第一层RBM完全反映了输入层和隐含层的互信息.根据信息熵原理, 则有[25]:

    $ \begin{eqnarray*} -\sum\limits_{j=1}^Qc_j{\rm log}c_j=-\sum\limits_{j=1}^{Q_l}\frac{l}{Q_l}{\rm log}\frac{l}{Q_l}={\rm log}Q_l \end{eqnarray*} $

    (11)

    $Q_l$代表隐含层第一层的节点数.将式(11)代入式(10)中可得:

    $ \begin{equation} H={\rm log}Q_l+\frac{l}{P}\sum\limits_{l=1}^{P}\sum\limits_j^{Q_l}c_{jl}{\rm log}c_{jl} \end{equation} $

    (12)

    基于DBN原理, 本文提出的改进型DBN网络(net2)应使每一个RBM都能完全重构输入变量, 因此, 也应使所有互信息熵最小化, 则有改进方法后的互信息熵为$H'$:

    $ \begin{equation} H'={\rm log}Q'_l+\frac{l}{P'}\sum\limits_{l=1}^{P'}\sum\limits_{j'}^{Q'_l}c_{j'l}{\rm log}c_{j'l} \end{equation} $

    (13)

    又因为, 如完全重构原始输入变量, (由于假设NPCA完全提取了原来样本数据中的特征信息, 因此, net2中第一层RBM依然为求解隐含层节点到原始样本信息的映射关系), 则必有:

    $ \begin{equation} \sum\limits_{j'}^{Q'_l}c_{j'l}{\rm log}c_{j'l}=\sum\limits_j^{Q_l}c_{jl}{\rm log}c_{jl} \end{equation} $

    (14)

    此外, 因为同样满足互信息熵最小化, (对于同一样本数据, 我们采用同种DBN网络结构进行信息映射时, "有效复杂度"应该相等.也就是正则函数相等), 即$H=H'$, 因此当$P'\leq P$时, 则必有$Q'_l\leq Q_l$.同理, 后续隐含层之间的RBM节点个数同样具有此规律.因此可得, $Q_{\rm net2}=Q'_1+Q'_2+\cdots+Q'_n\leq Q_{\rm net1}=Q_1+Q_2+\cdots+Q_n$ ($n$为网络的隐含层总层数).综上可以得到改进后的网络总节点存在$S_{\rm net1}<S_{\rm net2}$.

    2) 算法复杂度分析

    算法的复杂度就是对算法计算所需要的时间和空间的一种度量[25].一般将算法的复杂度分为时间复杂度和空间复杂度.时间复杂度是以算法结构主体执行循环次数为依据, 空间复杂度以程序主体占据空间为依据[26].一个算法中的语句执行次数称为语句频度或时间频度, 记为$T(n)$, 若有某个辅助函数$f(n)$, 使得当$n$趋近于无穷大时, $T(n)/f(n)$的极限值为不等于零的常数, 则称$f(n)$是$T(n)$的同数量级函数, 记作$T(n)={\rm O}(f(n))$, 称${\rm O}(f(n))$为算法的渐进时间复杂度, 简称时间复杂度.用O代表一个算法的计算复杂度, 算法中的循环语句是算法的主体, 若算法中含有并列的算法, 则将并列的算法复杂度相加.例如:

    for $i=1:n$

       $x=x+1;$

    end

    for $i=1:n$

       for $j=1:n$

          $x=x+1;$

       end

    end

    第一个for循环的复杂度为O$(n)$, 第二个循环的复杂度为O$(n2)$, 则整个算法的复杂度为O$(n+n2)={\rm O}(n2)$.

    定理2. 假设存在一个DBN网络, 其结构为含有$n$层隐含层, 隐含层节点数为$[h_1, h_2, \cdots, h_n]$.则存在一类基于ITNN神经网络的非线性特征提取机制的DBN (假设该机制可以有效保证数据的互信息熵不变), 当DBN主结构的节点数可以减小到$[h_1', h_2', \cdots, h_n']$, 预处理IT网络部分隐含层节点数为$h_0$, 且满足ITNN的隐含层节点数$h_0<\beta$, 则有:改进后DBN的时间复杂度降低小于原DBN.其中,

    $ \begin{equation} \beta =\prod\limits_{1}^{n}h_n-\prod\limits_{1}^{n}h'_n \end{equation} $

    (15)

    证明.

    1) 传统DBN算法的伪代码如下:

    for (1:DBN的隐含层第一层节点数$h_1$)

      for (1:DBN的隐含层第二层节点数$h_2$)

        $\cdots$

          for (1:DBN的隐含层第$n$层节点数$h_n$)

            计算网络的目标函数是否符合要求

          end

        $\cdots$

        end

    end

    所以DBN的复杂度为O(DBN)= $\prod_{1}^{n}h_n$

    2) NPCA-DBN算法的伪代码如下:

    for (1:NPCA的隐含层节点数$h_0$)

      计算输入训练网络的目标函数是否符合要求

    end

    for (1:DBN的隐含层第一层节点数$h_1'$)

      for (1:DBN的隐含层第二层节点数$h_2'$)

        $\cdots$

          for (1:DBN的隐含层第$n$层节点数$h_n'$)

            计算网络的目标函数是否符合要求

          end

        $\cdots$

      end

    end

    故所提算法的复杂度为O(NPCA-DBN)$=h0+\prod_{1}^{n}h'_n$若$h0<\prod_{1}^{n}h_n-\prod_{1}^{n}h'_n$, 则有: O(NPCA-DBN)-O(DBN)\, $<$\, 0, 即改进型DBN的时间复杂度降低.此外, 由于改进型DBN降低了原DBN结构中的隐含层节点数, 则有效降低算法的空间复杂度. \hfill$\square$ \section{实例研究} PM2.5预测和影响因素诊断涉及的变量众多, 而且影响变量之间多存在关联, 本节给出了PM2.5浓度预测与超标影响因素诊断方法并进行了数值验证.

    PM2.5预测和影响因素诊断涉及的变量众多,而且影响变量之间多存在关联,本节给出了PM2.5浓度预测与超标影响因素诊断方法并进行了数值验证.

    基于第二节所提混合分类器模型, 选用相关污染物和气象因素作为输入, 提取主元非线性特征之后, 输入深度置信网, 来进行预测, 并根据统计量信息诊断PM2.5浓度超标原因.算法建立的步骤如下:

    1) 选择历史数据, 并建立非线性PCA和深度置信网的模型.

    2) 训练模型.

    3) 检测模型效果.

    4) 得出预测及诊断结果.

    图 4所示.

    图 4  PM2.5预测诊断流程图
    Fig. 4  The flow chart of PM2.5 concentration$'$s prediction and diagnosis

    为验证本文混合模型的有效性, 采取河北省某市地表水厂, 华电二区和胶片厂三个检测点于2014年11月至2015年4月间的监测数据作为实验数据.其中, 为分析检测数据, 依据文献[27]选取相关污染物如: PM10, SO$_2$, NO, CO, O$_3$, 气象数据如:风速, 风向, 温度, 湿度, 相关空气指数数:空气指数AQI.实验采用500个训练样本, 100个检测样本, 模型训练次数设置为50 000次.

    1) 网络结构

    基于本文所提出的改进DBN模型, 利用历史数据, 进行PM2.5的浓度预测, 本文采用实验的方式获得模型的结构, 并与传统的预测DBN模型进行对比.在参考其他文献以及经验规则的基础上, 通过实验获得改进DBN的网络结构, 如图 5所示.

    图 5  不同结构预测的平均相对误差
    Fig. 5  The classification and diagnosis model with NPCA-DBN

    图 5中: xx-xx-xx为隐含层的结构, 代表DBN三层主结构中的隐含层和内部节点分配.可见试验后得到DBN主结构隐含层的节点数结构为10-6-6为本次使用的网络结构, 其中数据预处理阶段采用的浅层学习网络采用试验方法得到有一层隐含层节点, 非线性节点数为10.对比传统DBN网络结构, 两者间的对比关系如表 1所示.

    表 1  网络结构对比
    Table 1  The comparison of the network structure
    模型 结构 隐含层节点数 总节点数 算法总空间复杂度
    NPCA-DBN (6-10-10) + (6-10-6-6-1) 32 55 $6\times 10\times 10+6\times 10\times 6\times 6\times 1$
    DBN 10-12-10-10-1 32 43 $10\times 12\times 10\times 10$
    下载: 导出CSV 
    | 显示表格

    其中(6-10-10) + (6-10-6-6-1)代表网络整体结构, 对于预处理阶段的浅层网络有6-10-10的网络结构, DBN主结构的输入层为6个节点, 隐含层为三层, 第一层是10个节点, 第二层和第三层为6个节点, 一个输出的结构, 由于改进的DBN的两部分的节点不在同一个网络嵌套中, 故为两个部分的复杂度相加.由上表我们可以清楚地看出改进的DBN模型在主结构中的深层网络中, 大大减少了非线性节点的个数, 从而在算法复杂度上实现数量级上的减小.

    2) 建模精度对比实验

    预测阶段采用检测输出的平均相对误差MRE (Mean relative error)来表示预测的精度.

    $ \begin{equation} {\rm MRE}=\frac{\sum\limits_{j=1}^{m}\left(\frac{\left |X_{obs, j}-X_{exp, j} \right |} {X_{exp, j}}\right)}{m} \end{equation} $

    (16)

    其中, $m$是检测数据的样本数. $X_{obs, j}$表示检测数据的输出值, $X_{exp, j}$表示检测数据的真值.平均相对误差反映出了在预测上偏离真值的平均水平.为清晰展现本文所提DBN的优势, 以华电二区监测点为例, 图 6图 7分别给出了改进DBN与传统的DBN、SVM和PLS在预测效果上的对比结果和建模误差趋势.

    图 6  华电二区的预测效果对比图
    Fig. 6  The comparison in the second area of Huadian with different structures
    图 7  不同结构预测的平均相对误差
    Fig. 7  The MRE of different structures

    图 6中, 横坐标为监测数据的100个采样点, 纵坐标为PM2.5的浓度.其中*代表模型输出的预测值, o代表实际值.我们可以直观地看出, 改进DBN的模型预测效果更佳, 同时比传统的分类方法在精度上有所提升.

    图 7中横坐标代表 100个监测时间点, 纵坐标代表各个预测值的相对误差.由图 6图 7可以清晰地展现出, 改进DBN模型的预测精度并没有因为降低输入的维度而降低.通过对比分析, 我们可以得到:首先, 传统DBN没有经过降维预处理, 预测精度不高; 另外, 由于DBN在处理海量数据建模时有显著的优势, 而本实验训练样本为500个, 因此, 所提改进的DBN在预测精度上与SVM提升不明显; 其次, 与ANN(BP)方法对比, 是因为BP只有一个隐含层, 属于浅层学习, 训练网络深度不足; 最后, PLS适用于处理线性模型的预测问题, 对非线性关系的建模精度欠佳.此外, 基于多种非线性特征提取机制下的复合分类预测方法, 表 2给出了该市地表水厂, 华电二区和胶片厂周边PM2.5浓度的建模精度和收敛速度对比.

    表 2  建模精度与收敛速度对比
    Table 2  The comparison of the network structure
    监测点 指标 NPCA-DBN NPCA-ANN NPCA-SVM NPCA-PLS DBN ANN SVM PLS
    地表 MRE ($\times10^{-2}$) 13.32 22.21 13.14 26.82 17.92 23.40 12.19 24.54
    水厂 训练时间(s) 44 16 180 46 89 33 349 94
    华电 MRE ($\times10^{-2}$) 14.57 25.15 13.04 29.48 17.01 24.16 10.22 27.16
    二区 训练时间(s) 37 12 211 49 90 38 401 103
    胶片 MRE ($\times10^{-2}$) 10.51 26.49 11.09 33.16 12.77 23.32 12.73 30.06
    训练时间(s) 42 16 198 57 108 42 399 108
    下载: 导出CSV 
    | 显示表格

    表 2我们可以得到, 本文所提改进DBN在建模精度和收敛速度上都有较大提升, NPCA数据预处理算法通过提取数据之间的非线性特征, 得到原有数据的非线性表达, 对于网络化表达的机器学习算法可以提高建模精度, 并降低训练时间.特别的, 同样采用NPCA数据预处理机制的复合分类方法, 对于基于线性化拟合的浅层学习算法随着训练时间的降低, 建模精度有所下降.

    基于所提出改进DBN的影响因素诊断方法, 在实验中, 我们将空气质量指数, PM10浓度, SO$_2$、CO、NO$_2$、O$_3$气体浓度, 风向, 风速, 相对湿度, 温度等10个过程变量作为诊断部分的输入变量.由于该地区的特殊性, 在4 000多次的采样数据中, 有二分之一采样点数据的PM2.5浓度都高于$100\, {\rm \mu g/m^3}$, 所以, 为了展现模型对PM2.5影响因素诊断结果, 我们实验设置的PM2.5预测限为$200{\rm \mu g/m^3}$, 即处于重度污染的情况下, 计算输入变量中对于结果的贡献率[28].并用贡献图的方式表达影响因素诊断结果.我国对PM2.5浓度级别划分如表 3所示[29].

    表 3  PM2.5浓度级别
    Table 3  The PM2.5 concentration level
    浓度范围(${\rm \mu g/m^3}$) 级别 优良级别
    0$\, \sim\, $50 1级
    50$\, \sim\, $100 2级
    101$\, \sim\, $150 3级 轻度污染
    151$\, \sim\, $200 4级 中度污染
    201$\, \sim\, $ 5级 重度污染
    下载: 导出CSV 
    | 显示表格

    在历史数据中选定所有未超限数据对应的输入, 求平均水平代表未超限数据组合作为参考输入变量集: reference (152, 168, 63, 1.55, 50, 42, 163, 2.26, 0.63, 3.88)针对华电二区监测区域, 在图 8中, 我们以超限组第20组贡献图为例说明诊断过程.

    图 8  华电二区超限数据贡献图
    Fig. 8  The contribution chart of the overrun data in the second area of Huadian

    由贡献图可以看出, 第七个变量对结果的贡献最大.我们观察验证第83组数据输入变量集为: $X_{20}= $ (179, 207, 79, 1.78, 73, 177, 266, 3.07, 0.44, 7.34)第6个变量的相对偏差为最大, 因此诊断结果为:造成此次污染物浓度过高的首要原因是风速的原因.

    从上述实验可以看出, 本文提出的改进的DBN模型在预测效果上并没有使精度降低, 同时, 加快了模型的收敛速度.并且在超标诊断中, 平均超标检测率达到$85\, \%$, 能够有效地诊断出PM2.5浓度超标的主要因素.

    本文提出的基于非线性特征提取的DBN模型能够有效完成含复杂非线性特征关系高维数据的预测建模诊断任务.基于信息熵理论, 证明了本文所提DBN模型相比传统DBN, 能够在不降低建模精度的同时, 达到降低网络和算法复杂度的优势, 对于深度学习理论在海量数据挖掘中的应用具有重要理论意义.将所提建模方法应用到一类PM2.5浓度预测与诊断问题中, 并与传统DBN、SVM、ANN、PLS等分类方法和含NPCA数据预处理机制的复合分类方法做了详细对比, 验证了所提方法的优势与正确性.需要说明的是, 本文采取基于数据驱动的方法对PM2.5进行浓度预测和影响因素诊断, 在PM2.5的形成机理上还未做过多的分析, 在未来的研究中将深入探讨PM2.5浓度变化机理.此外, 由于本文数据来源于特定城市的采样点, 因此在方法的适用性方面还要做深入的研究.下一步的工作将分为以下两部分进行: 1)理论方面, 面向深度置信网络结构本身的优化方法的研究, 研究自适应样本数据特征的网络模型结构. 2)应用方面, 尝试将所提方法应用到复杂流程工业的建模和诊断问题中.


  • 本文责任编委 孙富春
  • 图  1  四旋翼飞行器结构图

    Fig.  1  The configuration of a quadrotor

    图  2  空间轨迹跟踪

    Fig.  2  Trajectory tracking

    图  3  $x$, $y$, $z$和$\psi$给定和实际状态

    Fig.  3  Desired and actual states $x$, $y$, $z$ and $\psi$

    图  4  跟踪误差

    Fig.  4  The tracking errors

    图  5  控制输入

    Fig.  5  Control inputs

    图  6  横滚角$\phi$和俯仰角$\theta$

    Fig.  6  Roll and pitch angles, i.e., $\phi$ and $\theta$

    图  7  角速率$p, q$$r$

    Fig.  7  Angular velocities $p$$,q$ and $r$

    图  8  未知非线性

    Fig.  8  Unknown nonlinearities

    表  1  四旋翼飞行器主要参数

    Table  1  The main parameters of the quadrotor

    m 1.2 kg
    Jx 0.015 kg·m2
    Jy 0.015 kg·m2
    Jz 0.026 kg·m2
    Dx 10-6 N(m/s)-2
    Dy 10-6 N(m/s)-2
    Dz 10-4 N(m/s)-2
    g 9.81 m/s2
    下载: 导出CSV
  • [1] Driessens S, Pounds P. The triangular quadrotor:a more efficient quadrotor configuration. IEEE Transactions on Robotics, 2015, 31(6):1517-1526 doi: 10.1109/TRO.2015.2479877
    [2] 王飞, 崔金强, 陈本美, 李崇兴.一套完整的基于视觉光流和激光扫描测距的室内无人机导航系统.自动化学报, 2013, 39(11):1889-1900 http://www.aas.net.cn/CN/abstract/abstract18228.shtml

    Wang Fei, Cui Jin-Qiang, Chen Ben-Mei, Lee T H. A comprehensive UAV indoor navigation system based on vision optical flow and laser FastSLAM. Acta Automatica Sinica, 2013, 39(11):1889-1900 http://www.aas.net.cn/CN/abstract/abstract18228.shtml
    [3] Elfeky M, Elshafei M, Saif A W A, Al-Malki M F. Quadrotor with tiltable rotors for manned applications. In: Proceedings of the 11th International Multi-Conference on Systems, Signals & Devices. Barcelona, Spain: IEEE, 2014. 1-5
    [4] Alexis K, Nikolakopoulos G, Tzes A. Model predictive quadrotor control:attitude, altitude and position experimental studies. IET Control Theory & Applications, 2012, 6(12):1812-1827 http://ltu.diva-portal.org/smash/record.jsf?pid=diva2%3A980101&dswid=-736
    [5] Li H Y, Wang J H, Shi P. Output-feedback based sliding mode control for fuzzy systems with actuator saturation. IEEE Transactions on Fuzzy Systems, 2016, 24(6):1282-1293 doi: 10.1109/TFUZZ.2015.2513085
    [6] Cabecinhas D, Naldi R, Silvestre C, Cunha R, Marconi L. Robust landing and sliding maneuver hybrid controller for a quadrotor vehicle. IEEE Transactions on Control Systems Technology, 2016, 24(2):400-412 doi: 10.1109/TCST.2015.2454445
    [7] Zhu J C, Liu E D, Guo S, Xu C. A gradient optimization based PID tuning approach on quadrotor. In: Proceedings of the 27th Chinese Control and Decision Conference. Qingdao, China: IEEE, 2015. 1588-1593
    [8] Yacef F, Bouhali O, Hamerlain M. Adaptive fuzzy backstepping control for trajectory tracking of unmanned aerial quadrotor. In: Proceedings of the 2014 International Conference on Unmanned Aircraft Systems. Orlando, FL, USA: IEEE, 2014. 920-927
    [9] Basri M A M, Husain A R, Danapalasingam K A. Nonlinear control of an autonomous quadrotor unmanned aerial vehicle using backstepping controller optimized by particle swarm optimization. Journal of Engineering Science & Technology Review, 2015, 8(3):39-45 https://www.researchgate.net/publication/285220292_Nonlinear_Control_of_an_Autonomous_Quadrotor_Unmanned_Aerial_Vehicle_using_Backstepping_Controller_Optimized_by_Particle_Swarm_Optimization
    [10] Dolatabadi S H, Yazdanpanah M J. MIMO sliding mode and backstepping control for a quadrotor UAV. In: Proceedings of the 23rd Iranian Conference on Electrical Engineering. Tehran, Iran: IEEE, 2015. 994-999
    [11] Runcharoon K, Srichatrapimuk V. Sliding mode control of quadrotor. In: Proceedings of the 2013 International Conference on Technological Advances in Electrical, Electronics and Computer Engineering (TAEECE). Konya, Turkey: IEEE, 2013. 552-557
    [12] Li S, Li B K, Geng Q B. Adaptive sliding mode control for quadrotor helicopters. In: Proceedings of the 33rd Chinese Control Conference. Nanjing, China: IEEE, 2014. 71-76
    [13] Chen F Y, Jiang R Q, Zhang K K, Jiang B, Tao G. Robust backstepping sliding-mode control and observer-based fault estimation for a quadrotor UAV. IEEE Transactions on Industrial Electronics, 2016, 63(8):5044-5056 https://ieeexplore.ieee.org/abstract/document/7448915/
    [14] Gao H W, Liu C Y, Guo D L, Liu J G. Fuzzy adaptive PD control for quadrotor helicopter. In: Proceedings of the 2015 IEEE International Conference on Cyber Technology in Automation, Control, and Intelligent Systems (CYBER). Shenyang, China: IEEE, 2015. 281-286
    [15] Mao X, Zhang H B, Han D F. T-S fuzzy control for a quad-rotor UAV. In: Proceedings of the 34th Chinese Control Conference (CCC). Hangzhou, China: IEEE, 2015. 3617-3622
    [16] Benavidez P, Lambert J, Jaimes A, Jamshidi M. Landing of an Ardrone 2. 0 quadcopter on a mobile base using fuzzy logic. In: Proceedings of the 2014 World Automation Congress (WAC). Waikoloa, HI, Qatar: IEEE, 2014. 803-812
    [17] 王宁, 王永, 余明裕.四旋翼飞行器自适应动态面轨迹跟踪控制.控制与决策, 2017, 34(9):1185-1194 https://image.hanspub.org/xml/14697.xml

    Wang Ning, Wang Yong, Er Meng Joo, Adaptive dynamic surface trajectory tracking control of a quadrotor unmanned aerial vehicle.Control and Decision, 2017, 34(9):1185-1194 https://image.hanspub.org/xml/14697.xml
    [18] Zhou W D, Zhu P X, Wang C L, Chu M. Position and attitude tracking control for a quadrotor UAV based on terminal sliding mode control. In: Proceedings of the 34th Chinese Control Conference. Hangzhou, China: IEEE, 2015. 3398-3404
    [19] Modirrousta A, Khodabandeh M. Adaptive robust sliding mode controller design for full control of quadrotor with external disturbances. In: Proceedings of the 2nd RSI/ISM International Conference on Robotics and Mechatronics (ICRoM). Tehran, Iran: IEEE, 2014. 870-877
    [20] Zhang X, Xian B, Zhao B, Zhang Y. Autonomous flight control of a nano quadrotor helicopter in a GPS-denied environment using on-board vision. IEEE Transactions on Industrial Electronics, 2015, 62(10):6392-6403 doi: 10.1109/TIE.2015.2420036
    [21] Besnard L, Shtessel Y B, Landrum B. Quadrotor vehicle control via sliding mode controller driven by sliding mode disturbance observer. Journal of the Franklin Institute, 2011, 349(2):658-684 https://www.sciencedirect.com/science/article/pii/S0016003211001839
    [22] Rashad R, Aboudonia A, El-Badawy A. Backstepping trajectory tracking control of a quadrotor with disturbance rejection. In: Proceedings of the 25th International Conference on Information, Communication and Automation Technologies (ICAT). Sarajevo, Yugoslavia: IEEE, 2015. 1-7
    [23] Yang Y, Wu Q X, Chen M. Robust trajectory tracking control for a quadrotor unmanned aerial vehicle using disturbance observer. In: Proceedings of the 12th World Congress on Intelligent Control and Automation (WCICA). Guilin, China: IEEE, 2016. 697-702
    [24] Wang J, Du J K, Chen F Y, Jiang B, Tao G. Direct adaptive control scheme for a quadrotor helicopter with actuator failures via quantum logic. Journal of Aerospace Engineering, 2016, 29(5):Article No.04016026 https://trid.trb.org/view.aspx?id=1401461
    [25] Gharib M R, Moavenian M. Full dynamics and control of a quadrotor using quantitative feedback theory. International Journal of Numerical Modelling-Electronic Networks, Devices and Fields, 2016, 29(3):501-519 doi: 10.1002/jnm.v29.3
    [26] Sun H B, Hou L L, Li Y K. Disturbance observer based dynamic surface tracking control for a class of uncertain nonlinear systems with mismatched disturbances. In: Proceedings of the 12th World Congress on Intelligent Control and Automation (WCICA). Guilin, China: IEEE, 2016. 605-610
  • 期刊类型引用(6)

    1. 王创,陈文杰,陈伟海,孙先涛,林岩. 适应人体重心起伏的悬吊减重康复系统设计. 北京航空航天大学学报. 2024(07): 2322-2330 . 百度学术
    2. 徐丹,黎华茂,杨慧,卫星,刘曦明,丁然,黄礼群,许萌. 悬吊运动疗法在青年军人膝关节前交叉韧带重建同期半月板缝合术后康复中的作用. 创伤外科杂志. 2023(08): 579-585 . 百度学术
    3. 高海波,牛福亮,刘振,于海涛,李楠. 悬吊式微低重力环境模拟技术研究现状与展望. 航空学报. 2021(01): 80-99 . 百度学术
    4. 于宁波,邹武林. 有限频域约束下串联弹性驱动器的刚度控制. 控制理论与应用. 2019(05): 711-719 . 百度学术
    5. 张从鹏,李小龙,解毅. 动态减重康复机器人控制系统开发. 机械工程师. 2019(09): 14-16 . 百度学术
    6. 申琳. 国际平衡能力研究前沿热点分析与演进. 中国学校体育(高等教育). 2018(01): 56-60 . 百度学术

    其他类型引用(7)

  • 加载中
  • 图(8) / 表(1)
    计量
    • 文章访问数:  2411
    • HTML全文浏览量:  395
    • PDF下载量:  1204
    • 被引次数: 13
    出版历程
    • 收稿日期:  2016-06-20
    • 录用日期:  2017-05-06
    • 刊出日期:  2018-04-20

    目录

    /

    返回文章
    返回