Combustion States Recognition Method of MSWI Process Based on Mixed Data Enhancement
-
摘要: 国内城市固废焚烧(Municipal solid waste incineration, MSWI)过程通常依靠运行专家观察炉内火焰识别燃烧状态后再结合自身经验修正控制策略以维持稳定燃烧, 存在智能化水平低、识别结果具有主观性与随意性等问题. 由于MSWI过程的火焰图像具有强污染、多噪声等特性, 并且存在异常工况数据较为稀缺等问题, 导致传统目标识别方法难以适用. 对此, 提出一种基于混合数据增强的MSWI过程燃烧状态识别方法. 首先, 结合领域专家经验与焚烧炉排结构对燃烧状态进行标定; 接着, 设计由粗调和精调两级组成的深度卷积生成对抗网络(Deep convolutional generative adversarial network, DCGAN)以获取多工况火焰图像; 然后, 采用弗雷歇距离(Fréchet inception distance, FID)对生成式样本进行自适应选择; 最后, 通过非生成式数据增强对样本进行再次扩充, 获得混合增强数据构建卷积神经网络以识别燃烧状态. 基于某MSWI电厂实际运行数据实验, 表明该方法有效地提高了识别网络的泛化性与鲁棒性, 具有良好的识别精度.
-
关键词:
- 城市固废焚烧 /
- 深度卷积生成对抗网络 /
- 燃烧状态识别 /
- 非生成式数据增强 /
- 混合数据增强
Abstract: The municipal solid waste incineration (MSWI) process usually relies on operating experts to observe the flame inside furnace for recognizing the combustion states. Then, by combining the experts' own experience to modify the control strategy to maintain the stable combustion. Thus, this manual mode has disadvantages of low intelligence and the subjectivity and randomness recognition results. The traditional methods are difficult to apply to the MSWI process, which has the characteristics of strong pollution, multiple noise, and scarcity of samples under abnormal conditions. To solve the above problems, a combustion states recognition method of MSWI process based on mixed data enhancement is proposed. Firstly, combustion states are labeled by combining the experience of domain experts and the design structure of furnace grate. Next, a deep convolutional generative adversarial network (DCGAN) consisting of two levels of coarse and fine-tuning was designed to acquire multi-situation flame images. Then, the Fréchet inception distance (FID) is used to adaptively select generated samples. Finally, the sample features are enriched at the second time by using non-generative data enhancement strategy, and a convolutional neural network is constructed based on the mixed enhanced data to recognize the combustion state. Experiments based on actual operating data of a MSWI plant show that this method effectively improves the generalization and robustness of the recognition network and has good recognition accuracy. -
机器人从自由度上可分为非冗余机器人和冗余机器人[1]. 非冗余机器人是指关节自由度小于或等于任务空间维度的机器人. 不同于非冗余机器人, 冗余机器人的关节自由度大于任务空间维度, 其额外的关节自由度提升了控制过程中的灵活性, 使机器人能够实现障碍物躲避等其他附加任务的能力[2-4]. 现存的大多数冗余机器人控制方案都需要准确的机器人模型信息, 如机器人出厂标定的DH (Denavit-Hartenberg)参数[5]. 它通过4个参数确定关节与连杆间的转化关系, 辅助科研人员实现机器人的精确建模. 文献[6]提出一种复杂工作空间下的机器人实时规划方法, 使机器人在跟踪目标运动的同时, 实现了躲避障碍物的功能. 为提高移动机器人搬运物品的效率, 文献[7]提出一种基于双向采样的方案, 用于为给定的移动机器人移动拾取和运输线路生成期望轨迹. 实验表明该方案能够降低35%的移动时间并提升16倍的计算速度. 一种正交投影机器人重复运动方案在文献[8]中提出, 解决了现有的重复运动方案存在的因关节角度误差而导致的位置误差问题. 上述冗余机器人的控制方案都是在假定机器人模型已知的情况下, 设计并构建控制方案驱动机器人完成目标任务. 然而, 机器人的模型信息通常会因实际使用过程中配备不同类型的末端执行器而发生改变. 这会导致此类方案控制精度降低, 甚至导致任务的失败.
数据驱动技术自提出以来就受到了国内外的高度重视[9-10]. 其主要思想是通过收集并利用系统运行过程中大量的在线、离线数据, 实现对系统有效、鲁棒、稳定的建模与控制[11-12]. 数据驱动技术的提出有效地解决了模型不确定或者模型发生改变时的系统控制问题. 已有学者将数据驱动的思想应用于机器人控制领域, 并取得了卓越的成果. 针对机器人在实际使用过程中出现的模型不确定问题, 文献[13]提出一种基于数据驱动的位置/力控制方案, 从运动学的角度解决了模型未知的机器人位置/力控制问题. 文献[14]提出一种加速度层数据驱动的重复运动规划方案, 并构造了相应的递归神经网络, 对模型未知的冗余机器人提供了一种新的加速度层解决方案. 大量研究表明数据驱动技术能够对模型未知的机器人进行有效控制, 具有较强的应用价值.
冗余机器人的轨迹跟踪控制同样是一个重要的研究方向. 机器人面临的大多数任务需要控制机器人的末端执行器沿预定的轨迹运动. 基于速度层、加速度层的算法被提出用于求解冗余机器人的最优解. 值得指出的是, 目前大多数从运动学和优化角度建模的方法存在两方面的不足[15-17]. 一方面, 这些方法基于机器人结构信息已知的情况实现对机器人的控制. 例如, 文献[18]基于冗余机器人的模型构建了一个动态神经网络方法, 实现了良好的控制性能. 然而, 结构信息不准确或未知的机器人是可能存在的. 例如, 物流机器人可能会受到货物形状、重量等因素的影响, 导致其结构信息不准确. 同样地, 自研机器人的设计和制造过程中也可能因人为疏忽或技术限制等原因导致其结构信息错误. 因此, 面向结构信息不准确或未知的机器人, 上述基于准确结构信息的方法将无法被应用. 另一方面, 这些方法仅考虑机器人末端执行器的位置跟踪, 忽略了其姿态控制的重要性. 例如, 文献[14]构建了一个可应用于结构信息未知机器人的重复运动控制方案, 但其仅考虑了末端执行器的位置跟踪, 在一定程度上限制了其应用场景. 事实上, 机器人末端执行器的姿态控制在大多数应用场景下都是不可或缺的, 在机器人执行任务的同时, 还需对其末端执行器姿态加以控制. 例如医疗手术、工业制造等领域[19-20]. 为弥补现有方法以上两方面的不足, 本文构建了基于数据驱动的冗余机器人末端执行器位姿控制方案. 该方案从机器人的运动学出发, 用四元数表示了末端执行器的姿态, 实现了对末端执行器位姿的控制. 此外, 一种神经动力学求解器被设计用于方案求解. 相关的理论分析与仿真实验均验证了方案的有效性与可行性, 与现有冗余机器人位姿控制方案的比较结果体现了所提方案的新颖性.
1. 问题描述
本节从冗余机器人的运动学出发, 给出机器人末端执行器位姿与关节角间的关系, 并推导了四元数的表示方法以控制末端执行器的姿态. 此外, 设计了估计雅可比矩阵的数据驱动算法. 值得注意的是, 所提机器人末端执行器位姿控制方案所涉及到的符号含义在表1 作具体解释.
表 1 所提冗余机器人控制方案的符号含义Table 1 Definitions of variables of the proposed scheme for redundant manipulators符号 含义 $ {{\boldsymbol{\theta}}} \in {\bf{R}}^a $ 机器人关节角向量 $ \dot{\boldsymbol{\theta}}\in {\bf{R}}^a $ 机器人关节角速度向量 $ \dot{\boldsymbol{\theta}}^{-}(\dot{\boldsymbol{\theta}}^{+}) $ 关节角速度的下界(上界) $ {\boldsymbol r}\in {\bf{R}}^b $ 末端执行器的位置向量 $ \boldsymbol{r}^{d}\in {\bf{R}}^b $ 末端执行器的期望位置向量 $ \dot{\boldsymbol r}\in {\bf{R}}^b $ 末端执行器的速度向量 $ \dot{\hat{\boldsymbol r}}\in {\bf{R}}^b $ 末端执行器的估计速度向量 $ f(\cdot): {\bf{R}}^a \rightarrow {\bf{R}}^b $ 机器人非线性前向运动学映射 $ J=\dfrac{\partial f({{\boldsymbol{\theta}}})}{\partial {{\boldsymbol{\theta}}}}\in {\bf{R}}^{b\times a} $ 机器人雅可比矩阵 $ \hat{J}\in {\bf{R}}^{b\times a} $ 机器人估计雅可比矩阵 $ {\dot{\hat{J}}}\in {\bf{R}}^{b\times a} $ 机器人估计雅可比矩阵的导数 $ M(\boldsymbol \theta)\in {\bf{R}}^{3\times 3} $ 末端执行器的方向旋转矩阵 $ {\boldsymbol q}_{E}(\boldsymbol \theta)\in {\bf{R}}^{4} $ 末端执行器的方向四元数 $ \boldsymbol{\overline{o}}(\boldsymbol \theta)\in {\bf{R}}^{5} $ 末端执行器的方向向量 $ \tilde{\boldsymbol q}\in {\bf{R}}^{5} $ 末端执行器的期望方向向量 $ H({\boldsymbol \theta})=\dfrac{\partial{\boldsymbol q}_{E}(\boldsymbol \theta)}{\partial{\boldsymbol \theta}}\in {\bf{R}}^{4\times a} $ $ {\boldsymbol q}_{E} $ 的雅可比矩阵 $ G({\boldsymbol{\theta}})=\dfrac{\partial{\boldsymbol{\overline{o}}({\boldsymbol{\theta}}})}{\partial{{\boldsymbol{\theta}}}}\in {\bf{R}}^{5\times a} $ $ \boldsymbol{\overline{o}}({\boldsymbol{\theta}}) $的雅可比矩阵 $ \kappa(\boldsymbol q)=\dfrac{\partial{{\tilde{\boldsymbol q}}}}{\partial{\boldsymbol q}}\in {\bf{R}}^{5\times 4} $ $ \tilde{\boldsymbol q} $ 的雅可比矩阵 $ \boldsymbol{u}\in {\bf{R}}^a $ 方差为极小值的独立同分布零均值随机噪声 ${\boldsymbol{u} }_{0}\in {\bf{R} }^a$ $ \boldsymbol{u} $的上界 $ \hat{\dot{{\boldsymbol{\theta}}}}\in {\bf{R}}^a $ 受噪声驱动的关节角速度 $ \Vert \cdot \Vert_2 $ 向量的二范数 $ \mathrm{tr(\cdot)} $ 矩阵的迹 1.1 基础知识
冗余机器人的冗余度解析在其控制过程中十分重要. 冗余机器人的$ a $维自由度能够通过非线性映射函数转化到$ b $维的末端笛卡尔坐标系空间, 具体的数学表达式为
$$ \begin{array}{*{20}{l}} f({{\boldsymbol{\theta}}})={{\boldsymbol{r}}}\end{array} $$ (1) 进一步, 对式(1)关于时间求导, 可得
$$ \begin{array}{*{20}{l}} J\dot{{\boldsymbol{\theta}}}=\dot{{\boldsymbol{r}}}\end{array} $$ (2) 冗余机器人的末端执行器在任务空间中通常需要保持特定角度, 因此需要对末端执行器的位姿加以控制. 机器人末端执行器的姿态信息通常用旋转矩阵$ M $表示, 即
$$ \begin{array}{*{20}{l}} M({\boldsymbol{\theta}})= \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{bmatrix} \end{array} $$ (3) 其中, $a_{ij}\;(i,j\in{1,2,3})$表示矩阵$ M $中的第$ i $行$ j $列个元素. 四元数由实数加上三个虚数单位组成, 主要用于在三维空间中表示旋转操作. 末端执行器的四元数可以看作是将基坐标系绕向量旋转得到的一个新的坐标系. 因此, 本文使用四元数表示末端执行器的姿态. 定义一个归一化四元数为
$$ {{\boldsymbol{q}}(\phi,\boldsymbol{n})=\left[\cos\frac{\phi}{2},\sin\frac{\phi}{2}{\boldsymbol{n}}\right]=[\phi,v_{x},v_{y},v_{z}]^\text{T}} $$ (4) 其中, $ \phi $表示旋转角度; $ {\boldsymbol{n}}$表示旋转轴向量. 由式(4)可得
$$ \left\{ \begin{split} &\phi=\cos\frac{\phi}{2}, \quad v_{x}=\sin\frac{\phi}{2}{n}_{x} \\ &v_{y}=\sin\frac{\phi}{2}{n}_{y}, \quad v_{z}=\sin\frac{\phi}{2}{n}_{z} \end{split} \right.$$ (5) 式(5)中四元数的复数形式可以表示为${\boldsymbol{q}}=\phi \;+ v_{x}{{\rm{i}}}+ v_{y}{\rm{j}} + v_{z}{\rm{k}}$. 符号${{\rm{i}}}$, ${{\rm{j}}}$, ${{\rm{k}}}$分别表示x轴, y轴, z轴方向的虚数单位. 根据四元数的定义, 可得
$$ \begin{array}{*{20}{l}} ||{\boldsymbol{q}}||_{2}=v_{x}^{2}+v_{y}^{2}+v_{z}^{2}+\phi^{2}=1 \end{array}$$ (6) 1.2 四元数与姿态控制
对于基坐标系的向量$ \boldsymbol s=[s_{x},s_{y},s_{z}]^\mathrm{T} $, 可以通过旋转运算写为四元数的形式$ {\tilde{{\boldsymbol{s}}}=[0,s_{x},s_{y},s_{z}]^\mathrm{T}}$. 在此基础上, 变换后的坐标可以表示为${ \boldsymbol s}_{w}={\boldsymbol q}\;\cdot {\boldsymbol s} \cdot {\boldsymbol q}^{\ast} .$ 其中“$ \cdot $”表示四元数的乘法, $ \boldsymbol q^{\ast} $为$ \boldsymbol q $的共轭形式. 给定四元数$ \boldsymbol q $ 的旋转矩阵排列可以表示为
$$ \begin{split} & R({{\boldsymbol{q}}})=\\ &\quad\begin{bmatrix} 1-2v_{y}^{2}-2v_{z}^{2} \quad & 2v_{x}v_{y}-2v_{z}\phi \quad & 2v_{x}v_{z}+2v_{y}\phi\\ 2v_{x}v_{y}+2v_{z}\phi \quad & 1-2v_{x}^{2}-2v_{z}^{2} \quad & 2v_{y}v_{z}-2v_{x}\phi \\ 2v_{x}v_{z}+2v_{y}\phi \quad & 2v_{y}v_{z}+2v_{x}\phi \quad & 1-2v_{x}^{2}-2v_{y}^{2} \end{bmatrix} \end{split} $$ (7) 联立式(3), (6), (7), 机器人末端执行器的方向可以用四元数$ {{\boldsymbol{q}}_{E}(\boldsymbol \theta)=[\phi^{e},v_{x}^{e},v_{y}^{e},v_{z}^{e}]^\text{T}}$表示为
$$ \left\{ \begin{aligned} &\phi^{e}({\boldsymbol{\theta}}) =\frac{\sqrt{{\text{tr}}(\tilde{{\boldsymbol{q}}})+1}}{2}\\ &v_{x}^{e}({\boldsymbol{\theta}}) = \frac{a_{32}-a_{23}}{4\phi} \\ & v_{y}^{e}({\boldsymbol{\theta}}) = \frac{a_{13}-a_{31}}{4\phi} \\ & v_{z}^{e}({\boldsymbol{\theta}}) = \frac{a_{21}-a_{12}}{4\phi} \end{aligned} \right. $$ (8) 对式(8)关于时间求导, 可得运动学控制式为
$$ {\dot{{\boldsymbol{q}}}^{e}=\frac{\partial{\boldsymbol{q}}_{E}(\boldsymbol \theta)}{\partial{\boldsymbol{\theta}}}\frac{\partial{\boldsymbol{\theta}}}{\partial t}=H({\boldsymbol{\theta}}){\dot{\boldsymbol{\theta}}}} $$ (9) 在此基础上, 机器人末端执行器的方向由旋转矩阵$ M(\boldsymbol \theta) $控制, 进一步可以推广到四元数的实时跟踪即旋转矩阵$ R({\boldsymbol{q}}) $的收敛问题. 由于旋转矩阵$ M(\boldsymbol \theta) $为正交矩阵, 其行、列均为正交的单位向量, 旋转矩阵$ M(\boldsymbol \theta) $中任意2 阶子矩阵即可唯一确定旋转矩阵$ M(\boldsymbol \theta) $. 此外需要一个额外元素来确认正负, 方向向量$ \boldsymbol{\overline{o}}(\boldsymbol \theta) $可以表示为
$$ \begin{array}{*{20}{l}} {\boldsymbol{\overline{o}}}(\boldsymbol \theta)=[a_{11}, a_{12}, a_{21}, a_{22},a_{33}]^\mathrm{T}\in {\bf{R}}^5 \end{array}$$ (10) 对于给定的四元数$ \boldsymbol q $, 其旋转矩阵$ R(\boldsymbol q) $对应的方向向量期望值$ \tilde{{\boldsymbol{q}}}$可以表示为
$$ \begin{array}{*{20}{l}} {\tilde {{\boldsymbol{q}}}}=\begin{bmatrix} 1-2v_{y}^{2}-2v_{z}^{2} \\ 2v_{x}v_{y}-2v_{z}\phi \\ 2v_{x}v_{y}+2v_{z}\phi \\ 1-2v_{x}^{2}-2v_{z}^{2} \\ 1-2v_{x}^{2}-2v_{y}^{2} \end{bmatrix}\in {\bf{R}}^5 \end{array} $$ (11) 为跟踪所需的方向向量, 设计误差函数为${\boldsymbol{e}}= {\overline{{\boldsymbol{o}}}}({\boldsymbol{\theta}})-{\tilde{\boldsymbol{q}}}$, 对该式求导可得
$$ G({\boldsymbol{\theta}}){\dot{{\boldsymbol{\theta}}}=\kappa(\boldsymbol q){\dot{\boldsymbol{q}}}} $$ (12) 其中, $ \dot{{\boldsymbol{q}}}$为向量$ \boldsymbol q $关于时间的导数. 针对不同的任务需求, 冗余机器人的末端执行器方向控制可以通过式(12)实现.
1.3 数据驱动
冗余机器人的控制方案需要使用机器人的雅可比矩阵. 机器人制造商生产机器人时, 为机器人标定了标准的结构参数, 通过这些参数可以计算出机器人的雅可比矩阵. 然而, 机器人的结构信息通常会因实际使用过程中装配不同类型的末端执行器而发生改变, 并且机器人结构参数的测量是复杂且费时的.
数据驱动技术能够将系统参数作为输入量, 动态地更新系统的未知量. 通过数据驱动技术, 机器人能够学习自身结构信息, 并利用学习到的信息协助完成给定的任务. 本文结合数据驱动技术, 提出一种雅可比矩阵实时更新的学习方案以控制模型未知的冗余机器人. 设计误差函数$ \Vert \dot{\hat{{\boldsymbol{r}}}}-\dot{\boldsymbol{r}}\Vert_2^2$, 其中$\dot{\hat{\boldsymbol{r}}}= \hat{J}\dot{{\boldsymbol{\theta}}}$. 通过梯度下降法可以得到
$$ {\dot{\hat{J}}}=-\sigma\frac{\partial{\Vert {\dot{\hat{{\boldsymbol{r}}}}-{\dot{\boldsymbol{r}}}\Vert_2^2}}}{\partial{\hat{J}}}=-\sigma(\hat{J}{\dot{{\boldsymbol{\theta}}}}-{\dot{\boldsymbol{r}}}){\dot{{\boldsymbol{\theta}}}}^\mathrm{T} $$ (13) 其中, $ \sigma>0 $代表控制收敛速率. 值得指出的是, 式(13)中的关节角速度$ \dot{{\boldsymbol{\theta}}}$和末端执行器速度$ \dot{{\boldsymbol{r}}}$为真实的测量数据, 本文以$ \dot{{\boldsymbol{\theta}}}$和$ \dot{{\boldsymbol{r}}}$为核心进行雅可比矩阵的学习. $ \dot{{\boldsymbol{\theta}}}$和$ \dot{{\boldsymbol{r}}}$可通过RGB-D传感器、惯性运动单元、动作捕捉系统等途径获得. 在此基础上, 冗余机器人估计的雅可比矩阵$ \hat J $能够收敛到真实的雅可比矩阵$ J $, 从而实现对机器人的控制.
2. 控制方案的构建与求解
本节首先构建一种基于数据驱动技术的冗余机器人末端执行器位姿控制方案, 其考虑了速度层的控制误差反馈. 随后设计了相应的神经动力学求解器对所提方案进行求解, 能有效控制模型未知的机器人进行末端执行器位置与姿态的同步跟踪. 此外, 相关的理论分析证明了方案的收敛性.
2.1 方案构建
冗余机器人末端执行器的位姿精确度是评价方案的重要因素. 为保证机器人轨迹跟踪任务的顺利执行, 末端执行器通常需要与任务平面保持特定的角度. 本文提出一种基于数据驱动的冗余机器人末端执行器位姿控制方案, 其表述为
$$ \min \;\; \frac{1}{2}\dot{{\boldsymbol{\theta}}}^\mathrm{T}\dot{{\boldsymbol{\theta}}}\;\;\;\tag{14a} $$ $$ \; {\rm{s.t.}} \quad {\hat{J}}{\dot{\hat{\boldsymbol{\theta}}}}={\dot{\boldsymbol{r}}}^{d}\tag{14b} $$ $$\qquad\;\; G({\boldsymbol{\theta}})\dot{\hat{{\boldsymbol{\theta}}}}=\kappa(\boldsymbol q)\dot{{\boldsymbol{q}}}\tag{14c} $$ $$\qquad\;\; {\dot{\hat{J}}}=-\sigma(\hat{J}\hat{\dot{{\boldsymbol{\theta}}}}-{\dot{{\boldsymbol{r}}})\hat{\dot{{\boldsymbol{\theta}}}}^\mathrm{T}}\tag{14d} $$ $$ \qquad\; \; \hat{\dot{{\boldsymbol{\theta}}}}=\dot{{\boldsymbol{\theta}}}+{\boldsymbol{u},\quad 0 \le \left\|\boldsymbol{u}\right\| \le {\boldsymbol{u}}_{0}} \tag{14e\,} $$ $$ \qquad\;\; {\dot{{\boldsymbol{\theta}}}}^-\le \dot{{\boldsymbol{\theta}}}\le {\dot{{\boldsymbol{\theta}}}}^+ \tag{\,14f\,} $$ 值得注意的是, $ \hat{J} $或$ \dot{{\boldsymbol{\theta}}}$的初始值为零时, 系统的输入、输出始终为零, 机器人无法准确地执行轨迹跟踪任务. 为避免该情况的发生, 引入受噪声驱动的关节角速度$ \hat{\dot{{\boldsymbol{\theta}}}}=\dot{{\boldsymbol{\theta}}}+{\boldsymbol{u}}$. 为便于下文的推导, 合并$ \hat{J}\dot{\hat{{\boldsymbol{\theta}}}}=\dot{{\boldsymbol{r}}}$, $G({\boldsymbol{\theta}}){\dot{\hat{{\boldsymbol{\theta}}}}=\kappa(\boldsymbol q){\dot{\boldsymbol{q}}}}$, 并改写为$ A\dot{\hat{{\boldsymbol{\theta}}}}={\dot{{{\boldsymbol{v}}}}}^{d}$, 其中, $A=\Bigg[\begin{aligned}\hat{J}\;\;\;\\G({\boldsymbol{\theta}})\end{aligned}\Bigg] ,$ ${{\boldsymbol{v}}}^{d}=\Bigg[\begin{aligned}\boldsymbol{r}^{d}\\{\tilde {\boldsymbol{q}}}\;\end{aligned}\Bigg] , {\boldsymbol{v}}^{d}$ 表示 ${\boldsymbol{v}}=\Bigg[\begin{aligned}\boldsymbol{r}\;\;\,\\ \boldsymbol{\overline{o}}({\boldsymbol{\theta}})\end{aligned}\Bigg]$的期望值.
2.2 神经动力学求解器设计
设计误差函数为$ E=\Vert {\boldsymbol{v}}-{\boldsymbol{v}}^{d}\Vert^2 $. 由梯度下降法可得, 其沿负梯度下降方向可以表示为
$$ \dot{\hat{{\boldsymbol{\theta}}}}=-\eta\frac{\partial{E}}{\partial{\hat{{\boldsymbol{\theta}}}}}=\eta A^\mathrm{T}({{\boldsymbol{v}}}^{d}-{{\boldsymbol{v}}}) $$ (15) 其中, $ \eta>0 $为设计参数. 为修正式(15)求解过程中的滞后误差问题, 添加补偿项$ {\boldsymbol{\varphi}}$可得
$$ \begin{array}{*{20}{l}} \dot{\hat{{\boldsymbol{\theta}}}}=\eta A^\mathrm{T}({{\boldsymbol{v}}^{d}-{\boldsymbol{v}})+\boldsymbol{\varphi}}\end{array} $$ (16) 对式(16)两边同乘$ A $, 可得
$$ \begin{array}{*{20}{l}} A\dot{\hat{{\boldsymbol{\theta}}}}=\eta AA^\mathrm{T}({{\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A\boldsymbol{\varphi}}\end{array} $$ (17) 当系统趋于稳态时, 应有$ {\boldsymbol{v}}^{d}-{\boldsymbol{v}}=0 $成立. 则式(17)可重写为
$$ \begin{array}{*{20}{l}} A\dot{\hat{{\boldsymbol{\theta}}}}=A{\boldsymbol{\varphi}=\dot{{\boldsymbol{v}}}^{d}}\end{array} $$ (18) 对于式(18), 考虑最小化函数(14a), 并应用最小二乘法可以得到$ {\boldsymbol{\varphi}=A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}$, 其中, $ A^{\dagger}=A^{\mathrm{T}}(AA^{\mathrm{T}})^{-1} $. 为避免接近奇异时求矩阵伪逆结果极大的问题, 设计具有辅助参数的递归过程为
$$\left\{ \begin{aligned} &{\boldsymbol{\varphi}} =A^\mathrm{T}{\boldsymbol{\beta}}\\ &{\dot{{\boldsymbol{\beta}}}} =\mu(\dot{{{\boldsymbol{v}}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) \end{aligned} \right. $$ (19) 其中, $ \mu>0 $为收敛系数, $ {\boldsymbol{\beta}}$为设计参数. 联立式(16)和式(19), 可得
$$\qquad\qquad\;\; \left\{ \begin{aligned} &\dot{\hat{{\boldsymbol{\theta}}}} =P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (20{\rm{a}})\\ &\dot{\boldsymbol{\beta}} =\mu(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (20{\rm{b}})\end{aligned} \right. $$ 其中, $ P_{\boldsymbol{\ell}}(\cdot) $表示对机器人施加物理约束的投影函数, 具体地, $ \boldsymbol{\ell}=\{\dot{\hat{{\boldsymbol{\theta}}}} \in {\bf{R}}^{a}, \dot{{\boldsymbol{\theta}}}^{-} \le {\dot{\hat{{\boldsymbol{\theta}}}}} \le \dot{{\boldsymbol{\theta}}}^{+}\} $. 至此, 面向基于数据驱动的冗余机器人末端执行器位姿控制方案的神经动力学求解器为
$$\qquad\qquad\;\;\left\{ \begin{aligned} &{\dot{\hat{{\boldsymbol{\theta}}}}} =P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({{\boldsymbol{v}}}^{d}-{\boldsymbol{v}})+A^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (21{\rm{a}})\\ &\dot{\boldsymbol{\beta}}=\mu(\dot{{{\boldsymbol{v}}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (21{\rm{b}}) \\ &{\dot{\hat{J}}} =-\sigma(\hat{J}{\hat{\dot{{\boldsymbol{\theta}}}}}-{\dot{{\boldsymbol{r}}}){\hat{\dot{{\boldsymbol{\theta}}}}}^\mathrm{T}}&&\qquad (21{\rm{c}})\\ &{\hat{\dot{{\boldsymbol{\theta}}}}} ={\dot{{\boldsymbol{\theta}}}}+{\boldsymbol{u}},\quad 0 \le \left\|\boldsymbol{u}\right\| \le {\boldsymbol{u}}_{0}&&\qquad (21{\rm{d}}) \end{aligned} \right. $$ 通过神经动力学求解器(21)能够得到机器人执行任务时各关节角速度, 从而实现机器人末端执行器姿态的有效控制.
2.3 理论分析与证明
本节对所提的基于数据驱动的冗余机器人末端执行器位姿控制方案的收敛性进行分析证明.
定理 1. 当$ A^{\mathrm{T}}{\boldsymbol{\beta}}\in \boldsymbol{\ell} $时, 面向基于数据驱动的冗余机器人末端执行器位姿控制方案(式(14))的神经动力学求解器(21)的控制误差$ {\boldsymbol{\epsilon}}={\boldsymbol{v}}-{\boldsymbol{v}}^{d}$全局收敛至$ {{\boldsymbol{0}}} $.
证明. 首先对含有存储状态信息$ {\boldsymbol{\beta}}$的式(21b)进行收敛性分析, 设计李雅普诺夫函数如下:
$$ N_{1}=(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})/2 \geq 0 $$ (22) 以参数$ {\boldsymbol{\beta}}$为决策变量, 式(22)关于时间求导, 可得
$$ \begin{split} \dot{N}_{1}=\; &-(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}AA^{\mathrm{T}}\dot{\boldsymbol{\beta}}= \\ &\ \mu(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}AA^{\mathrm{T}}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) \leq \\ &-\eta \boldsymbol{\ell}_{\min}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})=\\ &-\eta\boldsymbol{\ell}_{\min}N_{1}\leq 0 \end{split}$$ (23) 其中, $ {\boldsymbol{\ell}_{\min}}$表示$ AA^{\mathrm{T}} $的最小特征值. 根据拉萨尔不变集原理[21], 当$ \dot{N}_{1} $= 0 时, 参数$ {\boldsymbol{\beta}}$指数收敛至$ (AA^{\mathrm{T}})^{-1}\dot{{{\boldsymbol{v}}}^{d}}$. 将参数$ {\boldsymbol{\beta}}$的稳态值代入(20a), 可得
$$ \begin{split} \dot{\hat{{\boldsymbol{\theta}}}} =\; &P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A^{\mathrm{T}}(AA^{\mathrm{T}})^{-1}\dot{{\boldsymbol{v}}}^{d})= \\ &P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (24) 控制误差的导数$ \dot{{{\boldsymbol{\epsilon}}}}$可以表示为
$$ \begin{split} \dot{{{\boldsymbol{\epsilon}}}} =\; &A\dot{\hat{{\boldsymbol{\theta}}}}-\dot{{\boldsymbol{v}}}^{d}=\\ & AP_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-\dot{{\boldsymbol{v}}}^{d}=\\ &A(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (25) 为分析控制误差$ {{\boldsymbol{\epsilon}}}$的稳定性, 设计李雅普诺夫函数为$ N_{2}={\boldsymbol{\epsilon}}^{\mathrm{T}}{\boldsymbol{\epsilon}}/2 $, 其时间导数可以表示为
$$ \begin{split} \dot{N}_{2} =\; & {{\boldsymbol{\epsilon}}}^{\mathrm{T}}\dot{{\boldsymbol{\epsilon}}}= \\ & {\boldsymbol{\epsilon}}^{\mathrm{T}}A(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})=\\ &-\frac{1}{\eta}((-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})^{\mathrm{T}}\times \\ &(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (26) 对于投影函数$ P_{\boldsymbol{\ell}} $, 假定其区间下(上)界为${c^{-}}\; ({c^{+}})$, 则当${c^{+}}\in{\boldsymbol{\ell}}$时, 应有$\Vert P_{\boldsymbol{\ell}}({c^{-}})-{c^{-}} \Vert \leq \Vert {c^{+}}-{c^{-}} \Vert$恒成立. 令${c^{-}}=-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d},{c^{+}}=A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}$, 则有以下关系成立
$$ \begin{split} &\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})+\eta A^\mathrm{T}{\boldsymbol{\epsilon}}-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}\leq \Vert \eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}\Vert^{2} \end{split} $$ (27) 不等式(27)左侧展开, 可得
$$ \begin{split} &\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})+\eta A^\mathrm{T}{\boldsymbol{\epsilon}}-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}=\\ &\qquad\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}\;+\\ &\qquad\Vert \eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}\Vert^{2}-2((-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})^\mathrm{T}\;\times \\ &\qquad(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \\[-10pt] \end{split}$$ (28) 进一步地, 对式(27)和式(28)微分, 可得
$$ \begin{split} &\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}\leq\\ &\qquad2((-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})^\mathrm{T}\;\times \\ &\qquad(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (29) 联立式(26)和式(29), 可得
$$ \begin{array}{*{20}{l}} \dot{N}_{2} \leq -\frac{2}{\eta} \Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2} \leq 0 \end{array} $$ (30) 根据拉萨尔不变集原理, 当$ \dot{N}_{2} $ = 0时, 可以得到
$$ \begin{array}{*{20}{l}} \begin{split} P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})=A^{\dagger}\dot{{\boldsymbol{v}}}^{d}} \end{split} \end{array} $$ (31) 当$ A^{\mathrm{T}}{\boldsymbol{\beta}}\in \boldsymbol{\ell} $时, 可得$ -\eta A^\mathrm{T}{\boldsymbol{\epsilon}}={\boldsymbol{0}}$, 因此$ {{\boldsymbol{\epsilon}}}={\boldsymbol{0}}$. 综上, 本文所提方案(式(14))的控制误差全局收敛至$ {{\boldsymbol{0}}}$.
□ 3. 仿真与实验
为验证本文所提方案对机器人雅可比矩阵估计的准确性及末端执行器位姿控制的有效性, 本节基于德国7自由度Franka Emika Panda 冗余机器人分别给出末端执行器姿态保持和姿态跟踪的两组仿真结果.
值得指出的是, 仿真过程中的相关参数设置如下: 冗余机器人的初始关节角度被设置为$[0,-\pi/4, 0,-3\pi/4,0,\pi/2,3\pi/4]^\mathrm{T}$ rad; 收敛系数$ \mu=500 $; 设计参数$ \eta=500 $; 控制学习的收敛参数$\sigma=1\, 000$; 估计雅可比矩阵初始值为$ [-1, 1] $区间内的随机数; 设计参数$ {\boldsymbol{\beta}=[0, 0, 0, 0, 0, 0, 0, 0]^\mathrm{T}}$. 值得注意的是, 很难通过分析或者直观的设计步骤选择这些参数, 本文则是通过多次仿真确定它们的值.
图1是一组机器人末端执行器展示姿态保持功能的仿真结果. 具体而言, 给定机器人末端执行器跟踪四叶草任务. 图1(a)描绘了机器人执行跟踪任务的整体运动轨迹, 绿色曲线为任务过程中末端执行器的姿态变化, 红色曲线为末端执行器跟踪预定的四叶草图案. 图1(b)和图1(c)分别展示了机器人在执行任务过程中关节角度、关节角速度的变化曲线. 可以看出曲线变化平滑, 机器人关节角度、关节角速度均在合理的范围内. 图1(d)展示了机器人在执行任务过程中估计的雅可比矩阵与实际的雅可比矩阵误差. 随着任务时间的持续, 其误差迅速小于$ 10^{-3} $, 证明本文所提方案(14)能够有效地估计雅可比矩阵, 从而实现机器人的准确控制; 图1(e)给出了机器人任务过程中的四元数误差变化趋势, 可以看出四元数误差小于$ 10^{-5} $, 证明机器人实现了末端执行器姿态保持的功能; 图1(f)给出了机器人在执行任务过程中末端执行器的空间位置误差, 沿三个坐标轴的误差均小于$ 10^{-4} $ m.
图2为一组机器人末端执行器展示姿态跟踪功能的仿真结果. 具体而言, 机器人末端执行器沿着圆锥体表面进行打磨、焊接等任务. 值得指出的是, 在任务执行期间, 机器人末端执行器的方向需要一直保持在圆锥体表面的法线方向. 不同于图1中姿态保持的仿真结果, 图2(a)展示了机器人执行跟踪任务的整体运动轨迹, 绿色曲线描绘了机器人末端执行器位姿, 可见末端执行器位姿是不断变化的. 图2(b)和图2(c)中关节角度和关节角速度的变化曲线表明了机器人执行过程中关节运行平滑. 图2(d)、图2(e)和图2(f)展示了机器人任务过程中雅可比矩阵误差、冗余机器人末端执行器的姿态与位置误差变化趋势, 证明了由所提方案(14)驱动的机器人在未知机器人结构信息情况下成功地执行了位姿跟踪任务. 此外, 为更好地说明本方案对末端执行器位姿的控制过程, 考虑图2的应用场景, 图3给出了基于CoppeliaSim仿真平台所提方案(14)与文献[22]方案的对比仿真实验. CoppeliaSim是一款功能强大的动力学仿真软件, 它可以根据物体的物理特性计算运动、旋转和碰撞, 因此许多研究应用CoppeliaSim以快速验证算法. 对比仿真实验中, 由所提方案(14)驱动的机器人在执行任务的过程中, 其末端执行器的方向始终保持在圆锥体表面的法线方向. 相比之下, 由文献[22]方案驱动的机器人在执行过程中因无法控制其末端执行器方向而导致任务失败. 由此可见, 机器人末端执行器的姿态跟踪在一些要求姿态不断变化的应用场景中具备重要的作用.
此外, 表2给出了所提方案(14)与其他5种方案的对比. 具体而言, 所提方案(14)与对比方案使用同样的机器人执行相同的任务, 即图2中的应用场景, 同时选取方案层级、末端执行器控制模式、结构信息是否已知以及跟踪误差等多个指标对方案进行了评价. 值得指出的是, 每个方案参数的选择都基于其对应的文献. 从表2可看出, 文献[13]为基于数据驱动的速度层控制方案, 该方案能够实现末端执行器姿态保持的功能; 文献[22]和文献[23]为加速度层的控制方案, 需要已知机器人的模型信息; 文献[24]和文献[25]为速度层的控制方案, 同样需要已知机器人的模型信息. 此外, 从位置跟踪误差方面来看, 每个方案的跟踪误差均维持在$ 10^{-3} $ m数量级. 在姿态跟踪误差方面, 多数方案不支持姿态跟踪, 文献[13]和文献[25]的方案的跟踪精度高于所提方案(14). 然而, 文献[13]方案仅具备简单的姿态保持功能, 文献[25]方案则无法应用于结构信息不准确或未知的机器人. 综上, 本文所提方案(14)能够有效地控制结构信息未知的机器人进行轨迹跟踪任务, 在对末端执行器姿态有约束的情况下具有一定优势.
表 2 冗余机器人不同轨迹跟踪控制方案对比Table 2 Comparison of different trajectory tracking control schemes for redundant manipulators4. 结束语
本文针对模型未知的冗余机器人提出了一种基于数据驱动的末端执行器位姿控制方案. 该方案从机器人运动学出发, 用四元数表示末端执行器的姿态, 进而实现了对末端执行器位姿控制. 通过引入数据驱动技术, 本文所提方案能够有效地控制模型未知的冗余机器人, 且估计的雅可比矩阵能够收敛至真实值. 此外, 设计了一种神经动力学方案用于本方案的求解. 理论分析证明了所提求解器的收敛性, 方案对比和仿真实验体现了所提方案对机器人末端执行器控制的优越性和有效性.
-
表 1 数据集划分
Table 1 Dataset partition
数据集 划分方式 训练集 验证集 测试集 A 时间次序 9 × 8 9 × 1 9 × 1 B 随机抽样 9 × 8 9 × 1 9 × 1 表 2 不同生成模型生成数据的评估结果
Table 2 Evaluation results of data generated by different generation models
方法 评价指标 FIDmin FIDaverage Epoch GAN 250.00 254.50 10000 LSGAN 58.56 51.94 3000 DCGAN 43.81 49.67 2500 本文方法 36.10 48.51 2500 表 3 识别模型的性能对比
Table 3 Performance comparison of recognition models
方法 测试集准确率 测试集损失 验证集准确率 验证集损失 方式A CNN 0.7518±0.00245 0.6046±0.02882 0.6115±0.00212 1.6319±0.11640 非生成式数据增强+CNN 0.8272±0.00206 0.6504±0.04038 0.7830±0.00183 0.9077±0.03739 DCGAN数据增强+CNN 0.8000±0.00098 0.8776±0.01063 0.5885±0.00396 1.9024±0.11050 本文方法 0.8482±0.00105 0.5520±0.01006 0.7269±0.00377 0.9768±0.05797 方式B CNN 0.8926±0.00105 0.2298±0.00309 0.8519±0.00061 0.2519±0.00167 非生成式数据增强+CNN 0.9371±0.00184 0.1504±0.00825 0.9704±0.00055 0.1093±0.01037 DCGAN数据增强+CNN 0.9000±0.00123 0.3159±0.01150 0.8445±0.00207 0.2913±0.00396 本文方法 0.9407±0.00367 0.2019±0.01498 0.9741±0.00044 0.0699±0.00195 A1 符号及含义
A1 Symbols and their descriptions
符号 符号含义 D 判别器 G 生成器 $ V(D,G)$ GAN 原始的目标函数 ${\boldsymbol{z}} $ 潜在空间的随机噪声 $ D^*$ 固定G 参数, 在$\mathop {\max }\nolimits_D V \left({D,G} \right)$过程中, D 的最优解 ${D_{{\text{JS}}}}$ JS 散度 ${R_{jk}}$ 图像中经过卷积核扫描后的第 j 行第 k 列的结果 ${H_{j - u,k - v}}$ 卷积核 ${F_{u,v}}$ 图像 $X$ 燃烧状态数据集, 包含前移、正常和后移的数据集, 即燃烧图像粗调 DCGAN 中判别网络输入值集合$[ { {\boldsymbol{x} }_{{1} } };{ {\boldsymbol{x} }_{{2} } }; $ ${ {\boldsymbol{x} }_{{3} } }; \cdots ;{ {\boldsymbol{x} }_{\rm{a}}} \cdots ]$, 即$ \left[ {{X_{{\rm{real}}}};{X_{{\rm{false}}}}} \right]$ $ X_{{\rm{FW}}}$ 燃烧线前移数据集 $ X_{{\rm{NM}}}$ 燃烧线正常数据集 $ X_{{\rm{BC}}}$ 燃烧线后移数据集 $ X'_{{\rm{FW}}}$ 训练集燃烧线前移数据集 $ X'_{{\rm{NM}}}$ 训练集燃烧线正常数据集 $ X'_{{\rm{BC}}}$ 训练集燃烧线后移数据集 $ X''_{{\rm{FW}}}$ 测试、验证燃烧线前移数据集 $ X''_{{\rm{NM}}}$ 测试、验证燃烧线正常数据集 $ X''_{{\rm{BC}}}$ 测试、验证燃烧线后移数据集 $ {D_t}(\cdot, \cdot )$ 燃烧图像粗调 DCGAN 子模块中, 判别网络参数为${\theta _{D,t}}$时, 判别网络预测值集合 $ {D_{t+1}}(\cdot, \cdot )$ 燃烧图像粗调 DCGAN 子模块中, 判别网络参数为${\theta _{D,t+1}}$时, 判别网络预测值集合 $ Y_{D,t}$ 在燃烧图像粗调 DCGAN 子模块中第 t 次博弈训练判别网络的真实值集合 $ Y_{G,t}$ 在燃烧图像粗调 DCGAN 子模块中第 t 次博弈训练生成网络的真实值集合 $ loss_{D,t}$ 在燃烧图像粗调 DCGAN 子模块中第 t 次博弈更新判别网络的损失值 $ loss_{G,t}$ 在燃烧图像粗调 DCGAN 子模块中第 t 次博弈更新生成网络的损失值 $ X_{{\rm{real}}}$ 在燃烧图像粗调 DCGAN 子模块中参加博弈的真实数据 $ X_{{\rm{false}},t}$ 在燃烧图像粗调 DCGAN 子模块中参加第 t 次博弈的生成的数据 $ G_t({\boldsymbol{z}})$ 在燃烧图像粗调 DCGAN 子模块第 t 次博弈中由随机噪声经过生成网络得到的虚拟样本 ${S_{D,t}}$ 燃烧图像粗调 DCGAN 中获得的判别网络的结构参数 ${S_{G,t}}$ 燃烧图像粗调 DCGAN 中获得的生成网络的结构参数 ${\theta _{D,t}}$ 在燃烧图像粗调 DCGAN 子模块中第 t 次博弈判别网络更新前的网络参数 ${\theta _{G,t}}$ 在燃烧图像粗调 DCGAN 子模块中第 t 次博弈生成网络更新前的网络参数 $ X_{{\rm{real}}}^{{\rm{FW}}}$ 燃烧线前移精调 DCGAN 子模块中参加博弈的真实数据 $ X_{{\rm{false}},t}^{{\rm{FW}}}$ 在燃烧线前移精调 DCGAN 子模块中参加第 t 次博弈的生成数据 $ X_{{\rm{real}}}^{{\rm{NM}}}$ 燃烧线正常精调 DCGAN 子模块中参加博弈的真实数据 $ X_{{\rm{false}},t}^{{\rm{NM}}}$ 在燃烧线正常精调 DCGAN 子模块中参加第 t 次博弈的生成数据 $ X_{{\rm{real}}}^{{\rm{BC}}}$ 燃烧线后移精调 DCGAN 子模块中参加博弈的真实数据 $ X_{{\rm{false}},t}^{{\rm{BC}}}$ 在燃烧线后移精调 DCGAN 子模块中参加第 t 次博弈的生成数据 $ D_t^{{\rm{FW}}}(\cdot, \cdot )$ 在燃烧线前移精调 DCGAN 子模块中判别网络参数为参数$\theta _{D,t}^{{\text{FW}}}$时, 判别网络预测值集合 $ D_t^{{\rm{NM}}}(\cdot, \cdot )$ 在燃烧线正常精调 DCGAN 子模块中判别网络参数为参数$\theta _{D,t}^{{\text{NM}}}$时, 判别网络预测值集合 $ {D}_{t}^{\text{BC}}(\cdot, \cdot ) $ 在燃烧线后移精调 DCGAN 子模块中判别网络参数为参数$\theta _{D,t}^{{\text{BC}}}$时, 判别网络预测值集合 $ D_{t+1}^{{\rm{FW}}}(\cdot, \cdot )$ 在燃烧线前移精调 DCGAN 子模块中判别网络参数为参数$\theta _{D,t + 1}^{{\text{FW}}}$时, 判别网络预测值集合 $ D_{t+1}^{{\rm{NM}}}(\cdot, \cdot )$ 在燃烧线正常精调 DCGAN 子模块中判别网络参数为参数$\theta _{D,t + 1}^{{\text{NM}}}$时, 判别网络预测值集合 $ D_{t+1}^{{\rm{BC}}}(\cdot, \cdot )$ 在燃烧线后移精调 DCGAN 子模块中判别网络参数为参数$\theta _{D,t + 1}^{{\text{BC}}}$时, 判别网络预测值集合 $ Y_{D,t}^{{\rm{FW}}}$ 燃烧线前移精调 DCGAN 子模块中第 t 次博弈训练 D 的真实值集合 $ Y_{G,t}^{{\rm{FW}}}$ 燃烧线前移精调 DCGAN 子模块中第 t 次博弈训练G的真实值集合 $ Y_{D,t}^{{\rm{NM}}}$ 燃烧线正常精调 DCGAN 子模块中第 t 次博弈训练 D 的真实值集合 $ Y_{G,t}^{{\rm{NM}}}$ 燃烧线正常精调 DCGAN 子模块中第 t 次博弈训练G的真实值集合 $ Y_{D,t}^{{\rm{BC}}}$ 燃烧线后移精调 DCGAN 子模块中第 t 次博弈训练 D 的真实值集合 $ Y_{G,t}^{{\rm{BC}}}$ 燃烧线后移精调 DCGAN 子模块中第 t 次博弈训练G的真实值集合 $ loss_{D,t}^{{\rm{FW}}}$ 燃烧线前移精调 DCGAN 子模块中第 t 次博弈更新 D 的损失值 $ loss_{G,t}^{{\rm{FW}}}$ 燃烧线前移精调 DCGAN 子模块中第 t 次博弈更新G的损失值 $ loss_{D,t}^{{\rm{NM}}}$ 燃烧线正常精调 DCGAN 子模块中第 t 次博弈更新 D 的损失值 $ loss_{G,t}^{{\rm{NM}}}$ 燃烧线正常精调 DCGAN 子模块中第 t 次博弈更新 G 的损失值 $ loss_{D,t}^{{\rm{BC}}}$ 燃烧线后移精调 DCGAN 子模块中第 t 次博弈更新 D 的损失值 $ loss_{G,t}^{{\rm{BC}}}$ 燃烧线后移精调 DCGAN 子模块中第 t 次博弈更新G的损失值 $\theta _{D,t}^{{\text{FW}}}$ 燃烧线前移 DCGAN 子模块中第 t 次博弈判别网络更新前的网络参数 $\theta _{G,t}^{{\text{FW}}}$ 燃烧线前移 DCGAN 子模块中第 t 次博弈生成网络更新前的网络参数 $\theta _{D,t}^{{\text{NM}}}$ 燃烧线正常 DCGAN 子模块中第 t 次博弈判别网络更新前的网络参数 $\theta _{G,t}^{{\text{NM}}}$ 燃烧线正常 DCGAN 子模块中第 t 次博弈生成网络更新前的网络参数 $\theta _{D,t}^{{\text{BC}}}$ 燃烧线后移 DCGAN 子模块中第 t 次博弈判别网络更新前的网络参数 $\theta _{G,t}^{{\text{BC}}}$ 燃烧线后移 DCGAN 子模块中第 t 次博弈生成网络更新前的网络参数 ${\widehat Y_{{\text{ CNN }},t}}$ 燃烧状态识别模块第 t 次更新 CNN 模型预测值集合 $los{s_{{\text{ CNN }},t}}$ 燃烧状态识别模块第 t 次更新 CNN 的损失 $ \theta _{{\rm{ CNN }},t}$ 燃烧状态识别模块第 t 次更新 CNN 的网络更新参数 $ loss$ 神经网络的损失 ${\boldsymbol{x} }_{{a} }$ 神经网络第 a 幅输入图像 $y_a $ 第 a 幅输入图像输入神经网络后的输出值 $ D_t(X)$ 判别网络预测值集合, 即$ {D_t}(\cdot, \cdot )$ $L $ 损失函数 $\delta_i $ 第 i 层的误差 $O_i $ 第 i 层输出 $W_i$ 第 i 层的所有权重参数 $B_i $ 第 i 层的所有偏置参数 $ {\nabla _{{W_{i - 1}}}}$ 第$i-1 $层的权重的当前梯度 $ {\nabla _{{B_{i - 1}}}}$ 第$i-1 $层的偏置的当前梯度 $ {\theta _{D,t}}$ 第 t 次判别网络的参数 $ {m _{D,t}}$ 第 t 次判别网络一阶动量 $ {v _{D,t}}$ 第 t 次判别网络的二阶动量 $\alpha $ 学习率 $\gamma $ 很小的正实数 $ {\nabla _{D,t}}$ 第 t 次判别网络参数的梯度 $\beta_1 $ Adam 超参数 $\beta_2 $ Adam 超参数 $ {\eta _{D,t}}$ 计算第 t 次的下降梯度 $ {\widehat m_{D,t}}$ 初始阶段判别网络的第 t 次一阶动量 $ {\widehat v_{D,t}}$ 初始阶段判别网络的第 t 次的二阶动量 $Y $ 神经网络真值集合 $ f(X)$ 神经网络预测值集合 $p $ 概率分布 ${p_{\text{r}}}$ 真实图像的概率分布 ${p_{\text{g}}}$ 生成图像的概率分布 ${p_{\boldsymbol{z}}}$ z 所服从的正态分布 Cov 协方差矩阵 -
[1] 乔俊飞, 郭子豪, 汤健. 面向城市固废焚烧过程的二噁英排放浓度检测方法综述. 自动化学报, 2020, 46(6): 1063-1089Qiao Jun-Fei, Guo Zi-Hao, Tang Jian. Dioxin emission concentration measurement approaches for municipal solid wastes incineration process: A survey. Acta Automatica Sinica, 2020, 46(6): 1063-1089 [2] Lu J W, Zhang S K, Hai J, Lei M. Status and perspectives of municipal solid waste incineration in China: A comparison with developed regions. Waste Management, 2017, 69: 170-186 doi: 10.1016/j.wasman.2017.04.014 [3] Kalyani K A, Pandey K K. Waste to energy status in India: A short review. Renewable and Sustainable Energy Reviews, 2014, 31: 113-120 doi: 10.1016/j.rser.2013.11.020 [4] 汤健, 乔俊飞. 基于选择性集成核学习算法的固废焚烧过程二噁英排放浓度软测量. 化工学报, 2018, 70(2): 696-706Tang Jian, Qiao Jun-Fei. Dioxin emission concentration soft measuring approach of municipal solid waste incineration based on selective ensemble kernel learning algorithm. CIESC Journal, 2019, 70(2): 696-706 [5] 汤健, 王丹丹, 郭子豪, 乔俊飞. 基于虚拟样本优化选择的城市固废焚烧过程二噁英排放浓度预测. 北京工业大学学报, 2021, 47(5): 431-443Tang Jian, Wang Dan-Dan, Guo Zi-Hao, Qiao Jun-Fei. Prediction of dioxin emission concentration in the municipal solid waste incineration process based on optimal selection of virtual samples. Journal of Beijing University of Technology, 2021, 47(5): 431-443 [6] 汤健, 乔俊飞, 徐喆, 郭子豪. 基于特征约简与选择性集成算法的城市固废焚烧过程二噁英排放浓度软测量. 控制理论与应用, 2021, 38(1): 110-120Tang Jian, Qiao Jun-Fei, Xu Zhe, Guo Zi-Hao. Soft measuring approach of dioxin emission concentration in municipal solid waste incineration process based on feature reduction and selective ensemble algorithm. Control Theory & Applications, 2021, 38(1): 110-120 [7] Kolekar K A, Hazra T, Chakrabarty S N. A review on prediction of municipal solid waste generation models. Procedia Environmental Sciences, 2016, 35: 238-244 doi: 10.1016/j.proenv.2016.07.087 [8] Li X M, Zhang C M, Li Y Z, Zhi Q. The status of municipal solid waste incineration (MSWI) in China and its clean development. Energy Procedia, 2016, 104: 498-503 doi: 10.1016/j.egypro.2016.12.084 [9] 乔俊飞, 段滈杉, 汤健, 蒙西. 基于火焰图像颜色特征的MSWI燃烧工况识别. 控制工程, 2022, 29(7): 1153-1161Qiao Jun-Fei, Duan Hao-Shan, Tang Jian, Meng Xi. Recognition of MSWI combustion conditions based on color features of flame images. Control Engineering of China, 2022, 29(7): 1153-1161 [10] 高济, 何志均. 基于规则的联想网络. 自动化学报, 1989, 15(4): 318-323Gao Ji, He Zhi-Jun. The associative network based on rules. Acta Automatica Sinica, 1989, 15(4): 318-323 [11] Roy S K, Krishna G, Dubey S R, Chaudhuri B B. HybridSN: Exploring 3-D-2-D CNN feature hierarchy for hyperspectral image classification. IEEE Geoscience and Remote Sensing Letters, 2020, 17(2): 277-281 doi: 10.1109/LGRS.2019.2918719 [12] Ahammad S H, Rajesh V, Rahman Z U, Lay-Ekuakille A. A hybrid CNN-based segmentation and boosting classifier for real time sensor spinal cord injury data. IEEE Sensors Journal, 2020, 20(17): 10092-10101 doi: 10.1109/JSEN.2020.2992879 [13] Sun Y, Xue B, Zhang M J, Yen G G, Lv J C. Automatically designing CNN architectures using the genetic algorithm for image classification. IEEE Transactions on Cybernetics, 2020, 50(9): 3840-3854 doi: 10.1109/TCYB.2020.2983860 [14] Zhou P, Gao B H, Wang S, Chai T Y. Identification of abnormal conditions for fused magnesium melting process based on deep learning and multisource information fusion, IEEE Transactions on Industrial Electronics, 2022, 69(3): 3017-3026 doi: 10.1109/TIE.2021.3070512 [15] 张震, 汪斌强, 李向涛, 黄万伟. 基于近邻传播学习的半监督流量分类方法. 自动化学报, 2013, 39(7): 1100-1109Zhang Zhen, Wang Bin-Qiang, Li Xiang-Tao, Huang Wan-Wei. Semi-supervised traffic identification based on affinity propagation. Acta Automatica Sinica, 2013, 39(7): 1100-1109 [16] 王松涛, 周真, 靳薇, 曲寒冰. 基于贝叶斯框架融合的RGB-D图像显著性检测. 自动化学报, 2020, 46(4): 695-720Wang Song-Tao, Zhou Zhen, Jin Wei, Qu Han-Bing. Saliency detection for RGB-D images under Bayesian framework. Acta Automatica Sinica, 2020, 46(4): 695-720 [17] 陶剑文, 王士同. 领域适应核支持向量机. 自动化学报, 2012, 38(5): 797-811 doi: 10.3724/SP.J.1004.2012.00797Tao Jian-Wen, Wang Shi-Tong. Kernel support vector machine for domain adaptation. Acta Automatica Sinica, 2012, 38(5): 797-811 doi: 10.3724/SP.J.1004.2012.00797 [18] 李强, 王正志. 基于人工神经网络和经验知识的遥感信息分类综合方法. 自动化学报, 2000, 26(2): 233-239Li Qiang, Wang Zheng-Zhi. Remote sensing information classification based on artificial neural network and knowledge. Acta Automatica Sinica, 2000, 26(2): 233-239 [19] 罗珍珍, 陈靓影, 刘乐元, 张坤. 基于条件随机森林的非约束环境自然笑脸检测. 自动化学报, 2018, 44(4): 696-706Luo Zhen-Zhen, Chen Jing-Ying, Liu Le-Yuan, Zhang Kun. Conditional random forests for spontaneous smile detection in unconstrained environment. Acta Automatica Sinica, 2018, 44(4): 696-706 [20] 郝红卫, 王志彬, 殷绪成, 陈志强. 分类器的动态选择与循环集成方法. 自动化学报, 2011, 37(11): 1290-1295Hao Hong-Wei, Wang Zhi-Bin, Yin Xu-Cheng, Chen Zhi-Qiang. Dynamic selection and circulating combination for multiple classifier systems. Acta Automatica Sinica, 2011, 37(11): 1290-1295 [21] 常亮, 邓小明, 周明全, 武仲科, 袁野, 杨硕, 等. 图像理解中的卷积神经网络. 自动化学报, 2016, 42(9): 1300-1312Chang Liang, Deng Xiao-Ming, Zhou Ming-Quan, Wu Zhong-Ke, Yuan Ye, Yang Shuo, et al. Convolutional neural networks in image understanding. Acta Automatica Sinica, 2016, 42(9): 1300-1312 [22] Bai W D, Yan J H, Ma Z Y. Method of flame identification based on support vector machine. Power Engingeering, 2004, 24(4): 548-551 [23] Sun D, Lu G, Zhou H, Yan Y, Liu S. Quantitative assessment of flame stability through image processing and spectral analysis. IEEE Transactions on Instrumentation and Measurement, 2015, 64(12): 3323-3333 doi: 10.1109/TIM.2015.2444262 [24] Khan A, Sohail A, Zahoora U, Qureshi A S. A survey of the recent architectures of deep convolutional neural networks. Artificial Intelligence Review, 2020, 53(8): 5455-5516 doi: 10.1007/s10462-020-09825-6 [25] 冯晓硕, 沈樾, 王冬琦. 基于图像的数据增强方法发展现状综述. 计算机科学与应用, 2021, 11(2): 370-382 doi: 10.12677/CSA.2021.112037Feng Xiao-Shuo, Shen Yue, Wang Dong-Qi. A survey on the development of image data augmentation. Computer Science and Application, 2021, 11(2): 370-382 doi: 10.12677/CSA.2021.112037 [26] Goodfellow I J, Pouget-Abadie J, Mirza M, Xu B, Warde-Farley D, Ozair S, et al. Generative adversarial nets. In: Proceedings of the 27th International Conference on Neural Information Processing Systems. Montréal, Canada: MIT Press, 2014. 2672−2680 [27] 唐贤伦, 杜一铭, 刘雨微, 李佳歆, 马艺玮. 基于条件深度卷积生成对抗网络的图像识别方法. 自动化学报, 2018, 44(5): 855-864Tang Xian-Lun, Du Yi-Ming, Liu Yu-Wei, Li Jia-Xin, Ma Yi-Wei. Image recognition with conditional deep convolutional generative adversarial networks. Acta Automatica Sinica, 2018, 44(5): 855-864 [28] 刘建伟, 谢浩杰, 罗雄麟. 生成对抗网络在各领域应用研究进展. 自动化学报, 2020, 46(12): 2500-2536Liu Jian-Wei, Xie Hao-Jie, Luo Xiong-Lin. Research progress on application of generative adversarial networks in various fields. Acta Automatica Sinica, 2020, 46(12): 2500-2536 [29] 王坤峰, 苟超, 段艳杰, 林懿伦, 郑心湖, 王飞跃. 生成式对抗网络GAN的研究进展与展望. 自动化学报, 2017, 43(3): 321-332Wang Kun-Feng, Gou Chao, Duan Yan-Jie, Lin Yi-Lun, Zheng Xin-Hu, Wang Fei-Yue. Generative adversarial networks: The state of the art and beyond. Acta Automatica Sinica, 2017, 43(3): 321-332 [30] Yang L, Liu Y H, Peng J Z. An automatic detection and identification method of welded joints based on deep neural network. IEEE Access, 2019, 7: 164952-164961 doi: 10.1109/ACCESS.2019.2953313 [31] Lian J, Jia W K, Zareapoor M, Zheng Y J, Luo R, Jain D K, et al. Deep-learning-based small surface defect detection via an exaggerated local variation-based generative adversarial network. IEEE Transactions on Industrial Informatics, 2020, 16(2): 1343-1351 doi: 10.1109/TII.2019.2945403 [32] Niu S L, Li B, Wang X G, Lin H. Defect image sample generation with GAN for improving defect recognition. IEEE Transactions on Automation Science and Engineering, 2020, 17(3): 1611-1622 [33] Wu X J, Qiu L T, Gu X D, Long Z L. Deep learning-based generic automatic surface defect inspection (ASDI) with pixelwise segmentation. IEEE Transactions on Instrumentation and Measurement, 2021, 70: Article No. 5004010 [34] Bichler M, Fichtl M, Heidekrüger S, Kohring N, Sutterer P. Learning equilibria in symmetric auction games using artificial neural networks. Nature Machine Intelligence, 2021, 3(8): 687-695 doi: 10.1038/s42256-021-00365-4 [35] Heusel M, Ramsauer H, Unterthiner T, Nessler B, Hochreiter S. GANs trained by a two time-scale update rule converge to a local Nash equilibrium. In: Proceedings of the 31st International Conference on Neural Information Processing Systems. Long Beach, USA: Curran Associates Inc., 2017. 6629−6640 [36] Lucic M, Kurach K, Michalski M, Bousquet O, Gelly S. Are GANs created equal? A large-scale study. In: Proceedings of the 32nd International Conference on Neural Information Processing Systems. Montréal, Canada: Curran Associates Inc., 2018. 698−707 [37] Radford A, Metz L, Chintala S. Unsupervised representation learning with deep convolutional generative adversarial networks. In: Proceedings of the 4th International Conference on Learning Representations. San Juan, Puerto Rico: 2016. [38] Suárez P L, Sappa A D, Vintimilla B X. Infrared image colorization based on a triplet DCGAN architecture. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition Workshops. Honolulu, USA: IEEE, 2017. 18−23 [39] Yeh R A, Chen C, Lim T Y, Schwing A G, Hasegawa-Johnson M, Do M N. Semantic image inpainting with deep generative models. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, USA: IEEE, 2017. 5485−5493 [40] Krizhevsky A, Sutskever I, Hinton G E. ImageNet classification with deep convolutional neural networks. In: Proceedings of the 26th Annual Conference on Neural Information Processing Systems. Lake Tahoe, USA: Curran Associates Inc., 2012. 1106−1114 [41] Zeiler M D, Fergus R. Visualizing and understanding convolutional networks. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: Springer, 2014. 818−833 [42] Simonyan K, Zisserman A. Very deep convolutional networks for large-scale image recognition [Online], available: http://arxiv.org/abs/1409.1556, April 10, 2015 [43] Szegedy C, Liu W, Jia Y Q, Sermanet P, Reed S, Anguelov D, et al. Going deeper with convolutions. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Boston, USA: IEEE, 2015. 1−9 [44] He K M, Zhang X Y, Ren S Q, Sun J. Deep residual learning for image recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, USA: IEEE, 2016. 770−778 [45] 林景栋, 吴欣怡, 柴毅, 尹宏鹏. 卷积神经网络结构优化综述. 自动化学报, 2020, 46(1): 24-37Lin Jing-Dong, Wu Xin-Yi, Chai Yi, Yin Hong-Peng. Structure optimization of convolutional neural networks: A survey. Acta Automatica Sinica, 2020, 46(1): 24-37 [46] Rumelhart D E, Hinton G E, Williams R J. Learning representations by back-propagating errors. Nature, 1986, 323(6088): 533-536 doi: 10.1038/323533a0 [47] Kingma D P, Ba J. Adam: A method for stochastic optimization. arXiv preprint arXiv: 1412.6980, 2017. [48] Mao X D, Li Q, Xie H R, Lau R Y K, Wang Z, Smolley S P. Least squares generative adversarial networks. In: Proceedings of the IEEE International Conference on Computer Vision. Venice, Italy: IEEE, 2017. 2813−2821 期刊类型引用(4)
1. 汤健,田昊,夏恒,乔俊飞. 基于区间Ⅱ型FNN的MSWI过程炉膛温度控制. 北京工业大学学报. 2025(02): 157-172 . 百度学术
2. 胡开成,严爱军,汤健. 城市固废焚烧过程炉温与烟气含氧量多目标鲁棒预测模型. 自动化学报. 2024(05): 1001-1014 . 本站查看
3. 郭海涛,汤健,夏恒,乔俊飞. 城市固废焚烧过程燃烧线极端异常火焰图像对抗生成. 中国电机工程学报. 2024(11): 4376-4387 . 百度学术
4. 王印松,赵佳玉. 基于深度自编码器的城市固废焚烧过程燃烧状态识别. 控制工程. 2024(10): 1729-1737 . 百度学术
其他类型引用(2)
-