面向精准价格牌识别的多任务循环神经网络

牟永强; 范宝杰; 孙超; 严蕤; 郭怡适

doi:10.16383/j.aas.c190633

面向精准价格牌识别的多任务循环神经网络

doi: 10.16383/j.aas.c190633

牟永强^1,,
范宝杰^{1, 2,},
孙超^1,,
严蕤^1,,
郭怡适^1,

1.
广州图匠数据科技有限公司人工智能实验室广州 510310
2.
广州工业大学信息工程学院广州 510006

详细信息

作者简介:
牟永强：广州图匠数据科技有限公司首席AI架构师. 2012年获得西安理工大学信号与信息处理专业硕士学位. 主要研究方向为机器视觉，模式识别以及深度学习. 本文通信作者.E-mail: yongqiang.mou@gmail.com

范宝杰：广东工业大学硕士研究生. 主要研究方向为深度学习和计算机视觉.E-mail: 735678367@qq.com

孙超：华南农业大学硕士研究生. 主要研究方向为深度学习和计算机视觉. E-mail: ice_moyan@163.com

严蕤：广州图匠数据科技有限公司高级研究员. 主要研究方向为深度学习和计算机视觉.E-mail: reeyree@163.com

郭怡适：广州图匠数据科技有限公司首席执行官. 主要研究方向为深度学习和计算机视觉.E-mail: yi.shi@imagedt.com

计量
- 文章访问数: 2120
- HTML全文浏览量: 597
- PDF下载量: 217
- 被引次数: 0
出版历程
- 收稿日期: 2019-09-06
- 录用日期: 2020-02-23
- 网络出版日期: 2022-01-19
- 刊出日期: 2022-02-18

Towards Accurate Price Tag Recognition Algorithm With Multi-task RNN

MOU Yong-Qiang^1
,,
FAN Bao-Jie^{1, 2
,},
SUN Chao^1
,,
YAN Rui^1
,,
GUO Yi-Shi^1
,

1.
AI-Labs, Guangzhou Image Data Technology Co., Ltd., Guangzhou 510310
2.
College of Information Engineering, Guangdong University of Technology, Guangzhou 510006

More Information

Author Bio:
MOU Yong-Qiang　 Chief AI architect at Guangzhou Image Data Technology Co., Ltd. He received his master degree in signal and information processing from Xi＇an University of Technology in 2012. His research interest covers computer vision, pattern recognition, and deep learning. Corresponding author of this paper

FAN Bao-Jie　Master student at Guangdong University of Technology. His research interest covers deep learning and computer vision

SUN Chao　Master student at South China Agricultural University. His research interest covers deep learning and computer vision

YAN Rui　 Advanced Researcher at Guangzhou Image Data Technology Co., Ltd. His research interest covers deep learning and computer vision

GUO Yi-Shi　 Chief executive officer at Guangzhou Image Data Technology Co., Ltd. His research interest covers deep learning and computer vision

摘要

摘要: 为了促进智能新零售在线下业务场景的发展, 提高作为销售关键信息价格牌的识别精度. 本文对价格牌识别问题进行研究, 有效地提高了价格牌的识别精度, 并解决小数点定位不准确的难题. 通过深度卷积神经网络提取价格牌的深度语义表达特征, 将提取到的特征图送入多任务循环网络层进行编码, 然后根据解码网络设计的注意力机制解码出价格数字, 最后将多个分支的结果整合并输出完整价格. 本文所提出的方法能够非常有效地提高线下零售场景价格牌的识别精度, 并解决了一些领域难题如小数点的定位问题, 此外, 为了验证本文方法的普适性, 在其他场景数据集上进行了对比实验, 相关结果也验证了本文方法的有效性.
- 卷积神经网络 /
- 循环神经网络 /
- 文本识别 /
- 多任务学习 /
- 价格牌识别
Abstract: In order to promote the development of smart new retail in the offline scenario and improve the recognition accuracy of price tags, which is a key sales information, this paper studies this application scene to improve the recognition accuracy effectively of the price tag and solves the difficulty of locating decimal point. The deep semantic expression features of price tag are extracted by the deep convolutional neural network, sent to the multi-task recurrent network layer for encoding, and then the price number is decoded according to the attention mechanism of the decoding network, and finally the results of multiple branches are integrated to output the complete price. The method we proposed can effectively improve the price recognition accuracy in the smart new retail scenario and solve some challenge problems such as locating the position of decimal point. In addition, in order to verify the universality of the method, comparative experiments are carried out on datasets of other scenarios, and the related results also verify the effectiveness of the method in this paper.
- Convolutional neural network /
- recurrent neural network /
- text recognition /
- multi-task learning /
- price tag recognition

HTML全文

在深海勘探开发生产中, 海洋柔性立管作为连接海面作业平台与海床井口的关键构件^[1].在风、浪、洋流等外部载荷作用下, 海洋立管会产生振动现象, 而长期的振动则是造成柔性立管疲劳破损的主因^[2-4].因此, 开展先进的海洋柔性立管振动主动控制系统研究, 对延长立管使用寿命、提高生产效率和保证海洋油气生产安全具有重要的理论和实际意义.

从数学的观点看, 具有振动的海洋柔性立管系统可认为是典型的无限维分布参数系统^[5-11].其动力学往往建模为耦合的偏微分–常微分方程, 这使得现有许多对传统刚性系统成熟的方法不能直接应用.对海洋柔性立管振动控制的研究主要包括模态控制和边界控制.模态控制是基于提取的有限维受控子系统进行控制设计, 而忽略掉的高频模态可能导致系统产生控制溢出效应.边界控制能克服上述方法的缺点, 且容易由系统机械能相关的Lyapunov函数得出, 因此边界控制与其他控制技术如PID控制、鲁棒控制、自适应控制、反步控制、输出反馈控制等相结合的方法广泛应用于柔性立管系统的振动控制领域^[12-16].上述研究仅仅局限于柔性立管系统的振动控制, 而这些方法将不适用于具有输入非线性特性的柔性立管系统.

在实际的海洋油气生产环境中, 柔性立管系统除了受到风浪扰动和海洋洋流分布式扰动影响外, 其面临的情况可能会比之前研究的问题更加复杂.如系统固有的物理约束和执行器的约束将使得系统产生死区、饱和、磁滞、反向间隙等不光滑的非线性特性^[17-20].而这些不光滑的非线性特性将会限制系统的瞬态性能, 更为甚者, 将会致使系统不稳定.因此, 需要将这些不光滑的非线性约束特性考虑在控制设计中.为了解决海洋柔性立管系统的输入非线性约束问题, 一些学者基于立管原始无限维模型探索了不同的边界控制方法^{[13, 21-24]}.文献[13]面向具有系统不确定性、输出约束和输入饱和的海洋立管系统, 基于反推技术研发了障碍边界控制策略以抑制振动、补偿系统不确定性以及处理系统的输入输出限制.文献[21]针对具有执行器输入饱和非线性约束和外部海洋扰动的海洋柔性立管系统, 在顶端构建边界控制器以稳定其在平衡位置的小邻域并利用辅助系统补偿执行器饱和的影响.文献[22]设计了鲁棒自适应控制器用以稳定具有参数不确定性和输入受限的海洋柔性立管系统.文献[23]采用光滑的双曲正切函数、Nussbaum函数和辅助系统设计边界控制器以抑制立管振动并限制控制输入在给定范围内, 该方法解决了文献[21−22]中应用符号函数限制控制输入所带来的震颤问题.文献[24]引入辅助函数和变量设计边界控制器来实现立管的振动减弱并消除混合的死区−饱和非线性约束影响.然而, 这些成果仅仅解决了柔性立管系统执行器输入饱和或输入饱和−死区非线性约束问题, 而对于具有输入反向间隙−饱和非线性约束的柔性立管系统, 上述方法将不能适用.

本文针对执行器非光滑反向间隙−饱和约束特性的深海柔性立管系统(如图 1所示), 首先将反向间隙−饱和约束转换成虚拟的输入饱和约束, 其后引入辅助系统并采用Lyapunov理论, 构建边界控制以抑制柔性立管的振动并消除饱和非线性约束的影响.随后, 证明了闭环系统在Lyapunov意义下的一致有界稳定性.最后, 通过数值仿真, 验证了本文所提出控制能处理非光滑反向间隙−饱和约束非线性影响, 也能有效抑制立管系统振动.

图 1 柔性立管系统

Fig. 1 Flexible riser system

下载: 全尺寸图片幻灯片

1. 问题描述和预备知识

注1.本文作如下简写: $ (\cdot)(x, t) = (\cdot) $, $ (\cdot)' = \dfrac{\partial(\cdot)}{\partial{x}} $, $ \dot{(\cdot)} $ = $ \dfrac{\partial(\cdot)}{\partial{t}} $.

1.1 立管动力学模型

深海柔性立管系统如图 1所示, 其中$ l $为立管的长度, $ y(z, t) $为立管在位置$ z $时刻$ t $的偏移量, $ f(z, t) $为海洋洋流分布式扰动, $ d(t) $为外部环境扰动, $ u(t) $为边界控制输入.

本研究所考虑立管系统动力学描述如下^[1]:

$\begin{split} \rho\ddot{y}(z,&t)-\left\{T[z, y'(z,t)]+\right.\\ & \left.3\psi(z)y'^2(z,t)\right\}y''(z,t)-\\ & \ T'[z, y'(z,t), y''(z,t)]y'(z,t)+c\dot{y}(z,t)-\\ & \ \psi'(z)y'^3(z,t)+ EIy''''(z,t)-\\ & \ f(z,t) = 0,\ \ \ 0<z<l \end{split} \hspace{33pt} $

(1)

$ \begin{align} y(0,t) = y'(0,t) = y''(l,t) = 0 \end{align} \hspace{78pt} $

(2)

$ \begin{split} m\ddot{y}(l,t)+& T[l, y'(l,t)]y'(l,t)+\psi(l)y'^3(l,t)-u(t)+\\ & d_a\dot{y}(l,t) = EIy'''(l,t)+d(t) \end{split} \hspace{5pt}$

(3)

其中, $ \rho $, $ c $和$ EI $分别为立管的单位长度质量、阻尼系数和弯曲刚度, $ d_a $和$ m $为船的质量和阻尼系数, $ T[z, y'(z, t)] $为立管的时空变化张力, 表示为

$ \begin{align} T[z, y'(z,t)] = T_0(z)+\psi(z)y'^2(z,t) \end{align} $

(4)

其中, $ T_0(z) > 0 $为初始张力, $ \psi(z)\ge 0 $为非线性弹性模量.

执行器输入饱和非线性描述为^[25]

$ \begin{align} \varphi(t) = sat(\varrho(t)) = \begin{cases} a , \qquad\quad\ \varrho(t)\ge a \\[2mm] \varrho(t) , \qquad -a < \varrho(t) < a \\[2mm] -a, \qquad\ \ \, \varrho(t)\ -a \end{cases} \end{align} $

(5)

其中, $ a > 0 $为饱和界限.

执行器输入反向间隙非线性描述为^[24]

$\begin{array}{l} u(t) = D(\varphi (t)) = \\ \qquad\;\;\;\left\{ {\begin{aligned} &{\varphi (t) - b,\;\qquad \dot \varphi }{ > 0\;\text{且}\;u(t) = \varphi (t) - b}\\ &{\varphi (t) + b,\;\qquad \dot \varphi }{ < 0\;\text{且}\;u(t) = \varphi (t) + b}\\ &{u(t\_), \qquad\quad\;\; \text{其他}}&{} \end{aligned}} \right. \end{array}$

(6)

其中, $ b > 0 $为反向间隙参数.

由输入饱和与反向间隙的表达式(5)和式(6)可知, 系统的非线性特征是相当复杂的, 因此很难直接对其处理.根据文献[25], 可知输入饱和与反向间隙可转换并表示为一个虚拟的输入饱和.因此, 为解决虚拟的输入非线性问题, 我们引入$ D $的右逆$ D^+ $为

$ \begin{align} \varrho(t) = D^+(\tau(t)) = \left\{ \begin{aligned} & \tau(t)+b, \; \; \dot{\tau}(t)>0 \\ & \tau(t)-b, \; \; \dot{\tau}(t)<0 \\ & \varrho(t\_), \; \;\;\;\;\; \dot{\tau}(t) = 0 \end{aligned} \right. \end{align} $

(7)

根据上面的分析和文献[25], 我们可得混合的输入饱和−反向间隙非线性特性可描述为

$ \begin{split} u(t) = & D(sat(D^+(\tau(t)))) = \\ &\left\{ \begin{aligned} & \,a-b, \qquad\;\;\, \tau(t)\ge a-b \\ & \, \tau(t), \qquad\quad\; |\tau(t)|<a-b \\ & -a+b, \quad\;\;\tau(t)\le-a+b \end{aligned} \right. \end{split} $

(8)

由式(8)可知, 我们可将系统的输入饱和−反向间隙非线性视为一个输入饱和来处理.

1.2 预备知识

引理1^[26].设$ \chi_1(z, t) $, $ \chi_2(z, t)\in {\bf{R}} $, $ \varphi > 0 $, 其中$ (z, t)\in$ $[0, l]\times[0, +\infty) $, 则

$ \begin{align} \chi_1(z,t)\chi_2(z,t)\le \frac{1}{\varphi}\chi^2_1(z,t)+\varphi\chi^2_2(z,t) \end{align} $

(9)

引理2^[26].设$ \chi(z, t)\in {\bf{R}} $为定义在$ (z, t)\in[0, l]\times $ $[0, +\infty) $的函数, 且满足$ \chi(0, t) = 0, \forall t\in[0, +\infty) $, 则

$ \begin{align} \chi^2(z,t) \le l\int^l_0\chi^{{\prime}2}(z,t){\rm{d}}z \end{align} $

(10)

假设1.假定存在常数$ {F} $, $ {D}\in {\bf{R}}^+ $, 使得$\mid f(z, t)\mid \leq $ $ {F, } $ $ \forall{(z, t)}\in{[0, l]\times[0, +\infty), } $ $\mid d(t)\mid \leq {D, } $ $ \forall{t}\in[0, +\infty). $这个假设是合理的, 由于$ f(z, t) $和$ d(t) $是有限能量的, 因此是有界的^[21-24].

假设2.假定存在正常数$ \underline{T}_0 $, $ \overline{T}_0 $, $ \underline{\psi}_0 $, $ \overline{\psi}_0 $, 使得$ \underline{T}_0\le T_0(z) \le \overline{T}_0 $, $ \underline{\psi}_0\le \psi(z)\leq \overline{\psi}_0 $.

假设3.对于新的输入饱和表达式(8), 假定存在一个正常数$ \varpi $使得$ |\triangle u|\le \varpi $, 其中, $ \triangle u = u(t)-$ $\tau(t) $.

2. 控制器设计

本节将引入辅助函数和辅助系统用于构建边界控制器以抑制立管振动并消除输入非线性影响.

2.1 边界控制器

首先, 设计辅助系统为

$ \begin{split}\! \dot{\nu}(t) =&\ \frac{1}{m}\left(-k_1\nu(t)-\triangle u+T[l, y'(l,t)]y'(l,t)+ \right. \\ & \left. \psi(l)y'^3(l,t)+d_a\dot{y}(l,t)-EIy'''(l, t)\right) \end{split} $

(11)

其中, $ \nu(t) $为辅助系统的状态变量, $ k_1 $为正常数.

为便于分析闭环立管系统的稳定性, 定义如下辅助变量

$\begin{split} \mu(t) =\;& \dot{y}(l,t)-k_2y'''(l, t)+y'(l,t)+\\ &k_3y'^3(l,t)+\nu(t) \end{split}$

(12)

其中, $ k_2, k_3 $为正常数.

对式(12)求导, 代入式(3)和式(11), 可得

$ \begin{aligned} \dot{\mu}(t) =\;& \frac{1}{m}(\tau(t)+d(t)-mk_2\dot{y}'''(l, t)+m\dot{y}'(l,t)+\\ & 3mk_3y'^2(l,t)\dot{y}'(l,t)-k_1\nu(t)) \end{aligned} $

(13)

根据上述分析, 提出控制律$ \tau(t) $为

$ \begin{aligned} \tau(t) = & -k_4\mu(t)+k_1\nu(t)+mk_2\dot{y}'''(l, t)-m\dot{y}'(l,t) -\\ & \ 3mk_3y'^2(l,t)\dot{y}'(l,t)-{\rm{sgn}}(\mu(t)){D} \end{aligned} $

(14)

其中, $ k_4 $为正常数.

注2.所设计的控制器(14)是由可获得的边界信号组成的, 其中$ y'''(l, t) $、$ y'(l, t) $和$ y(l, t) $分别可由剪切力传感器、倾角计和位移传感器获得.此外, 控制器中这些信号的一阶时间微分信号$ \dot{y}'''(l, t), $ $ \dot{y}'(l, t) $和$ \dot{y}(l, t) $分别可对已获得信号进行后向差分算法得到^[21-24].

选取如下Lyapunov函数为

$ Y(t) = {{Y}_{e}}(t)+{{Y}_{f}}(t)+{{Y}_{g}}(t) $

(15)

其中,

$ \begin{align} {{Y}_{e}}(t) = \frac{\varsigma}{2}\rho\int_{0}^{l}{{{{\dot{y}}}^{2}}(z,t){\rm{d}}z} +\frac{\varsigma}{2}\int_{0}^{l}T_0(z){{{ {y}^{\prime2}\left( z,t\right) }}{\rm{d}}z}+\\ \frac{\varsigma}{2}\int_{0}^{l}\psi(z){{{ {y}^{\prime4}\left( z,t\right) }}{\rm{d}}z}+\frac{\varsigma}{2}EI\int_{0}^{l}y^{\prime\prime 2}(z,t){\rm{d}}z \end{align} $

(16)

$ \begin{align} {{Y}_{g}}(t) = \frac{\varsigma m}{2}\nu^2(t)+\frac{\varsigma m}{2}\mu^2(t) \end{align} \hspace{78pt}$

(17)

$ \begin{align} {{Y}_{f}}(t) = \lambda\rho\int_{0}^{l} z \phi(z){\dot{y} (z,t){y}'(z,t){\rm{d}}z} \end{align} $

(18)

其中, $ \varsigma, \lambda > 0 $.

引理3.选取的Lyapunov函数(16)是一个正定的函数:

$ \begin{split} 0\le\; & \delta_1[Y_e(t)+Y_f(t)]\le Y(t)\le \\ &\delta_2[Y_e(t)+Y_f(t)] \end{split} $

(19)

其中, $ \delta_1 > 0, \; \delta_2 > 1 $.

证明.根据引理1, 式(18)可放缩为

$ \begin{split} \mid Y_g(t)\mid\ \le\ & \frac{\lambda\rho \overline{\phi}l}{2}\int^l_0[\dot{y}^2(z,t)+\\ &\ y^{{\prime}2}(z,t)]{\rm{d}}z \le \delta_0{Y_e(t)} \end{split} $

(20)

其中

$ \begin{align} \delta_0 = \frac{\lambda \rho \overline{\phi}l}{\min\left({\varsigma}\rho, {\varsigma}\underline{T_0}\right)} \end{align} $

(21)

通过恰当地选取$ \varsigma $和$ \beta $得出

$ \begin{align} \delta_1 = 1-\delta_0>0, \;\delta_2 = 1+\beta_0>1 \end{align} $

(22)

式(22)表明$ 0 < \delta < 1 $, 应用式(21)可得

$ \begin{align} {\varsigma}>\frac{\lambda \rho \overline{\phi}l}{\min\left(\rho, \underline{T_0}\right)} \end{align} $

(23)

重排式(20), 有

$ \begin{align} -{\delta}Y_e(t)\le Y_g(t)\le {\delta}Y_e(t) \end{align} $

(24)

将式(22)代入式(24)得出

$ \begin{align} 0\le \delta_1 Y_e(t)\le Y_e(t)+Y_g(t)\leq \delta_2 Y_e(t) \end{align} $

(25)

结合式(15), 有

$ \begin{aligned} 0\le\;& \delta_1[Y_e(t)+Y_f(t)]\le Y(t)\leq\\ &\delta_2[Y_e(t)+Y_f(t)] \end{aligned} $

(26)

其中, $ \delta_1 > 0, \; \delta_2 > 1 $.

引理4.选取Lyapunov函数(16)的导数是有上界的:

$ \begin{align} \dot{Y}(t)\le -\delta Y(t)+\alpha \end{align} $

(27)

其中, $ \delta, \alpha > 0 $.

证明.对式(16)求导, 可得:

$ \begin{align} \dot{Y}(t) = \dot{Y}_e(t)+\dot{Y}_f(t)+\dot{Y}_g(t) \end{align} $

(28)

将式(16)求导, 代入式(1)并应用引理1, 可得

$ \begin{aligned} \dot{Y}_e(t)\leq \; &\frac{\varsigma T_0(l)}{2}\mu^2(t)-\frac{\varsigma T_0(l)}{2}\nu^2(t)-\frac{\varsigma T_0(l)}{2}\dot{y}^2(l,t)-\\& \frac{\varsigma T_0(l)k^2_2}{2}y'''^2(l,t)-\frac{\varsigma T_0(l)}{2}y'^2(l,t)-\\ & \frac{\varsigma T_0(l)k^2_3}{2}y'^6(l,t)+{\varsigma T_0(l)}{k_2}\nu(t){y}'''(l,t)-\\ & ({\varsigma EI}-{\varsigma T_0(l)}{k_2})y'''(l,t)\dot{y}(l,t)-\\ & \varsigma k_3T_0(l)y'^4(l,t)-{\varsigma}(c-{\sigma_1})\int^l_0\dot{y}^2(z, t){\rm{d}}z+\\ & (2\varsigma\psi(l)-{\varsigma k_3T_0(l)})y'^3(l,t)\dot{y}(l,t)+\\ &{\varsigma k_2k_3T_0(l)}{y}'''(l,t)y'^3(l,t)-{\varsigma T_0(l)}\nu(t)\dot{y}(l,t)+\\ &{\varsigma k_2T_0(l)}y'''(l,t){y}'(l,t)-{\varsigma k_3T_0(l)}y'^3(l,t)\nu(t)-\\ &{\varsigma T_0(l)}\nu(t){y}'(l,t)+\frac{\varsigma}{\sigma_1} \int^l_0f^2(z,t){\rm{d}}z \end{aligned} $

(29)

其中, $ \delta_1 > 0 $.

对$ Y_f(t) $求导, 代入式(11)和式(14), 应用引理1, 可得

$ \begin{split} \dot{Y}_g(t)\le& -\varsigma k_4\mu^2(t)-\varsigma \nu(t)\triangle u-\varsigma k_1\nu^2(t)+\\& \varsigma T_0(l)\nu(t)y'(l,t)-\varsigma EI \nu(t)y'''(l, t)+\\& 2\varsigma \psi(l)\nu(t)y'^3(l,t)+\varsigma d_a \nu(t)\dot{y}(l,t) \end{split} $

(30)

对$ Y_g(t) $求微分, 代入式(4)并利用引理1, 有

$ \begin{aligned} \dot{Y}_f(t)\le & -l\lambda EI\phi(l) y'''(l,t){y}'(l,t)+\frac{\lambda \rho l\phi(l)}{2}\dot{y}^2(l,t)-\\ &\frac{3\lambda EI}{2}\int^l_0(\phi(z)+z\phi'(z)){y}^{{\prime\prime}2}(z, t){\rm{d}}z-\\ &\left[\frac{\lambda \rho}{2}(\phi(z)+z\phi'(z))-\frac{l\lambda c}{\sigma_2}\right]\int^l_0\dot{y}^2(z, t){\rm{d}}z-\\ &\bigg[\frac{\lambda }{2}(\phi(z)T_0(z)+z\phi'(z)T_0(z)-z\phi(z)T_0'(z))-\\ & {\lambda\sigma_2cl\phi^2(z)}-{\lambda\sigma_3l\phi^2(z)}\bigg]\int^l_0{y}^{{\prime}2}(z, t){\rm{d}}z-\\ & \frac{\lambda }{2}\int^l_0[3\phi(z)\psi'(z)+3z\phi'(z)\psi(z)-\\ &z\phi(z)\psi'(z)]{y}^{{\prime}4}(z, t){\rm{d}}z+\frac{3\lambda \phi(l)\psi(l)l}{2}y'^4(l,t)+\\ & \frac{l\lambda}{\sigma_3} \int^l_0f^2(x,t){\rm{d}}x+\frac{\lambda \phi(l)T_0(l) l}{2}y'^2(l,t) \end{aligned} $

(31)

其中, $ \sigma_2, \sigma_3 > 0 $.

将式(29)和式(30)代入式(28), 应用引理1, 可得

$ \begin{aligned} \dot{Y}(t)\le\;& -\varsigma\left( k_1+\frac{ T_0(l)}{2}-\frac{1}{\sigma_4}-\frac{|T_0(l)k_2-EI|}{2\sigma_5}-\right.\\ &\left.\frac{|T_0(l)-d_a|}{2\sigma_6}-\frac{| k_3T_0(l)-2 \psi(l)|\sigma_9}{2}\right)\nu^2(t)-\\ & \frac{3\lambda EI}{2}\int^l_0(\phi(z)+z\phi'(z)){y}^{{\prime\prime}2}(z, t){\rm{d}}z +\\ &{\varsigma}{\sigma_4}\triangle u^2-\varsigma\left( k_4-\frac{ T_0(l)}{2}\right)\mu^2(t)-\left(\frac{\varsigma T_0(l)}{2}-\right.\\ &\left.\frac{{|\varsigma T_0(l)k_2-l\lambda{EI}\phi(l)|}{\sigma_8}}{2}-\frac{\lambda \phi(l)T_0(l) l}{2}\right)\times\\ &y'^2(l,t)-\left(\varsigma k_3T_0(l)-\frac{3\lambda \phi(l)\psi(l)l}{2}\right)y'^4(l,t)-\\ &\left(\frac{\varsigma T_0(l)}{2}-\right.\frac{{\varsigma|T_0(l)-d_a|}{\sigma_6}}{2}-\\ &\left.\frac{{\varsigma|T_0(l)k_2-EI|}{\sigma_7}}{2}-\frac{{\varsigma|k_3T_0(l)-2\psi(l)|}{\sigma_{10}}}{2}-\right.\\ &\left.\frac{\lambda \rho l\phi(l)}{2}\right)\dot{y}^2(l,t)-\varsigma\left(\frac{ T_0(l)k^2_3}{2}-\right.\\ &\left.\frac{| k_3T_0(l)-2 \psi(l)|}{2\sigma_9}-\frac{ k_2k_3T_0(l)}{2\sigma_{11}}-\right.\\ &\left.\frac{|k_3T_0(l)-2\psi(l)|}{2\sigma_{10}}\right)y'^6(l,t)-\left(\frac{\varsigma T_0(l)}{2}-\right.\\ &\left.\frac{{\varsigma|T_0(l)k_2-EI|}{\sigma_5}}{2}-\frac{{\varsigma|T_0(l)k_2-EI|}}{2{\sigma_7}}-\right.\\ &\left.\frac{{|\varsigma T_0(l)k_2-l\lambda{EI}\phi(l)|}}{2{\sigma_8}}-\frac{\varsigma k_2k_3T_0(l)\sigma_{11}}{2}\right)\times\\ &\left.y'''^2(l,t)-\left[\frac{\lambda }{2}(\phi(z)T_0(z)+z\phi'(z)T_0(z)-\right.\right.\\ &\left.z\phi(z)T_0'(z))-\right.{\lambda\sigma_2cl\phi^2(z)}-{\lambda\sigma_3l\phi^2(z)}\bigg]\\ &\left.\int^l_0{y}^{{\prime}2}(z, t){\rm{d}}z+\left(\frac{\varsigma}{\sigma_1}+\frac{l\lambda}{\sigma_3}\right)\int^l_0f^2(z,t){\rm{d}}z-\right.\\ &\left.\bigg({\varsigma}c-{\varsigma}{\sigma_1}+\frac{\lambda \rho}{2}(\phi(z)+z\phi'(z))-\frac{l\lambda c}{\sigma_2}\right)\times\\ &\int^l_0\dot{y}^2(z, t){\rm{d}}z-\frac{\lambda }{2}\int^l_0[3\phi(z)\psi'(z)+\\ &3z\phi'(z)\psi(z)-z\phi(z)\psi'(z)]{y}^{{\prime}4}(z, t){\rm{d}}z \end{aligned} $

(32)

其中, $ \sigma_4\sim\sigma_{11} > 0, $选择恰当的参数值$ \varsigma, $ $ \lambda, $ $ k_i, $ $ i = 1, $ $\cdots, 4, \delta_j, j = 1, \cdots, 11, $满足下列条件:

$ \begin{split} \frac{\varsigma T_0(l)}{2}-\;&\frac{{|\varsigma T_0(l)k_2-l\lambda{EI}\phi(l)|}{\sigma_8}}{2}-\\ &\frac{\lambda \phi(l)T_0(l) l}{2}\ge 0 \end{split} \hspace{51pt}$

(33)

$ \begin{split} \frac{\varsigma T_0(l)}{2}-\;&\frac{{\varsigma|T_0(l)-d_a|}{\sigma_6}}{2}-\frac{{\varsigma|T_0(l)k_2-EI|}{\sigma_7}}{2}-\\ &\frac{{\varsigma|k_3T_0(l)-2\psi(l)|}{\sigma_{10}}}{2}-\frac{\lambda \rho l\phi(l)}{2}\ge 0 \end{split} \hspace{20pt}$

(34)

$ \begin{split} \frac{\varsigma T_0(l)}{2}-\;&\frac{{\varsigma|T_0(l)k_2-EI|}{\sigma_5}}{2}-\frac{{\varsigma|T_0(l)k_2-EI|}}{2{\sigma_7}}-\\ &\frac{{|\varsigma T_0(l)k_2-l\lambda{EI}\phi(l)|}}{2{\sigma_8}}-\frac{\varsigma k_2k_3T_0(l)\sigma_{11}}{2}\ge 0 \end{split} $

(35)

$ \begin{split} \frac{ T_0(l)k^2_3}{2}-\;&\frac{| k_3T_0(l)-2 \psi(l)|}{2\sigma_9}-\\ &\frac{|k_3T_0(l)-2\psi(l)|}{2\sigma_{10}}-\frac{ k_2k_3T_0(l)}{2\sigma_{11}}\ge 0 \end{split} \hspace{11pt}$

(36)

$ \begin{align} \varsigma k_3T_0(l)-\frac{3\lambda \phi(l)\psi(l)l}{2}\ge 0 \end{align} \hspace{86pt}$

(37)

$ \begin{split} \omega_1 =& \min\{ {\varsigma}c-{\varsigma}{\sigma_1}-\frac{l\lambda c}{\sigma_2}+ \\& \frac{\lambda \rho}{2}(\phi(z)+z\phi'(z))\}>0 \end{split} \hspace{78pt}$

(38)

$ \begin{aligned} \omega_2 = &\min\bigg\{\frac{\lambda}{2}(\phi(z)T_0(z)+z\phi'(z)T_0(z)-\\& z\phi(z)T_0'(z))-\lambda\sigma_2cl\phi^2(z)-\lambda\sigma_3l\phi^2(z) \bigg\}>0 \end{aligned} $

(39)

$ \begin{split} \omega_3 = &\min\{3\phi(z)\psi'(z)+3z\phi'(z)\psi(z)-\\ &z\phi(z)\psi'(z)\} >0 \end{split} \hspace{32pt}$

(40)

$ \begin{align} \omega_4 = \min\{\phi(z)+z\phi'(z)\} >0 \end{align}\hspace{67pt} $

(41)

$ \begin{split} \omega_5 =\;& k_1+\frac{ T_0(l)}{2}-\frac{1}{\sigma_4}-\frac{| k_3T_0(l)-2 \psi(l)|\sigma_9}{2}-\\ &\frac{|T_0(l)k_2-EI|}{2\sigma_5}-\frac{|T_0(l)-d_a|}{2\sigma_6}>0 \end{split} $

(42)

$ \begin{align} \omega_6 = k_4-\frac{ T_0(l)}{2} >0 \end{align} \hspace{105pt}$

(43)

$ \begin{align} \alpha = \left(\frac{\varsigma}{\sigma_1}+\frac{l\lambda}{\sigma_3}\right)lF^2+{\varsigma}{\sigma_4}\varpi^2<+\infty \end{align} \hspace{33pt}$

(44)

结合式(33) ~(44), 可得

$ \begin{aligned} \dot{Y}(t) \le & \ \alpha-\omega_1\int^l_0\dot{y}^2(z, t){\rm{d}}z-\omega_2\int^l_0{y}^{{\prime}2}(z, t){\rm{d}}z-\\ & \frac{\lambda }{2}\omega_3\int^l_0{y}^{{\prime}4}(z, t){\rm{d}}z-\frac{3\lambda EI}{2}\omega_4\int^l_0{y}^{{\prime\prime}2}(z, t){\rm{d}}z-\\& \ \varsigma\omega_5\nu^2(t)-\varsigma\omega_6\mu^2(t)\le\\ & \ \delta_3[Y_e(t)+Y_f(t)]+\alpha \end{aligned} $

(45)

其中, $ \delta_3 = {\min}\left(\dfrac{2\omega_1}{{\varsigma}\rho}, \dfrac{2\omega_2}{{\varsigma}\overline{T}_0}, \dfrac{\lambda\omega_3}{\varsigma\overline{\psi}}, \dfrac{3\lambda\pi_4}{\varsigma}, \dfrac{2\pi_5}{m}, \dfrac{2\pi_6}{m}\right) $.

根据式(26)和式(45), 有

$ \begin{align} \dot{Y}(t)\le -\delta{Y}(t)+\alpha \end{align} $

(46)

其中, $ \delta = \delta_3/\delta_2 $.

定理1.针对执行器非光滑反向间隙−饱和约束特性的深海柔性立管系统, 如果系统初始条件是有界的且所选取参数满足约束条件式(33) ~(44), 在设计控制器(14)、假设1和假设2作用下, 闭环系统是一致有界稳定的.

证明.将式(27)乘以$ {\rm{e}}^{{\vartheta}t} $, 得出:

$ \begin{align} \frac{\partial}{\partial t}\left({Y}(t){\rm{e}}^{\delta t}\right)\le \alpha {\rm{e}}^{\delta t} \end{align} $

(47)

积分上式并变换, 有:

$ \begin{align} {Y}(t)\le Y(0){\rm{e}}^{-\delta t}+\frac{\alpha}{\delta}\left(1-{\rm{e}}^{-\delta t}\right)\le Y(0){\rm{e}}^{-\delta t}+\frac{\alpha}{\delta} \end{align} $

(48)

求助于$ Y_{e}(t) $, 式(19)和引理2, 可得

$ \begin{split} \frac{{\varsigma}\underline{T}_0}{2l}y^2(z,t)\le &\frac{{\varsigma}}{2}\int^l_0T_0(z){y}^{{\prime}2}(z,t){\rm{d}}z\le\\ &{Y_e(t)}\le\frac{1}{\delta_1}Y(t) \end{split} $

(49)

将式(48)代入式(49), 产生

$ \begin{split} \mid y(z,t)\mid \le \sqrt{\frac{2l}{{\varsigma}\delta_1\underline{T}_0}\left[Y(0){\rm{e}}^{-\delta t} +\frac{\alpha}{\delta}\right]}, \\ \forall (z,t) \in[0,l]\times[0,+\infty) \end{split} $

(50)

进一步得出

$ \begin{split} \underset{t\to\infty}{\mathop{\lim }} \,\left| y(z,t) \right| \le\sqrt{\frac{2l\alpha}{\varsigma{\underline{T}_0}{\delta}_{1}\delta}}, \ \ \ \forall z\in[0,l] \end{split} $

(51)

3. 数值仿真

为验证所设计控制器的性能, 本节在MATLAB软件中采用有限差分法^[27-30]来近似闭环系统的数值解.柔性立管系统的参数为$ l = 1\; 000\, \rm{m}, $ $ \rho = 500\, \rm{kg/m}, $ $ c = 1.0\, \rm{Ns/m^2}, $ $ T_0(z) = 4.5\times10^5\times(1\; 000+z)\, \rm{N}, $ $\psi(z)=$ $ 1\times10^3 (1\; 000+z), $ $ EI $ = $ 1.5\times10^7\, {\rm N m^2}, ~{m}$ $=9.6\times10^6\, \rm{kg}, $ $ d_a = 1\; 000\, \rm{Ns/m}. $系统的初始条件描述为: $ y(z, 0) =$ $ \dfrac{12z}{l}, ~ \dot{y}(z, 0) = 0 $.

外部环境扰动$ d(t) $为

$ \begin{split} d(t) =\;& [3+0.8\sin(0.7t)+0.8\sin(0.5t)+\\& 0.8\sin(0.9t)]\times10^5 \end{split} $

(52)

柔性立管系统在自由振动时, 即$ u(t) = 0 $, 图 2给出了其时空的表示.在所示设计控制器(14)作用下, 选取控制设计参数$ k_1 $ = $ 1\times10^7 $, $ k_2 = {1}/{60}, $ $ k_3= {1}/{225}, $ $ k_4 $ = $ 5\times10^8, $ $ a $ = $ 1\times10^6 $, $ b = 5~\times $ $10^6 $, 立管三维响应显示在图 3中. 图 4则给出了立管中部顶端$ (x = 1\; 000\; {\rm{m}}) $的二维偏移图, 图 5和图 6分别描绘了所设计的控制命令和反向间隙−饱和控制输入.

图 2 未受控的立管偏移量

Fig. 2 Displacement of the uncontrolled riser

下载: 全尺寸图片幻灯片

图 3 受控的立管偏移量

Fig. 3 Displacement of the controlled riser

下载: 全尺寸图片幻灯片

图 4 立管的端点偏移量

Fig. 4 Endpoint displacement of the riser

下载: 全尺寸图片幻灯片

图 5 设计的控制命令

Fig. 5 Designed control command

下载: 全尺寸图片幻灯片

图 6 非线性的控制输入

Fig. 6 Control input with nonlinearities

下载: 全尺寸图片幻灯片

仿真图 2和图 3表明, 在外部扰动和执行器非光滑反向间隙−饱和约束条件下, 所设计控制器(14)能有效抑制立管振动; 由仿真图 4可得, 立管端点的偏移量稳定在平衡位置附近的小邻域; 仿真图 5和图 6得出, 控制器的输入是非线性的, 执行器非光滑反向间隙−饱和约束特性也相当地明显.根据上述分析, 可得如下结论:由于混合的输入非线性影响, 立管的振动偏移量需要相对长的收敛时间; 本文所构建的控制策略能较好地处理执行器非光滑反向间隙−饱和约束并能有效地抑制立管振动.

4. 结论

本文解决了具有执行器非光滑反向间隙−饱和约束特性的深海柔性立管边界控制问题.首先, 基于Lyapunov理论和边界控制技术, 采用辅助系统和函数在立管顶端构建了边界控制器以实现立管系统的振动抑制和输入非线性的补偿.其后, 应用严格的分析且没有离散化或简化系统的偏微分方程动力学, 证明了受控系统的一致有界性.最后所呈现的仿真结果验证了提出控制能较好地稳定立管系统并有效消除执行器非光滑反向间隙−饱和约束影响.下一步值得探索的研究方向可以为海洋柔性立管系统的有限时间稳定^[31]以及基于不确定性和干扰估计^[32]的控制设计.

图 1 卷积循环网络结构

Fig. 1 The structure of convolutional recurrent neural network

下载: 全尺寸图片幻灯片

图 2 价格牌图像

Fig. 2 Images of some price tag samples

下载: 全尺寸图片幻灯片

图 4 基础单任务识别网络结构

Fig. 4 The structure of our basic single recognition network

下载: 全尺寸图片幻灯片

图 5 多任务循环卷积网络结构

Fig. 5 The structure of multi-task RNN

下载: 全尺寸图片幻灯片

图 3 基准识别与多分支识别结果的生成方式

Fig. 3 Baseline method compared with multi-branch method

下载: 全尺寸图片幻灯片

图 6 注意力机制网络解码流程图

Fig. 6 Flowchart of decoder network based on attention

下载: 全尺寸图片幻灯片

图 7 与直接识别方法的比较

Fig. 7 Compared with the single-branch method

下载: 全尺寸图片幻灯片

表 1 模块的研究(%)

Table 1 Study of modules (%)

Model General-data Hard-data

VGG-BiLSTM-CTC 50.20 20.20
VGG-BiLSTM-Attn 61.20 38.60
ResNet-BiLSTM-CTC 55.60 28.80
ResNet-BiLSTM-Attn 68.10 41.40

下载: 导出CSV

表 2 多任务模型结果(%)

Table 2 Results of multitask model (%)

Model General-data Hard-data

Baseline^[13] 68.10 41.40
NDPB&IB 90.10 72.90
NDPB&DB 91.70 74.30
IB&DB 92.20 73.20
NDPB&IB&DB 93.20 75.20

下载: 导出CSV

表 3 车牌数据集实验结果(%)

Table 3 Experimental results on license plate dataset (%)

DB FN Rotate Tilt Weather Challenge

TE2E^[17] 96.90 94.30 90.80 92.50 87.90 85.10
CCPD^[16] 96.90 94.30 90.80 92.50 87.90 85.10
Our method 98.24 98.81 98.12 98.79 98.19 91.92

下载: 导出CSV

参考文献(17)

[1]	Shi B, Bai X, Yao C. An end-to-end trainable neural network for image-based sequence recognition and its application to scene text recognition. IEEE transactions on pattern analysis and machine intelligence, 2016, 39(11): 2298-2304
[2]	Vaswani A, Shazeer N, Parmar N, Uszkoreit J, Jones L, Gomez A N, et al. Attention is all you need. In: Proceedings of the Neural Information Processing Systems. San Diego, USA: MIT, 2017. 5998−6008
[3]	Luong M T, Pham H, Manning C D. Effective approaches to attention-based neural machine translation [Online], available: https://arxiv.org/abs/1508.04025, Sep 20, 2015
[4]	Li H, Wang P, Shen C. Towards end-to-end text spotting with convolutional recurrent neural networks. In: Proceedings of the IEEE International Conference on Computer Vision. Venice, Italy: IEEE, 2017. 5238−5246
[5]	Yuan X, He P, Li X A. Adaptive adversarial attack on scene text recognition [Online], available: http://export.arxiv.org/abs/1807.03326, Jul 9, 2018
[6]	Graves A, Fernández S, Gomez F, Schmidhuber J. Connectionist temporal classification: Labelling unsegmented sequence data with recurrent neural networks. In: Proceedings of the 23rd International Conference on Machine Learning. Pittsburgh Pennsylvania, USA: ACM, 2006. 369−376
[7]	Sutskever I, Vinyals O, Le Q V. Sequence to sequence learning with neural networks. In: Proceedings of the Neural Information Processing Systems. Montréal, Canada: MIT, 2014. 3104−3112
[8]	Lei Z, Zhao S, Song H, Shen J. Scene text recognition using residual convolutional recurrent neural network. Machine Vision and Applications, 29(5), 861−871
[9]	Shi B, Yang M, Wang X, Lyu P, Yao C, Bai X. Aster: An attentional scene text recognizer with flexible rectification. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 41(9), 2035−2048
[10]	Long M, Wang J. Learning multiple tasks with deep relationship networks [Online], available: https://arxiv.org/abs/1506. 02117v1, Jul 6, 2015
[11]	Veit A, Matera T, Neumann L, Matas J, Belongie S. Coco-text: Dataset and benchmark for text detection and recognition in natural images [Online], available: https://arxiv.org/abs/1601.07140v1, Jan 26, 2016
[12]	Karatzas D, Gomez-Bigorda L, Nicolaou A, Ghosh S, Bagdanov A, Iwamura M, Shafait F. ICDAR 2015 competition on robust reading. In: Proceedings of the 13th International Conference on Document Analysis and Recognition (ICDAR). Tunis, Tunisia: IEEE, 2015. 1156−1160
[13]	Baek J, Kim G, Lee J, Park S, Han D. What is wrong with scene text recognition model comparisons? dataset and model analysis [Online], available: https://arxiv.org/abs/1904.01906, Dec 18, 2019
[14]	Bingel J, Søgaard A. Identifying beneficial task relations for multi-task learning in deep neural networks[Online], available: https://arxiv.org/abs/1702.08303, Feb 27, 2017
[15]	Xie Z, Huang Y, Zhu Y, Jin L, Liu Y, Xie L. Aggregation cross-entropy for sequence recognition. In: Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. Long Beach CA, USA: IEEE, 2019. 6538−6547
[16]	Li H, Wang P, Shen C. Toward end-to-end car license plate detection and recognition with deep neural networks. IEEE Transactions on Intelligent Transportation Systems, 2018, 20(3): 1126-1136
[17]	Xu Z, Yang W, Meng A, Lu N, Huang H, Ying C, Huang L. Towards end-to-end license plate detection and recognition: A large dataset and baseline. In: Proceedings of the European Conference on Computer Vision (ECCV). Munich, Germany: Springer, 2018. 255−271

施引文献

资源附件(0)

访问统计

图(7) / 表(3)

计量

文章访问数: 2120
HTML全文浏览量: 597
PDF下载量: 217
被引次数: 0

1. 问题描述和预备知识
1.1 立管动力学模型
1.2 预备知识
2. 控制器设计
2.1 边界控制器
3. 数值仿真
4. 结论

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

面向精准价格牌识别的多任务循环神经网络

doi: 10.16383/j.aas.c190633

计量

Towards Accurate Price Tag Recognition Algorithm With Multi-task RNN

1. 问题描述和预备知识

1.1 立管动力学模型

1.2 预备知识

2. 控制器设计

2.1 边界控制器

3. 数值仿真

4. 结论

计量

目录

1. 问题描述和预备知识

1.1 立管动力学模型

1.2 预备知识

2. 控制器设计

2.1 边界控制器

3. 数值仿真

4. 结论

Model	General-data	Hard-data
VGG-BiLSTM-CTC	50.20	20.20
VGG-BiLSTM-Attn	61.20	38.60
ResNet-BiLSTM-CTC	55.60	28.80
ResNet-BiLSTM-Attn	68.10	41.40

	DB	FN	Rotate	Tilt	Weather	Challenge
TE2E^[17]	96.90	94.30	90.80	92.50	87.90	85.10
CCPD^[16]	96.90	94.30	90.80	92.50	87.90	85.10
Our method	98.24	98.81	98.12	98.79	98.19	91.92

留言板

面向精准价格牌识别的多任务循环神经网络

doi: 10.16383/j.aas.c190633

计量

出版历程

Towards Accurate Price Tag Recognition Algorithm With Multi-task RNN

1. 问题描述和预备知识

1.1 立管动力学模型

1.2 预备知识

2. 控制器设计

2.1 边界控制器

3. 数值仿真

4. 结论

计量

出版历程

目录

1. 问题描述和预备知识

1.1 立管动力学模型

1.2 预备知识

2. 控制器设计

2.1 边界控制器

3. 数值仿真

4. 结论