2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于数据驱动的冗余机器人末端执行器位姿控制方案

金龙 张凡 刘佰阳 郑宇

金龙, 张凡, 刘佰阳, 郑宇. 基于数据驱动的冗余机器人末端执行器位姿控制方案. 自动化学报, 2024, 50(3): 518−526 doi: 10.16383/j.aas.c230273
引用本文: 金龙, 张凡, 刘佰阳, 郑宇. 基于数据驱动的冗余机器人末端执行器位姿控制方案. 自动化学报, 2024, 50(3): 518−526 doi: 10.16383/j.aas.c230273
Jin Long, Zhang Fan, Liu Bai-Yang, Zheng Yu. Position and orientation control scheme for end-effector of redundant manipulators based on data-driven technology. Acta Automatica Sinica, 2024, 50(3): 518−526 doi: 10.16383/j.aas.c230273
Citation: Jin Long, Zhang Fan, Liu Bai-Yang, Zheng Yu. Position and orientation control scheme for end-effector of redundant manipulators based on data-driven technology. Acta Automatica Sinica, 2024, 50(3): 518−526 doi: 10.16383/j.aas.c230273

基于数据驱动的冗余机器人末端执行器位姿控制方案

doi: 10.16383/j.aas.c230273
基金项目: 国家自然科学基金 (62176109), 甘肃省自然科学基金杰出青年项目 (21JR7RA531), 中央高校基本科研业务费 (lzujbky-2023-ct05, lzujbky-2023-ey07), 甘肃省教育厅优秀研究生“创新之星”项目 (2023CXZX-072), 腾讯Robotics X犀牛鸟专项研究计划 (2021-01), 兰州大学超算中心资助
详细信息
    作者简介:

    金龙:兰州大学信息科学与工程学院教授. 主要研究方向为神经网络, 机器人技术和智能信息处理. 本文通信作者. E-mail: jinlongsysu@foxmail.com

    张凡:兰州大学信息科学与工程学院硕士研究生. 主要研究方向为模型预测控制, 机器人技术和优化. E-mail: zhangfanas@foxmail.com

    刘佰阳:2023年获得兰州大学信息科学与工程学院硕士学位. 主要研究方向为机器人技术和神经网络. E-mail: baiyang-liu@foxmail.com

    郑宇:腾讯科技(深圳)有限公司Robotics X首席研究员. 主要研究方向为多体机器人系统, 机器人抓取与操作和机器人算法. E-mail: petezheng@tencent.com

Position and Orientation Control Scheme for End-effector of Redundant Manipulators Based on Data-driven Technology

Funds: Supported by National Natural Science Foundation of China (62176109), Natural Science Foundation of Gansu Province (21JR7RA531), Fundamental Research Funds for the Central Universities (lzujbky-2023-ct05, lzujbky-2023-ey07), Education Department of Gansu Province: Excellent Graduate Student “Innovation Star” Project (2023CXZX-072), CIE-Tencent Robotics X Rhino-Bird Focused Research Program (2021-01), and Supercomputing Center of Lanzhou University
More Information
    Author Bio:

    JIN Long Professor at the School of Information Science and Engineering, Lanzhou University. His research interest covers neural networks, robotics, and intelligent information processing. Corresponding author of this paper

    ZHANG Fan Master student at the School of Information Science and Engineering, Lanzhou University. His research interest covers model predictive control, robotics, and optimization

    LIU Bai-Yang Received his master degree from the School of Information Science and Engineering, Lanzhou University in 2023. His research interest covers robotics and neural network

    ZHENG Yu Principal researcher at Robotics X, Tencent Technology (Shenzhen) Company Limited. His research interest covers multibody robotic systems, robotic grasping and manipulation, and algorithms for robotics

  • 摘要: 模型未知的冗余机器人执行任务的过程中会产生较大的控制误差, 其末端执行器的位置与姿态也需要针对不同任务进行修正. 为解决该问题, 提出一种基于数据驱动的冗余机器人末端执行器位置与姿态控制方案. 该方案使用在线学习技术, 能够应用于模型未知的冗余机器人控制. 同时引入四元数表示法将控制机器人末端执行器姿态问题转化为基于四元数表示的控制方法. 随后, 设计一种神经动力学求解器对所提方案进行求解. 相关的理论分析、仿真及对比体现了所提方案的可行性、有效性与新颖性.
  • 机器人从自由度上可分为非冗余机器人和冗余机器人[1]. 非冗余机器人是指关节自由度小于或等于任务空间维度的机器人. 不同于非冗余机器人, 冗余机器人的关节自由度大于任务空间维度, 其额外的关节自由度提升了控制过程中的灵活性, 使机器人能够实现障碍物躲避等其他附加任务的能力[2-4]. 现存的大多数冗余机器人控制方案都需要准确的机器人模型信息, 如机器人出厂标定的DH (Denavit-Hartenberg)参数[5]. 它通过4个参数确定关节与连杆间的转化关系, 辅助科研人员实现机器人的精确建模. 文献[6]提出一种复杂工作空间下的机器人实时规划方法, 使机器人在跟踪目标运动的同时, 实现了躲避障碍物的功能. 为提高移动机器人搬运物品的效率, 文献[7]提出一种基于双向采样的方案, 用于为给定的移动机器人移动拾取和运输线路生成期望轨迹. 实验表明该方案能够降低35%的移动时间并提升16倍的计算速度. 一种正交投影机器人重复运动方案在文献[8]中提出, 解决了现有的重复运动方案存在的因关节角度误差而导致的位置误差问题. 上述冗余机器人的控制方案都是在假定机器人模型已知的情况下, 设计并构建控制方案驱动机器人完成目标任务. 然而, 机器人的模型信息通常会因实际使用过程中配备不同类型的末端执行器而发生改变. 这会导致此类方案控制精度降低, 甚至导致任务的失败.

    数据驱动技术自提出以来就受到了国内外的高度重视[9-10]. 其主要思想是通过收集并利用系统运行过程中大量的在线、离线数据, 实现对系统有效、鲁棒、稳定的建模与控制[11-12]. 数据驱动技术的提出有效地解决了模型不确定或者模型发生改变时的系统控制问题. 已有学者将数据驱动的思想应用于机器人控制领域, 并取得了卓越的成果. 针对机器人在实际使用过程中出现的模型不确定问题, 文献[13]提出一种基于数据驱动的位置/力控制方案, 从运动学的角度解决了模型未知的机器人位置/力控制问题. 文献[14]提出一种加速度层数据驱动的重复运动规划方案, 并构造了相应的递归神经网络, 对模型未知的冗余机器人提供了一种新的加速度层解决方案. 大量研究表明数据驱动技术能够对模型未知的机器人进行有效控制, 具有较强的应用价值.

    冗余机器人的轨迹跟踪控制同样是一个重要的研究方向. 机器人面临的大多数任务需要控制机器人的末端执行器沿预定的轨迹运动. 基于速度层、加速度层的算法被提出用于求解冗余机器人的最优解. 值得指出的是, 目前大多数从运动学和优化角度建模的方法存在两方面的不足[15-17]. 一方面, 这些方法基于机器人结构信息已知的情况实现对机器人的控制. 例如, 文献[18]基于冗余机器人的模型构建了一个动态神经网络方法, 实现了良好的控制性能. 然而, 结构信息不准确或未知的机器人是可能存在的. 例如, 物流机器人可能会受到货物形状、重量等因素的影响, 导致其结构信息不准确. 同样地, 自研机器人的设计和制造过程中也可能因人为疏忽或技术限制等原因导致其结构信息错误. 因此, 面向结构信息不准确或未知的机器人, 上述基于准确结构信息的方法将无法被应用. 另一方面, 这些方法仅考虑机器人末端执行器的位置跟踪, 忽略了其姿态控制的重要性. 例如, 文献[14]构建了一个可应用于结构信息未知机器人的重复运动控制方案, 但其仅考虑了末端执行器的位置跟踪, 在一定程度上限制了其应用场景. 事实上, 机器人末端执行器的姿态控制在大多数应用场景下都是不可或缺的, 在机器人执行任务的同时, 还需对其末端执行器姿态加以控制. 例如医疗手术、工业制造等领域[19-20]. 为弥补现有方法以上两方面的不足, 本文构建了基于数据驱动的冗余机器人末端执行器位姿控制方案. 该方案从机器人的运动学出发, 用四元数表示了末端执行器的姿态, 实现了对末端执行器位姿的控制. 此外, 一种神经动力学求解器被设计用于方案求解. 相关的理论分析与仿真实验均验证了方案的有效性与可行性, 与现有冗余机器人位姿控制方案的比较结果体现了所提方案的新颖性.

    本节从冗余机器人的运动学出发, 给出机器人末端执行器位姿与关节角间的关系, 并推导了四元数的表示方法以控制末端执行器的姿态. 此外, 设计了估计雅可比矩阵的数据驱动算法. 值得注意的是, 所提机器人末端执行器位姿控制方案所涉及到的符号含义在表1 作具体解释.

    表 1  所提冗余机器人控制方案的符号含义
    Table 1  Definitions of variables of the proposed scheme for redundant manipulators
    符号含义
    $ {{\boldsymbol{\theta}}} \in {\bf{R}}^a $机器人关节角向量
    $ \dot{\boldsymbol{\theta}}\in {\bf{R}}^a $机器人关节角速度向量
    $ \dot{\boldsymbol{\theta}}^{-}(\dot{\boldsymbol{\theta}}^{+}) $关节角速度的下界(上界)
    $ {\boldsymbol r}\in {\bf{R}}^b $末端执行器的位置向量
    $ \boldsymbol{r}^{d}\in {\bf{R}}^b $末端执行器的期望位置向量
    $ \dot{\boldsymbol r}\in {\bf{R}}^b $末端执行器的速度向量
    $ \dot{\hat{\boldsymbol r}}\in {\bf{R}}^b $末端执行器的估计速度向量
    $ f(\cdot): {\bf{R}}^a \rightarrow {\bf{R}}^b $机器人非线性前向运动学映射
    $ J=\dfrac{\partial f({{\boldsymbol{\theta}}})}{\partial {{\boldsymbol{\theta}}}}\in {\bf{R}}^{b\times a} $机器人雅可比矩阵
    $ \hat{J}\in {\bf{R}}^{b\times a} $机器人估计雅可比矩阵
    $ {\dot{\hat{J}}}\in {\bf{R}}^{b\times a} $机器人估计雅可比矩阵的导数
    $ M(\boldsymbol \theta)\in {\bf{R}}^{3\times 3} $末端执行器的方向旋转矩阵
    $ {\boldsymbol q}_{E}(\boldsymbol \theta)\in {\bf{R}}^{4} $末端执行器的方向四元数
    $ \boldsymbol{\overline{o}}(\boldsymbol \theta)\in {\bf{R}}^{5} $末端执行器的方向向量
    $ \tilde{\boldsymbol q}\in {\bf{R}}^{5} $末端执行器的期望方向向量
    $ H({\boldsymbol \theta})=\dfrac{\partial{\boldsymbol q}_{E}(\boldsymbol \theta)}{\partial{\boldsymbol \theta}}\in {\bf{R}}^{4\times a} $$ {\boldsymbol q}_{E} $ 的雅可比矩阵
    $ G({\boldsymbol{\theta}})=\dfrac{\partial{\boldsymbol{\overline{o}}({\boldsymbol{\theta}}})}{\partial{{\boldsymbol{\theta}}}}\in {\bf{R}}^{5\times a} $$ \boldsymbol{\overline{o}}({\boldsymbol{\theta}}) $的雅可比矩阵
    $ \kappa(\boldsymbol q)=\dfrac{\partial{{\tilde{\boldsymbol q}}}}{\partial{\boldsymbol q}}\in {\bf{R}}^{5\times 4} $$ \tilde{\boldsymbol q} $ 的雅可比矩阵
    $ \boldsymbol{u}\in {\bf{R}}^a $方差为极小值的独立同分布零均值随机噪声
    ${\boldsymbol{u} }_{0}\in {\bf{R} }^a$$ \boldsymbol{u} $的上界
    $ \hat{\dot{{\boldsymbol{\theta}}}}\in {\bf{R}}^a $受噪声驱动的关节角速度
    $ \Vert \cdot \Vert_2 $向量的二范数
    $ \mathrm{tr(\cdot)} $矩阵的迹
    下载: 导出CSV 
    | 显示表格

    冗余机器人的冗余度解析在其控制过程中十分重要. 冗余机器人的$ a $维自由度能够通过非线性映射函数转化到$ b $维的末端笛卡尔坐标系空间, 具体的数学表达式为

    $$ \begin{array}{*{20}{l}} f({{\boldsymbol{\theta}}})={{\boldsymbol{r}}}\end{array} $$ (1)

    进一步, 对式(1)关于时间求导, 可得

    $$ \begin{array}{*{20}{l}} J\dot{{\boldsymbol{\theta}}}=\dot{{\boldsymbol{r}}}\end{array} $$ (2)

    冗余机器人的末端执行器在任务空间中通常需要保持特定角度, 因此需要对末端执行器的位姿加以控制. 机器人末端执行器的姿态信息通常用旋转矩阵$ M $表示, 即

    $$ \begin{array}{*{20}{l}} M({\boldsymbol{\theta}})= \begin{bmatrix} a_{11} & a_{12} & a_{13} \\ a_{21} & a_{22} & a_{23} \\ a_{31} & a_{32} & a_{33} \end{bmatrix} \end{array} $$ (3)

    其中, $a_{ij}\;(i,j\in{1,2,3})$表示矩阵$ M $中的第$ i $行$ j $列个元素. 四元数由实数加上三个虚数单位组成, 主要用于在三维空间中表示旋转操作. 末端执行器的四元数可以看作是将基坐标系绕向量旋转得到的一个新的坐标系. 因此, 本文使用四元数表示末端执行器的姿态. 定义一个归一化四元数为

    $$ {{\boldsymbol{q}}(\phi,\boldsymbol{n})=\left[\cos\frac{\phi}{2},\sin\frac{\phi}{2}{\boldsymbol{n}}\right]=[\phi,v_{x},v_{y},v_{z}]^\text{T}} $$ (4)

    其中, $ \phi $表示旋转角度; $ {\boldsymbol{n}}$表示旋转轴向量. 由式(4)可得

    $$ \left\{ \begin{split} &\phi=\cos\frac{\phi}{2}, \quad v_{x}=\sin\frac{\phi}{2}{n}_{x} \\ &v_{y}=\sin\frac{\phi}{2}{n}_{y}, \quad v_{z}=\sin\frac{\phi}{2}{n}_{z} \end{split} \right.$$ (5)

    式(5)中四元数的复数形式可以表示为${\boldsymbol{q}}=\phi \;+ v_{x}{{\rm{i}}}+ v_{y}{\rm{j}} + v_{z}{\rm{k}}$. 符号${{\rm{i}}}$, ${{\rm{j}}}$, ${{\rm{k}}}$分别表示x轴, y轴, z轴方向的虚数单位. 根据四元数的定义, 可得

    $$ \begin{array}{*{20}{l}} ||{\boldsymbol{q}}||_{2}=v_{x}^{2}+v_{y}^{2}+v_{z}^{2}+\phi^{2}=1 \end{array}$$ (6)

    对于基坐标系的向量$ \boldsymbol s=[s_{x},s_{y},s_{z}]^\mathrm{T} $, 可以通过旋转运算写为四元数的形式$ {\tilde{{\boldsymbol{s}}}=[0,s_{x},s_{y},s_{z}]^\mathrm{T}}$. 在此基础上, 变换后的坐标可以表示为${ \boldsymbol s}_{w}={\boldsymbol q}\;\cdot {\boldsymbol s} \cdot {\boldsymbol q}^{\ast} .$ 其中“$ \cdot $”表示四元数的乘法, $ \boldsymbol q^{\ast} $为$ \boldsymbol q $的共轭形式. 给定四元数$ \boldsymbol q $ 的旋转矩阵排列可以表示为

    $$ \begin{split} & R({{\boldsymbol{q}}})=\\ &\quad\begin{bmatrix} 1-2v_{y}^{2}-2v_{z}^{2} \quad & 2v_{x}v_{y}-2v_{z}\phi \quad & 2v_{x}v_{z}+2v_{y}\phi\\ 2v_{x}v_{y}+2v_{z}\phi \quad & 1-2v_{x}^{2}-2v_{z}^{2} \quad & 2v_{y}v_{z}-2v_{x}\phi \\ 2v_{x}v_{z}+2v_{y}\phi \quad & 2v_{y}v_{z}+2v_{x}\phi \quad & 1-2v_{x}^{2}-2v_{y}^{2} \end{bmatrix} \end{split} $$ (7)

    联立式(3), (6), (7), 机器人末端执行器的方向可以用四元数$ {{\boldsymbol{q}}_{E}(\boldsymbol \theta)=[\phi^{e},v_{x}^{e},v_{y}^{e},v_{z}^{e}]^\text{T}}$表示为

    $$ \left\{ \begin{aligned} &\phi^{e}({\boldsymbol{\theta}}) =\frac{\sqrt{{\text{tr}}(\tilde{{\boldsymbol{q}}})+1}}{2}\\ &v_{x}^{e}({\boldsymbol{\theta}}) = \frac{a_{32}-a_{23}}{4\phi} \\ & v_{y}^{e}({\boldsymbol{\theta}}) = \frac{a_{13}-a_{31}}{4\phi} \\ & v_{z}^{e}({\boldsymbol{\theta}}) = \frac{a_{21}-a_{12}}{4\phi} \end{aligned} \right. $$ (8)

    对式(8)关于时间求导, 可得运动学控制式为

    $$ {\dot{{\boldsymbol{q}}}^{e}=\frac{\partial{\boldsymbol{q}}_{E}(\boldsymbol \theta)}{\partial{\boldsymbol{\theta}}}\frac{\partial{\boldsymbol{\theta}}}{\partial t}=H({\boldsymbol{\theta}}){\dot{\boldsymbol{\theta}}}} $$ (9)

    在此基础上, 机器人末端执行器的方向由旋转矩阵$ M(\boldsymbol \theta) $控制, 进一步可以推广到四元数的实时跟踪即旋转矩阵$ R({\boldsymbol{q}}) $的收敛问题. 由于旋转矩阵$ M(\boldsymbol \theta) $为正交矩阵, 其行、列均为正交的单位向量, 旋转矩阵$ M(\boldsymbol \theta) $中任意2 阶子矩阵即可唯一确定旋转矩阵$ M(\boldsymbol \theta) $. 此外需要一个额外元素来确认正负, 方向向量$ \boldsymbol{\overline{o}}(\boldsymbol \theta) $可以表示为

    $$ \begin{array}{*{20}{l}} {\boldsymbol{\overline{o}}}(\boldsymbol \theta)=[a_{11}, a_{12}, a_{21}, a_{22},a_{33}]^\mathrm{T}\in {\bf{R}}^5 \end{array}$$ (10)

    对于给定的四元数$ \boldsymbol q $, 其旋转矩阵$ R(\boldsymbol q) $对应的方向向量期望值$ \tilde{{\boldsymbol{q}}}$可以表示为

    $$ \begin{array}{*{20}{l}} {\tilde {{\boldsymbol{q}}}}=\begin{bmatrix} 1-2v_{y}^{2}-2v_{z}^{2} \\ 2v_{x}v_{y}-2v_{z}\phi \\ 2v_{x}v_{y}+2v_{z}\phi \\ 1-2v_{x}^{2}-2v_{z}^{2} \\ 1-2v_{x}^{2}-2v_{y}^{2} \end{bmatrix}\in {\bf{R}}^5 \end{array} $$ (11)

    为跟踪所需的方向向量, 设计误差函数为${\boldsymbol{e}}= {\overline{{\boldsymbol{o}}}}({\boldsymbol{\theta}})-{\tilde{\boldsymbol{q}}}$, 对该式求导可得

    $$ G({\boldsymbol{\theta}}){\dot{{\boldsymbol{\theta}}}=\kappa(\boldsymbol q){\dot{\boldsymbol{q}}}} $$ (12)

    其中, $ \dot{{\boldsymbol{q}}}$为向量$ \boldsymbol q $关于时间的导数. 针对不同的任务需求, 冗余机器人的末端执行器方向控制可以通过式(12)实现.

    冗余机器人的控制方案需要使用机器人的雅可比矩阵. 机器人制造商生产机器人时, 为机器人标定了标准的结构参数, 通过这些参数可以计算出机器人的雅可比矩阵. 然而, 机器人的结构信息通常会因实际使用过程中装配不同类型的末端执行器而发生改变, 并且机器人结构参数的测量是复杂且费时的.

    数据驱动技术能够将系统参数作为输入量, 动态地更新系统的未知量. 通过数据驱动技术, 机器人能够学习自身结构信息, 并利用学习到的信息协助完成给定的任务. 本文结合数据驱动技术, 提出一种雅可比矩阵实时更新的学习方案以控制模型未知的冗余机器人. 设计误差函数$ \Vert \dot{\hat{{\boldsymbol{r}}}}-\dot{\boldsymbol{r}}\Vert_2^2$, 其中$\dot{\hat{\boldsymbol{r}}}= \hat{J}\dot{{\boldsymbol{\theta}}}$. 通过梯度下降法可以得到

    $$ {\dot{\hat{J}}}=-\sigma\frac{\partial{\Vert {\dot{\hat{{\boldsymbol{r}}}}-{\dot{\boldsymbol{r}}}\Vert_2^2}}}{\partial{\hat{J}}}=-\sigma(\hat{J}{\dot{{\boldsymbol{\theta}}}}-{\dot{\boldsymbol{r}}}){\dot{{\boldsymbol{\theta}}}}^\mathrm{T} $$ (13)

    其中, $ \sigma>0 $代表控制收敛速率. 值得指出的是, 式(13)中的关节角速度$ \dot{{\boldsymbol{\theta}}}$和末端执行器速度$ \dot{{\boldsymbol{r}}}$为真实的测量数据, 本文以$ \dot{{\boldsymbol{\theta}}}$和$ \dot{{\boldsymbol{r}}}$为核心进行雅可比矩阵的学习. $ \dot{{\boldsymbol{\theta}}}$和$ \dot{{\boldsymbol{r}}}$可通过RGB-D传感器、惯性运动单元、动作捕捉系统等途径获得. 在此基础上, 冗余机器人估计的雅可比矩阵$ \hat J $能够收敛到真实的雅可比矩阵$ J $, 从而实现对机器人的控制.

    本节首先构建一种基于数据驱动技术的冗余机器人末端执行器位姿控制方案, 其考虑了速度层的控制误差反馈. 随后设计了相应的神经动力学求解器对所提方案进行求解, 能有效控制模型未知的机器人进行末端执行器位置与姿态的同步跟踪. 此外, 相关的理论分析证明了方案的收敛性.

    冗余机器人末端执行器的位姿精确度是评价方案的重要因素. 为保证机器人轨迹跟踪任务的顺利执行, 末端执行器通常需要与任务平面保持特定的角度. 本文提出一种基于数据驱动的冗余机器人末端执行器位姿控制方案, 其表述为

    $$ \min \;\; \frac{1}{2}\dot{{\boldsymbol{\theta}}}^\mathrm{T}\dot{{\boldsymbol{\theta}}}\;\;\;\tag{14a} $$
    $$ \; {\rm{s.t.}} \quad {\hat{J}}{\dot{\hat{\boldsymbol{\theta}}}}={\dot{\boldsymbol{r}}}^{d}\tag{14b} $$
    $$\qquad\;\; G({\boldsymbol{\theta}})\dot{\hat{{\boldsymbol{\theta}}}}=\kappa(\boldsymbol q)\dot{{\boldsymbol{q}}}\tag{14c} $$
    $$\qquad\;\; {\dot{\hat{J}}}=-\sigma(\hat{J}\hat{\dot{{\boldsymbol{\theta}}}}-{\dot{{\boldsymbol{r}}})\hat{\dot{{\boldsymbol{\theta}}}}^\mathrm{T}}\tag{14d} $$
    $$ \qquad\; \; \hat{\dot{{\boldsymbol{\theta}}}}=\dot{{\boldsymbol{\theta}}}+{\boldsymbol{u},\quad 0 \le \left\|\boldsymbol{u}\right\| \le {\boldsymbol{u}}_{0}} \tag{14e\,} $$
    $$ \qquad\;\; {\dot{{\boldsymbol{\theta}}}}^-\le \dot{{\boldsymbol{\theta}}}\le {\dot{{\boldsymbol{\theta}}}}^+ \tag{\,14f\,} $$

    值得注意的是, $ \hat{J} $或$ \dot{{\boldsymbol{\theta}}}$的初始值为零时, 系统的输入、输出始终为零, 机器人无法准确地执行轨迹跟踪任务. 为避免该情况的发生, 引入受噪声驱动的关节角速度$ \hat{\dot{{\boldsymbol{\theta}}}}=\dot{{\boldsymbol{\theta}}}+{\boldsymbol{u}}$. 为便于下文的推导, 合并$ \hat{J}\dot{\hat{{\boldsymbol{\theta}}}}=\dot{{\boldsymbol{r}}}$, $G({\boldsymbol{\theta}}){\dot{\hat{{\boldsymbol{\theta}}}}=\kappa(\boldsymbol q){\dot{\boldsymbol{q}}}}$, 并改写为$ A\dot{\hat{{\boldsymbol{\theta}}}}={\dot{{{\boldsymbol{v}}}}}^{d}$, 其中, $A=\Bigg[\begin{aligned}\hat{J}\;\;\;\\G({\boldsymbol{\theta}})\end{aligned}\Bigg] ,$ ${{\boldsymbol{v}}}^{d}=\Bigg[\begin{aligned}\boldsymbol{r}^{d}\\{\tilde {\boldsymbol{q}}}\;\end{aligned}\Bigg] , {\boldsymbol{v}}^{d}$ 表示 ${\boldsymbol{v}}=\Bigg[\begin{aligned}\boldsymbol{r}\;\;\,\\ \boldsymbol{\overline{o}}({\boldsymbol{\theta}})\end{aligned}\Bigg]$的期望值.

    设计误差函数为$ E=\Vert {\boldsymbol{v}}-{\boldsymbol{v}}^{d}\Vert^2 $. 由梯度下降法可得, 其沿负梯度下降方向可以表示为

    $$ \dot{\hat{{\boldsymbol{\theta}}}}=-\eta\frac{\partial{E}}{\partial{\hat{{\boldsymbol{\theta}}}}}=\eta A^\mathrm{T}({{\boldsymbol{v}}}^{d}-{{\boldsymbol{v}}}) $$ (15)

    其中, $ \eta>0 $为设计参数. 为修正式(15)求解过程中的滞后误差问题, 添加补偿项$ {\boldsymbol{\varphi}}$可得

    $$ \begin{array}{*{20}{l}} \dot{\hat{{\boldsymbol{\theta}}}}=\eta A^\mathrm{T}({{\boldsymbol{v}}^{d}-{\boldsymbol{v}})+\boldsymbol{\varphi}}\end{array} $$ (16)

    对式(16)两边同乘$ A $, 可得

    $$ \begin{array}{*{20}{l}} A\dot{\hat{{\boldsymbol{\theta}}}}=\eta AA^\mathrm{T}({{\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A\boldsymbol{\varphi}}\end{array} $$ (17)

    当系统趋于稳态时, 应有$ {\boldsymbol{v}}^{d}-{\boldsymbol{v}}=0 $成立. 则式(17)可重写为

    $$ \begin{array}{*{20}{l}} A\dot{\hat{{\boldsymbol{\theta}}}}=A{\boldsymbol{\varphi}=\dot{{\boldsymbol{v}}}^{d}}\end{array} $$ (18)

    对于式(18), 考虑最小化函数(14a), 并应用最小二乘法可以得到$ {\boldsymbol{\varphi}=A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}$, 其中, $ A^{\dagger}=A^{\mathrm{T}}(AA^{\mathrm{T}})^{-1} $. 为避免接近奇异时求矩阵伪逆结果极大的问题, 设计具有辅助参数的递归过程为

    $$\left\{ \begin{aligned} &{\boldsymbol{\varphi}} =A^\mathrm{T}{\boldsymbol{\beta}}\\ &{\dot{{\boldsymbol{\beta}}}} =\mu(\dot{{{\boldsymbol{v}}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) \end{aligned} \right. $$ (19)

    其中, $ \mu>0 $为收敛系数, $ {\boldsymbol{\beta}}$为设计参数. 联立式(16)和式(19), 可得

    $$\qquad\qquad\;\; \left\{ \begin{aligned} &\dot{\hat{{\boldsymbol{\theta}}}} =P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (20{\rm{a}})\\ &\dot{\boldsymbol{\beta}} =\mu(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (20{\rm{b}})\end{aligned} \right. $$

    其中, $ P_{\boldsymbol{\ell}}(\cdot) $表示对机器人施加物理约束的投影函数, 具体地, $ \boldsymbol{\ell}=\{\dot{\hat{{\boldsymbol{\theta}}}} \in {\bf{R}}^{a}, \dot{{\boldsymbol{\theta}}}^{-} \le {\dot{\hat{{\boldsymbol{\theta}}}}} \le \dot{{\boldsymbol{\theta}}}^{+}\} $. 至此, 面向基于数据驱动的冗余机器人末端执行器位姿控制方案的神经动力学求解器为

    $$\qquad\qquad\;\;\left\{ \begin{aligned} &{\dot{\hat{{\boldsymbol{\theta}}}}} =P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({{\boldsymbol{v}}}^{d}-{\boldsymbol{v}})+A^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (21{\rm{a}})\\ &\dot{\boldsymbol{\beta}}=\mu(\dot{{{\boldsymbol{v}}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) &&\qquad (21{\rm{b}}) \\ &{\dot{\hat{J}}} =-\sigma(\hat{J}{\hat{\dot{{\boldsymbol{\theta}}}}}-{\dot{{\boldsymbol{r}}}){\hat{\dot{{\boldsymbol{\theta}}}}}^\mathrm{T}}&&\qquad (21{\rm{c}})\\ &{\hat{\dot{{\boldsymbol{\theta}}}}} ={\dot{{\boldsymbol{\theta}}}}+{\boldsymbol{u}},\quad 0 \le \left\|\boldsymbol{u}\right\| \le {\boldsymbol{u}}_{0}&&\qquad (21{\rm{d}}) \end{aligned} \right. $$

    通过神经动力学求解器(21)能够得到机器人执行任务时各关节角速度, 从而实现机器人末端执行器姿态的有效控制.

    本节对所提的基于数据驱动的冗余机器人末端执行器位姿控制方案的收敛性进行分析证明.

    定理 1. 当$ A^{\mathrm{T}}{\boldsymbol{\beta}}\in \boldsymbol{\ell} $时, 面向基于数据驱动的冗余机器人末端执行器位姿控制方案(式(14))的神经动力学求解器(21)的控制误差$ {\boldsymbol{\epsilon}}={\boldsymbol{v}}-{\boldsymbol{v}}^{d}$全局收敛至$ {{\boldsymbol{0}}} $.

    证明. 首先对含有存储状态信息$ {\boldsymbol{\beta}}$的式(21b)进行收敛性分析, 设计李雅普诺夫函数如下:

    $$ N_{1}=(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})/2 \geq 0 $$ (22)

    以参数$ {\boldsymbol{\beta}}$为决策变量, 式(22)关于时间求导, 可得

    $$ \begin{split} \dot{N}_{1}=\; &-(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}AA^{\mathrm{T}}\dot{\boldsymbol{\beta}}= \\ &\ \mu(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}AA^{\mathrm{T}}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta}) \leq \\ &-\eta \boldsymbol{\ell}_{\min}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})^{\mathrm{T}}(\dot{{\boldsymbol{v}}}^{d}-AA^{\mathrm{T}}\boldsymbol{\beta})=\\ &-\eta\boldsymbol{\ell}_{\min}N_{1}\leq 0 \end{split}$$ (23)

    其中, $ {\boldsymbol{\ell}_{\min}}$表示$ AA^{\mathrm{T}} $的最小特征值. 根据拉萨尔不变集原理[21], 当$ \dot{N}_{1} $= 0 时, 参数$ {\boldsymbol{\beta}}$指数收敛至$ (AA^{\mathrm{T}})^{-1}\dot{{{\boldsymbol{v}}}^{d}}$. 将参数$ {\boldsymbol{\beta}}$的稳态值代入(20a), 可得

    $$ \begin{split} \dot{\hat{{\boldsymbol{\theta}}}} =\; &P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A^{\mathrm{T}}(AA^{\mathrm{T}})^{-1}\dot{{\boldsymbol{v}}}^{d})= \\ &P_{\boldsymbol{\ell}}(\eta A^\mathrm{T}({\boldsymbol{v}}^{d}-{\boldsymbol{v}})+A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (24)

    控制误差的导数$ \dot{{{\boldsymbol{\epsilon}}}}$可以表示为

    $$ \begin{split} \dot{{{\boldsymbol{\epsilon}}}} =\; &A\dot{\hat{{\boldsymbol{\theta}}}}-\dot{{\boldsymbol{v}}}^{d}=\\ & AP_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-\dot{{\boldsymbol{v}}}^{d}=\\ &A(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (25)

    为分析控制误差$ {{\boldsymbol{\epsilon}}}$的稳定性, 设计李雅普诺夫函数为$ N_{2}={\boldsymbol{\epsilon}}^{\mathrm{T}}{\boldsymbol{\epsilon}}/2 $, 其时间导数可以表示为

    $$ \begin{split} \dot{N}_{2} =\; & {{\boldsymbol{\epsilon}}}^{\mathrm{T}}\dot{{\boldsymbol{\epsilon}}}= \\ & {\boldsymbol{\epsilon}}^{\mathrm{T}}A(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})=\\ &-\frac{1}{\eta}((-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})^{\mathrm{T}}\times \\ &(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (26)

    对于投影函数$ P_{\boldsymbol{\ell}} $, 假定其区间下(上)界为${c^{-}}\; ({c^{+}})$, 则当${c^{+}}\in{\boldsymbol{\ell}}$时, 应有$\Vert P_{\boldsymbol{\ell}}({c^{-}})-{c^{-}} \Vert \leq \Vert {c^{+}}-{c^{-}} \Vert$恒成立. 令${c^{-}}=-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d},{c^{+}}=A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}$, 则有以下关系成立

    $$ \begin{split} &\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})+\eta A^\mathrm{T}{\boldsymbol{\epsilon}}-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}\leq \Vert \eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}\Vert^{2} \end{split} $$ (27)

    不等式(27)左侧展开, 可得

    $$ \begin{split} &\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})+\eta A^\mathrm{T}{\boldsymbol{\epsilon}}-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}=\\ &\qquad\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}\;+\\ &\qquad\Vert \eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}\Vert^{2}-2((-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})^\mathrm{T}\;\times \\ &\qquad(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \\[-10pt] \end{split}$$ (28)

    进一步地, 对式(27)和式(28)微分, 可得

    $$ \begin{split} &\Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2}\leq\\ &\qquad2((-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d})^\mathrm{T}\;\times \\ &\qquad(P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}) \end{split}$$ (29)

    联立式(26)和式(29), 可得

    $$ \begin{array}{*{20}{l}} \dot{N}_{2} \leq -\frac{2}{\eta} \Vert P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})-A^{\dagger}\dot{{\boldsymbol{v}}}^{d}}\Vert^{2} \leq 0 \end{array} $$ (30)

    根据拉萨尔不变集原理, 当$ \dot{N}_{2} $ = 0时, 可以得到

    $$ \begin{array}{*{20}{l}} \begin{split} P_{\boldsymbol{\ell}}(-\eta A^\mathrm{T}{{\boldsymbol{\epsilon}}+A^{\dagger}\dot{{\boldsymbol{v}}}^{d})=A^{\dagger}\dot{{\boldsymbol{v}}}^{d}} \end{split} \end{array} $$ (31)

    当$ A^{\mathrm{T}}{\boldsymbol{\beta}}\in \boldsymbol{\ell} $时, 可得$ -\eta A^\mathrm{T}{\boldsymbol{\epsilon}}={\boldsymbol{0}}$, 因此$ {{\boldsymbol{\epsilon}}}={\boldsymbol{0}}$. 综上, 本文所提方案(式(14))的控制误差全局收敛至$ {{\boldsymbol{0}}}$.

    为验证本文所提方案对机器人雅可比矩阵估计的准确性及末端执行器位姿控制的有效性, 本节基于德国7自由度Franka Emika Panda 冗余机器人分别给出末端执行器姿态保持和姿态跟踪的两组仿真结果.

    值得指出的是, 仿真过程中的相关参数设置如下: 冗余机器人的初始关节角度被设置为$[0,-\pi/4, 0,-3\pi/4,0,\pi/2,3\pi/4]^\mathrm{T}$ rad; 收敛系数$ \mu=500 $; 设计参数$ \eta=500 $; 控制学习的收敛参数$\sigma=1\, 000$; 估计雅可比矩阵初始值为$ [-1, 1] $区间内的随机数; 设计参数$ {\boldsymbol{\beta}=[0, 0, 0, 0, 0, 0, 0, 0]^\mathrm{T}}$. 值得注意的是, 很难通过分析或者直观的设计步骤选择这些参数, 本文则是通过多次仿真确定它们的值.

    图1是一组机器人末端执行器展示姿态保持功能的仿真结果. 具体而言, 给定机器人末端执行器跟踪四叶草任务. 图1(a)描绘了机器人执行跟踪任务的整体运动轨迹, 绿色曲线为任务过程中末端执行器的姿态变化, 红色曲线为末端执行器跟踪预定的四叶草图案. 图1(b)和图1(c)分别展示了机器人在执行任务过程中关节角度、关节角速度的变化曲线. 可以看出曲线变化平滑, 机器人关节角度、关节角速度均在合理的范围内. 图1(d)展示了机器人在执行任务过程中估计的雅可比矩阵与实际的雅可比矩阵误差. 随着任务时间的持续, 其误差迅速小于$ 10^{-3} $, 证明本文所提方案(14)能够有效地估计雅可比矩阵, 从而实现机器人的准确控制; 图1(e)给出了机器人任务过程中的四元数误差变化趋势, 可以看出四元数误差小于$ 10^{-5} $, 证明机器人实现了末端执行器姿态保持的功能; 图1(f)给出了机器人在执行任务过程中末端执行器的空间位置误差, 沿三个坐标轴的误差均小于$ 10^{-4} $ m.

    图 1  采用所提方案(14)实现冗余机器人末端执行器位置跟踪与姿态保持的仿真结果
    Fig. 1  Simulation results of the redundant manipulator using the proposed scheme (14) to achieve position tracking and orientation maintenance

    图2为一组机器人末端执行器展示姿态跟踪功能的仿真结果. 具体而言, 机器人末端执行器沿着圆锥体表面进行打磨、焊接等任务. 值得指出的是, 在任务执行期间, 机器人末端执行器的方向需要一直保持在圆锥体表面的法线方向. 不同于图1中姿态保持的仿真结果, 图2(a)展示了机器人执行跟踪任务的整体运动轨迹, 绿色曲线描绘了机器人末端执行器位姿, 可见末端执行器位姿是不断变化的. 图2(b)和图2(c)中关节角度和关节角速度的变化曲线表明了机器人执行过程中关节运行平滑. 图2(d)、图2(e)和图2(f)展示了机器人任务过程中雅可比矩阵误差、冗余机器人末端执行器的姿态与位置误差变化趋势, 证明了由所提方案(14)驱动的机器人在未知机器人结构信息情况下成功地执行了位姿跟踪任务. 此外, 为更好地说明本方案对末端执行器位姿的控制过程, 考虑图2的应用场景, 图3给出了基于CoppeliaSim仿真平台所提方案(14)与文献[22]方案的对比仿真实验. CoppeliaSim是一款功能强大的动力学仿真软件, 它可以根据物体的物理特性计算运动、旋转和碰撞, 因此许多研究应用CoppeliaSim以快速验证算法. 对比仿真实验中, 由所提方案(14)驱动的机器人在执行任务的过程中, 其末端执行器的方向始终保持在圆锥体表面的法线方向. 相比之下, 由文献[22]方案驱动的机器人在执行过程中因无法控制其末端执行器方向而导致任务失败. 由此可见, 机器人末端执行器的姿态跟踪在一些要求姿态不断变化的应用场景中具备重要的作用.

    图 2  采用所提方案(14)实现冗余机器人位置与姿态跟踪的仿真结果
    Fig. 2  Simulation results of the redundant manipulator using the proposed scheme (14) to achieve position and orientation tracking
    图 3  基于CoppeliaSim平台冗余机器人实现位置与姿态跟踪的对比结果
    Fig. 3  Comparison results of the redundant manipulator achieving position and orientation tracking based on CoppeliaSim platform

    此外, 表2给出了所提方案(14)与其他5种方案的对比. 具体而言, 所提方案(14)与对比方案使用同样的机器人执行相同的任务, 即图2中的应用场景, 同时选取方案层级、末端执行器控制模式、结构信息是否已知以及跟踪误差等多个指标对方案进行了评价. 值得指出的是, 每个方案参数的选择都基于其对应的文献. 从表2可看出, 文献[13]为基于数据驱动的速度层控制方案, 该方案能够实现末端执行器姿态保持的功能; 文献[22]和文献[23]为加速度层的控制方案, 需要已知机器人的模型信息; 文献[24]和文献[25]为速度层的控制方案, 同样需要已知机器人的模型信息. 此外, 从位置跟踪误差方面来看, 每个方案的跟踪误差均维持在$ 10^{-3} $ m数量级. 在姿态跟踪误差方面, 多数方案不支持姿态跟踪, 文献[13]和文献[25]的方案的跟踪精度高于所提方案(14). 然而, 文献[13]方案仅具备简单的姿态保持功能, 文献[25]方案则无法应用于结构信息不准确或未知的机器人. 综上, 本文所提方案(14)能够有效地控制结构信息未知的机器人进行轨迹跟踪任务, 在对末端执行器姿态有约束的情况下具有一定优势.

    表 2  冗余机器人不同轨迹跟踪控制方案对比
    Table 2  Comparison of different trajectory tracking control schemes for redundant manipulators
    方案层级末端控制结构信息位置误差(m)姿态误差
    本文速度层位姿未知1.653 × 10−33.956 × 10−3
    文献[13]速度层姿态保持未知1.056 × 10−34.635 × 10−4
    文献[22]加速度层位置已知3.312 × 10−3
    文献[23]加速度层位置已知1.423 × 10−3
    文献[24]速度层位置已知2.734 × 10−3
    文献[25]速度层位姿已知1.374 × 10−33.461 × 10−4
    下载: 导出CSV 
    | 显示表格

    本文针对模型未知的冗余机器人提出了一种基于数据驱动的末端执行器位姿控制方案. 该方案从机器人运动学出发, 用四元数表示末端执行器的姿态, 进而实现了对末端执行器位姿控制. 通过引入数据驱动技术, 本文所提方案能够有效地控制模型未知的冗余机器人, 且估计的雅可比矩阵能够收敛至真实值. 此外, 设计了一种神经动力学方案用于本方案的求解. 理论分析证明了所提求解器的收敛性, 方案对比和仿真实验体现了所提方案对机器人末端执行器控制的优越性和有效性.

  • 图  1  采用所提方案(14)实现冗余机器人末端执行器位置跟踪与姿态保持的仿真结果

    Fig.  1  Simulation results of the redundant manipulator using the proposed scheme (14) to achieve position tracking and orientation maintenance

    图  2  采用所提方案(14)实现冗余机器人位置与姿态跟踪的仿真结果

    Fig.  2  Simulation results of the redundant manipulator using the proposed scheme (14) to achieve position and orientation tracking

    图  3  基于CoppeliaSim平台冗余机器人实现位置与姿态跟踪的对比结果

    Fig.  3  Comparison results of the redundant manipulator achieving position and orientation tracking based on CoppeliaSim platform

    表  1  所提冗余机器人控制方案的符号含义

    Table  1  Definitions of variables of the proposed scheme for redundant manipulators

    符号含义
    $ {{\boldsymbol{\theta}}} \in {\bf{R}}^a $机器人关节角向量
    $ \dot{\boldsymbol{\theta}}\in {\bf{R}}^a $机器人关节角速度向量
    $ \dot{\boldsymbol{\theta}}^{-}(\dot{\boldsymbol{\theta}}^{+}) $关节角速度的下界(上界)
    $ {\boldsymbol r}\in {\bf{R}}^b $末端执行器的位置向量
    $ \boldsymbol{r}^{d}\in {\bf{R}}^b $末端执行器的期望位置向量
    $ \dot{\boldsymbol r}\in {\bf{R}}^b $末端执行器的速度向量
    $ \dot{\hat{\boldsymbol r}}\in {\bf{R}}^b $末端执行器的估计速度向量
    $ f(\cdot): {\bf{R}}^a \rightarrow {\bf{R}}^b $机器人非线性前向运动学映射
    $ J=\dfrac{\partial f({{\boldsymbol{\theta}}})}{\partial {{\boldsymbol{\theta}}}}\in {\bf{R}}^{b\times a} $机器人雅可比矩阵
    $ \hat{J}\in {\bf{R}}^{b\times a} $机器人估计雅可比矩阵
    $ {\dot{\hat{J}}}\in {\bf{R}}^{b\times a} $机器人估计雅可比矩阵的导数
    $ M(\boldsymbol \theta)\in {\bf{R}}^{3\times 3} $末端执行器的方向旋转矩阵
    $ {\boldsymbol q}_{E}(\boldsymbol \theta)\in {\bf{R}}^{4} $末端执行器的方向四元数
    $ \boldsymbol{\overline{o}}(\boldsymbol \theta)\in {\bf{R}}^{5} $末端执行器的方向向量
    $ \tilde{\boldsymbol q}\in {\bf{R}}^{5} $末端执行器的期望方向向量
    $ H({\boldsymbol \theta})=\dfrac{\partial{\boldsymbol q}_{E}(\boldsymbol \theta)}{\partial{\boldsymbol \theta}}\in {\bf{R}}^{4\times a} $$ {\boldsymbol q}_{E} $ 的雅可比矩阵
    $ G({\boldsymbol{\theta}})=\dfrac{\partial{\boldsymbol{\overline{o}}({\boldsymbol{\theta}}})}{\partial{{\boldsymbol{\theta}}}}\in {\bf{R}}^{5\times a} $$ \boldsymbol{\overline{o}}({\boldsymbol{\theta}}) $的雅可比矩阵
    $ \kappa(\boldsymbol q)=\dfrac{\partial{{\tilde{\boldsymbol q}}}}{\partial{\boldsymbol q}}\in {\bf{R}}^{5\times 4} $$ \tilde{\boldsymbol q} $ 的雅可比矩阵
    $ \boldsymbol{u}\in {\bf{R}}^a $方差为极小值的独立同分布零均值随机噪声
    ${\boldsymbol{u} }_{0}\in {\bf{R} }^a$$ \boldsymbol{u} $的上界
    $ \hat{\dot{{\boldsymbol{\theta}}}}\in {\bf{R}}^a $受噪声驱动的关节角速度
    $ \Vert \cdot \Vert_2 $向量的二范数
    $ \mathrm{tr(\cdot)} $矩阵的迹
    下载: 导出CSV

    表  2  冗余机器人不同轨迹跟踪控制方案对比

    Table  2  Comparison of different trajectory tracking control schemes for redundant manipulators

    方案层级末端控制结构信息位置误差(m)姿态误差
    本文速度层位姿未知1.653 × 10−33.956 × 10−3
    文献[13]速度层姿态保持未知1.056 × 10−34.635 × 10−4
    文献[22]加速度层位置已知3.312 × 10−3
    文献[23]加速度层位置已知1.423 × 10−3
    文献[24]速度层位置已知2.734 × 10−3
    文献[25]速度层位姿已知1.374 × 10−33.461 × 10−4
    下载: 导出CSV
  • [1] 胡静. 冗余自由度机器人的路径规划研究[硕士学位论文], 东南大学, 中国, 2017.

    Hu Jing. Research on Path Planning of Redundant Robot [Master thesis], Southeast University, China, 2017.
    [2] 李亚昕, 王国磊, 张剑辉, 田鑫亮, 安静, 陈恳. 基于碰撞反馈的冗余机器人避障规划算法. 清华大学学报(自然科学版), 2022, 62(03): 408-415 doi: 10.16511/j.cnki.qhdxxb.2021.25.022

    Li Ya-Xin, Wang Guo-Lei, Zhang Jian-Hui, Tian Xin-Liang, An Jing, Chen Ken. Obstacle avoidance alorithm for redundant robots based on collision feedback. Journal of Tsinghua University(Science and Technology), 2022, 62(03): 408-415 doi: 10.16511/j.cnki.qhdxxb.2021.25.022
    [3] 刘美娇. 空间超冗余四足爬行机器人轨迹规划方法研究[博士学位论文], 中国科学院大学, 中国, 2023.

    Liu Mei-Jiao. Research on Trajectory Planning Method of Spatial Hyper-Redundant Quadruped Crawling Robot [Ph.D. dissertation], University of Chinese Academy of Sciences, China, 2023.
    [4] 梁旭, 苏婷婷, 侯增广, 刘圣达, 章杰, 何广平. 基于变阻抗控制的冗余驱动并联机器人多目标内力优化. 自动化学报, 2023, 49(5): 1099-1115 doi: 10.16383/j.aas.c210963

    Liang Xu, Su Ting-Ting, Hou Zeng-Guang, Liu Sheng-Da, Zhang Jie, He Guang-Ping. A multi-objective internal preload optimization method of redundantly actuated parallel robots based on variable impedance control. Acta Automatica Sinica, 2023, 49(5): 1099-1115 doi: 10.16383/j.aas.c210963
    [5] 邝禹聪. 面向实验教学的六自由度机器人开发[硕士学位论文], 华南理工大学, 中国, 2017.

    Kuang Yu-Cong. Develpment of 6-DOF Robot for Experiment Teaching [Master thesis], South China University of Technology, China, 2017.
    [6] Xu Zhi-Hao, Zhou Xue-Feng, Wu Hong-Min, Li Xiao-Xiao, Li Shuai. Motion planning of manipulators for simultaneous obstacle avoidance and target tracking: An RNN approach with guaranteed performance. IEEE Transactions on Industrial Electronics, 2022, 69(4): 3887-3897 doi: 10.1109/TIE.2021.3073305
    [7] Thakar Shantanu, Rajendran Pradeep, Kabir Ariyan, Gupta Satyandra. Manipulator motion planning for part pickup and transport operations from a moving base. IEEE Transactions on Automation Science and Engineering, 2022, 19(1): 191-206 doi: 10.1109/TASE.2020.3020050
    [8] Xie Zheng-Tai, Jin Long, Luo Xin, Sun Zhong-Bo, Liu Mei. RNN for repetitive motion generation of redundant robot manipulators: An orthogonal projection-based scheme. IEEE Transactions on Neural Networks and Learning Systems, 2022 33(2): 615-628 doi: 10.1109/TNNLS.2020.3028304
    [9] 李中奇, 周靓, 杨辉. 高速动车组数据驱动无模型自适应控制方法. 自动化学报, 2023, 49(2): 437-447 doi: 10.16383/j.aas.c211068

    Li Zhong-Qi, Zhou Liang, Yang Hui. Data-driven model-free adaptive control method for high-speed electric multiple unit. Acta Automatica Sinica, 2023, 49(2): 437-447 doi: 10.16383/j.aas.c211068
    [10] Lee Uichin, Jung Gyuwon, Ma Eun-Yeol, Kim Jin-San, Kim Heepyung, Alikhanov Jumabek, Noh Youngtae, Kim Heeyoung. Toward data-driven digital therapeutics analytics: Literature review and research directions. IEEE/CAA Journal of Automatica Sinica, 2023, 10(1): 42-66 doi: 10.1109/JAS.2023.123015
    [11] 梁正平, 黄锡均, 李燊钿, 王喜瑜, 朱泽轩. 基于剪枝堆栈泛化的离线数据驱动进化优化. 自动化学报, 2023, 49(6): 1306-1325 doi: 10.16383/j.aas.c220387

    Liang Zheng-Ping, Huang Xi-Jun, Li Shen-Tian, Wang Xi-Yu, Zhu Ze-Xuan. Offline data driven evolutionary optimization based on pruning stacked generalization. Acta Automatica Sinica, 2023, 49(6): 1306-1325 doi: 10.16383/j.aas.c220387
    [12] 姜艺, 范家璐, 柴天佑. 数据驱动的保证收敛速率最优输出调节. 自动化学报, 2022, 48(4): 980-991 doi: 10.16383/j.aas.c200932

    Jiang Yi, Fan Jia-Lu, Chai Tian-You. Data-driven optimal output regulation with assured convergence rate. Acta Automatica Sinica, 2022, 48(4): 980-991 doi: 10.16383/j.aas.c200932
    [13] Fan Jia-Liang, Jin Long, Xie Zheng-Tai, Li Shuai, Zheng Yu. Data-driven motion-force control scheme for redundant manipulators: A kinematic perspective. IEEE Transactions on Industrial Informatics, 2022, 18(8): 5338-5347 doi: 10.1109/TII.2021.3125449
    [14] Xie Zheng-Tai, Jin Long, Luo Xin, Hu Bin, Li Shuai. An acceleration-level data-driven repetitive motion planning scheme for kinematic control of robots with unknown structure. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2022, 52(9): 5679-5691 doi: 10.1109/TSMC.2021.3129794
    [15] Jin Long, Zheng Xin. Neural dynamics for distributed collaborative control of manipulators with time delays. IEEE/CAA Journal of Automatica Sinica, 2022, 9(5): 854-863 doi: 10.1109/JAS.2022.105446
    [16] Ma Bo-Yu, Xie Zong-Wu, Zhan Bo-Wen, Jiang Zai-Nan, Liu Yang, Liu Hong. Actual shape-based obstacle avoidance synthesized by velocity-acceleration minimization for redundant manipulators: An optimization perspective. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2023: 1-15 doi: 10.1109/TSMC.2023.3283266, to be published
    [17] Zhang Zhi-Jun, He Hao-Tian, Deng Xian-Zhi. An FPGA-implemented antinoise fuzzy recurrent neural network for motion planning of redundant robot manipulators. IEEE Transactions on Neural Networks and Learning Systems, 2023: 1-13 doi: 10.1109/TNNLS.2023.3253801, to be published
    [18] Li Shuai, Shao Zi-Li, Guan Yong. A dynamic neural network approach for efficient control of manipulators. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2019, 49(5): 932-941 doi: 10.1109/TSMC.2017.2690460
    [19] Guo Kun-Lin, Su Hang, Yang Cheng-Guang. A small opening workspace control strategy for redundant manipulator based on RCM method. IEEE Transactions on Control Systems Technology, 2022, 30(6): 2717-2725 doi: 10.1109/TCST.2022.3145645
    [20] 张振国, 毛建旭, 谭浩然, 王耀南, 张雪波, 江一鸣. 重大装备制造多机器人任务分配与运动规划技术研究综述. 自动化学报, 2024, 50(1): 21−41

    Zhang Zhen-Guo, Mao Jian-Xu, Tan Hao-Ran, Wang Yao-Nan, Zhang Xue-Bo, Jiang Yi-Ming. A review of task allocation and motion planning for multi-robot in major equipment manufacturing. Acta Automatica Sinica, 2024, 50(1): 21−41
    [21] Khail H. Nonlinear Systems 3rd Edition. Englewood Cliffs: Prentice-Hall, 2001.
    [22] Yan Jing-Kun, Jin Long, Yuan Zhan-Ting, Liu Zhi-Yi. RNN for receding horizon control of redundant robot manipulators. IEEE Transactions on Industrial Electronics, 2022, 69(2): 1608-1619 doi: 10.1109/TIE.2021.3062257
    [23] Zhang Zhi-Jun, Chen Si-Yuan, Zhu Xu-Peng, Yan Zi-Yi. Two hybrid end-effector posture-maintaining and obstacle-limits avoidance schemes for redundant robot manipulators. IEEE Transactions on Industrial Informatics, 2020, 16(2): 754-763 doi: 10.1109/TII.2019.2922694
    [24] Jin Long, Zhang Yu-Nong. G2-type SRMPC scheme for synchronous manipulation of two redundant robot arms. IEEE Transactions on Cybernetics, 2015, 45(2): 153-164 doi: 10.1109/TCYB.2014.2321390
    [25] Liu M, Shang M S. Orientation tracking incorporated multi-criteria control for redundant manipulators with dynamic neural network. IEEE Transactions on Industrial Electronics, 2014, 71(4): 3801−3810
  • 期刊类型引用(2)

    1. 马靖雯,张廷丰,陆明超. 基于数据驱动的跨声速风洞控制方法研究. 辽宁工业大学学报(自然科学版). 2024(05): 298-302+309 . 百度学术
    2. 曾旭翔,孔颖. 求解时变二次规划的自适应参数归零神经网络. 浙江科技大学学报. 2024(05): 384-393 . 百度学术

    其他类型引用(3)

  • 加载中
图(3) / 表(2)
计量
  • 文章访问数:  3916
  • HTML全文浏览量:  288
  • PDF下载量:  303
  • 被引次数: 5
出版历程
  • 收稿日期:  2023-05-11
  • 录用日期:  2023-08-29
  • 网络出版日期:  2023-12-27
  • 刊出日期:  2024-03-29

目录

/

返回文章
返回