2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

空间控制技术发展与展望

袁利 姜甜甜 魏春岭 杨孟飞

曾超, 杨辰光, 李强, 戴诗陆. 人-机器人技能传递研究进展. 自动化学报, 2019, 45(10): 1813-1828. doi: 10.16383/j.aas.c180397
引用本文: 袁利, 姜甜甜, 魏春岭, 杨孟飞. 空间控制技术发展与展望. 自动化学报, 2023, 49(3): 476−493 doi: 10.16383/j.aas.c220792
ZENG Chao, YANG Chen-Guang, LI Qiang, DAI Shi-Lu. Research Progress on Human-robot Skill Transfer. ACTA AUTOMATICA SINICA, 2019, 45(10): 1813-1828. doi: 10.16383/j.aas.c180397
Citation: Yuan Li, Jiang Tian-Tian, Wei Chun-Ling, Yang Meng-Fei. Advances and perspectives of space control technology. Acta Automatica Sinica, 2023, 49(3): 476−493 doi: 10.16383/j.aas.c220792

空间控制技术发展与展望

doi: 10.16383/j.aas.c220792
基金项目: 国家自然科学基金(U21B6001)资助
详细信息
    作者简介:

    袁利:北京控制工程研究所研究员. 主要研究方向为航天器自主控制和鲁棒容错控制. E-mail: yuanli@spacechina.com

    姜甜甜:北京控制工程研究所高级工程师. 主要研究方向为航天器控制和非线性控制. 本文通信作者. E-mail: jiangtt@amss.ac.cn

    魏春岭:北京控制工程研究所研究员. 主要研究方向为估计理论, 控制理论和航天器自主导航. E-mail: clwei502@163.com

    杨孟飞:中国空间技术研究院研究员. 主要研究方向为空间飞行器系统总体, 控制系统, 控制计算机和可信软件. E-mail: yangmf@bice.org.cn

Advances and Perspectives of Space Control Technology

Funds: Supported by National Natural Science Foundation of China (U21B6001)
More Information
    Author Bio:

    YUAN Li Professor at Beijing Institute of Control Engineering. His research interest covers spacecraft autonomous control and robust fault-tolerant control

    JIANG Tian-Tian Senior engineer at Beijing Institute of Control Engineering. Her research interest covers spacecraft control and nonlinear control. Corresponding author of this paper

    WEI Chun-Ling Professor at Beijing Institute of Control Engineering. His research interest covers estimation theory, control theory, and spacecraft autonomous navigation

    YANG Meng-Fei Professor at China Academy of Space Technology. His research interest covers spacecraft system, control system, control computer, and trustworthy software

  • 摘要: 控制是航天器在空间环境下自主完成复杂任务的关键技术. 首先梳理了中国空间控制技术过去50多年来的发展成果, 总结划分为航天器姿态控制、姿态轨道控制、“感知−决策−执行” (Perception-decision-action, PDA)自主控制三个方面, 并在综述了各方面主要进展的基础上, 围绕超大结构航天器姿态轨道控制、轨道空间博弈控制、网络化航天器集群控制、地外探测智能无人系统控制、跨域航天器自主控制、在轨建造与维护(On-orbit servicing, assembly, and manufacturing, OSAM)控制6个技术方向, 提出面临的挑战和需要重点关注的基础性问题, 为空间控制技术未来的发展提供借鉴和参考.
  • 中国工程院近期在《走向新一代智能制造》一文中指出:新一代智能制造的技术机理是“人–信息–物理系统(Human-cyber-physical-systems, HCPS)”, 并指出新一代HCPS具备两个显著特征: 1)人将部分认知转移给信息系统, 因而系统具有“认知、学习”能力; 2)通过“人在回路(Humanin-the-loop)”的混合增强智能, 可极大地优化制造系统的性能[1].

    人–信息–机器人融合系统(Human-cyberrobot-systems, HCRS)是HCPS在机器人领域中的具体应用.与之相应, 基于机器人的制造系统需要适应新一代智能制造的发展趋势.传统人机隔离生产方式刚性作业, 无法完成复杂多变生产任务, 也逐渐无法满足产品多品种、短周期、少批量、个性化的需求.而在HCRS中, 新型人机共融作业模式将人的优势(智慧性、灵巧性)与机器人优势(高速率、高精度、顺从性)高效结合, 实现人、信息与机器人系统的深度融合. HCRS具备HCPS的典型特征, 突出了人的中心地位, 将人的特点(包括灵巧性和应变能力)纳入到系统之中, 增强系统的智能程度, 可适应新一代智能制造过程中柔性、高效等要求.

    其中, 人–机器人技能传递(Human-robot skill transfer, HRST)是HCRS中的关键之一, 是实现人与机器人的运动信息深度融合的基础. HRST的研究始于上个世纪80年代, 最近10年得到了很大发展, 目前是国际机器人领域中研究热点之一. HRST在不同文献中有不同称谓, 如示教编程(Programming by demonstration, PbD)、机器人示教学习(Learning from demonstration, LfD)、模仿学习(Imitation learning)等, 但其本质相同:人将自己的技能做通用化描述后传递给机器人, 进而实现机器人的运动编程, 可代替传统的机器人编程方式.机器人除了直接模仿人的技能外, 还可根据任务情况对所学技能进行泛化、拓展. HRST突出了人的因素在HCRS中关键作用, 可实现人机各自作业优势的结合, 适应人机共融协作要求.相比传统方式, HRST有诸多优势(见表 1).

    表 1  HRST与传统方式的比较
    Table 1  Comparation between HRST and the conventional methods
    传统编程方式 人机技能传递
    交互方式 人机隔离 共融交互
    交互感受 编程不直观 自然、直观
    编程人员 需要专业工程师 不依赖专业人员
    机器人平台 针对具体机器人平台 技能不受限于特定平台
    工作空间 受限于作业环境 受限程度小
    任务情况 任务具体、固定 适应于不同任务, 可优化
    编程效率 效率低下, 耗时多 效率较高, 便于重配置
    下载: 导出CSV 
    | 显示表格

    人–机器人技能传递以交互的方式进行.一方面, 人根据任务情况自主调节自身的运动特征, 如根据与环境交互情况而自适应地调节肢体位置, 刚度/力; 另一方面, 机器人的运动响应可作为反馈信息帮助示教者对其运动进行修正与完善.从机器人角度来看, 不止是简单地模仿人的点对点(Point-topoint)运动轨迹, 而是具有“学习、推理”能力, 能够对所学“知识”进行泛化, 如具有目标拓展、运动识别、安全避障等, 以满足不同的任务要求.人机技能传递侧重强调人的因素在提高机器人技能方面的作用, 因此其主要的关注点是如何对人和机器人的运动进行通用化的描述.

    本文针对人机技能传递展开讨论, 主要关注机械臂的技能示教学习.文章组织如下:第1节介绍机器人通用的技能学习过程; 第2节阐述实现人机技能传递的主要方式; 第3节总结几种主要的技能建模方法; 第4节介绍机械臂仿人控制问题; 第5节给出目前研究不足与未来发展方向; 第6节总结全文.

    技能从人到机器人传递一般包括三个基本步骤: 1)示教阶段(Demonstration); 2)模型学习阶段(Model learning); 3)任务复现阶段(Task reproduction).以写字为例, 技能传递过程总体框图如图 1所示.

    图 1  人机技能传递一般过程框图
    Fig. 1  The procedure of human-robot skill transfer

    1) 示教阶段:在这一阶段, 示教者向机器人演示如何操作任务.这个过程可以是在线的, 也可以是离线的.在线是指在示教过程中, 机器人也跟随示教者操作任务, 记录下机器人在此过程中的运动信息的变化(包括位置、速度、力等信息)[2], 在此过程还可记录示教者肢体的刚度变化信息[3-4]; 离线示教是指在示教阶段, 只有示教者完成任务示范并记录下其运动状态变化, 而机器人在此阶段并不需要跟随示教者运动[5].

    2) 模型学习阶段:在示教完成后, 获得了包含相应技能信息的数据集合.模型学习的主要作用是根据任务特点对示教的技能特征进行建模.利用示教数据拟合模型, 从而估计出模型参数.在此阶段, 除了需要考虑对运动轨迹表征(Representing), 还往往需要考虑多次示教轨迹对齐(Alignment)[6]、复杂技能的分割(Segmentation)[7]和运动拓展(Generalization)[8]等问题.

    3) 任务复现阶段:在获得技能特征之后, 可将学习出的运动策略控制变量映射到机械臂的控制器中, 机器人可复现出示教者的技能, 甚至对其进行泛化, 以完成相应的作业任务.任务复现阶段需要选择合适的机械臂控制模式.控制模式可以是多样的, 根据任务要求可选择位姿控制、速度控制、力/力矩控制等.特别地, 对于与环境有敏感接触交互力的任务, 有效控制接触力是成功复现及泛化作业任务的关键因素.

    人机交互接口设计(Interface design)是实现技能从人向机器人传递的首要环节, 决定了人通过何种方式对机器人进行示教.根据不同的交互接口, 常见的人机技能传递方式可归纳为以下三种形式:基于视觉的(Vision-based); 基于遥操作(Teleoperation-based); 人机物理接触交互(Physical human-robot interaction, pHRI).

    1) 基于视觉的人机技能传递[9-10].视觉输入是比较常用的运动示教方式.其基本原理是首先通过视觉设备(如三维体感摄影机Kinect、运动捕捉系统Vicon等)捕捉并跟踪人体运动信息并记录下来, 随后用机器学习算法对运动状态数据建模, 得到运动的通用化描述.最后在复现环节中, 根据具体任务特点, 泛化生成满足任务要求的控制指令.根据捕捉信息的特点又可将这种方法分为以下几种基本方法:利用Kinect相机[11]捕获示教者在运动时候手臂的关节角度, 再将人的关节角度映射到机器人的关节空间(Joint-space)[12-13], 如图 2(a)所示; 利用相机并结合光标(Optical marker)的方式, 光标可佩戴在示教者的手臂末端位置, 相机记录下手臂末端在示教过程中的运动轨迹, 进而将其映射到机器人的任务空间(Task-space)[5-6, 9], 如图 2(b)所示; 此外, 机器人还可以通过基于视频演示的方法学习到人的技能[14-15].

    图 2  基于视觉方式的技能传递[19]
    Fig. 2  Vision-based human-robot skill transfer interface[19]

    基于视觉的人机交互接口的优点是方便人的示教, 由于人的肢体不与机器人直接接触, 因而示教者的肢体运动可不受其限制.缺点是这种示教方式只能获取运动信息, 无法捕捉到人机接触情况下示教者的动作信息.另外, 由于示教者不能直接感受到交互力, 导致示教过程缺乏浸入感.

    2) 基于遥操作方式的人机技能传递[16].通过遥操作的方式, 示教者可以通过主端(Master)设备操作从端(Slave)机器人.示教过程与基于视觉的方式很类似, 不同之处在于这种方式不再直接记录示教者的肢体的运动信息, 而是记录主端操作杆或者从端机器人的运动状态.由于操作杆与机器人的物理结构往往不同, 因而在示教过程中需要将二者的工作空间(Work space)进行匹配[17].目前, 遥操作已经被成功应用到了机器人辅助手术系统中, 如达芬奇手术机器人.

    基于遥操作的示教方式的优点是可以用在远程操控场景与不适合示教者和机器人直接接触的工作场景中, 如核电辐射场所、对大型机器设备的示教编程等.其缺点是遥操作系统往往存在延时问题.另外, 震颤现象也是影响遥操作示教性能的重要因素之一[18].

    图 3  基于遥操作方式的人机技能传递[16]
    Fig. 3  Teleoperation-based human-robot skill transfer[16]

    3) 基于物理交互方式的技能传递[19-20].所谓的物理交互是指示教者直接与机器人接触, 在机器人的示教模式下, 直接通过与机械臂的物理接触交互完成作业任务.该方式主要针对柔性协作机器人, 其机械臂具有一定柔性特性, 可以安全地与人协同作业, 一般提供了接口方便对其进行快速运动示教编程, 如图 4所示.

    图 4  基于物理交互方式的人机技能示教[24]
    Fig. 4  Physical interaction for human-robot skill transfer[24]

    其中, 双臂示教是一种较为特别的物理交互示教方法[21-23], 即利用双臂机器人的特点, 以其中一机械臂为主端, 以另外一机械臂为从端.示教者操作主端引导从端机械臂完成作业任务, 如图 5.这种示教方式可以使得示教者直接操作机械臂, 有物理交互的特点.为了提高示教的质量, 可以在双臂示教系统中的主从两端引入基于虚拟阻抗的触觉反馈机制, 以提高人机交互的临场感[4].

    图 5  双臂示教方式[25]
    Fig. 5  Demonstration based on dual arm teaching[25]

    技能建模中需要解决的基本问题是如何实现对非线性运动(Nonlinear movement)的一般描述.任何复杂的行为都可以由简单的线性子系统的加权叠加来描述.可用以下公式来描述[26]:

    $ \begin{equation} \dot{x} = \sum\limits_{i = 1}^{K} h_{i}(x, t)(A_{i}x+ b_{i}) \end{equation} $

    (1)

    其中, $ x $代表动作信息的特征变量, 如位置、速度、力等; $ h_{i} $表示各个线性子系统的加权系数, 而子系统$ f_{i} = A_{i}x+ b_{i} $由系数$ A_{i} $和$ b_{i} $确定.

    由式(1)可知, 技能建模的关键在于确定上述的加权系数、估计子系统的参数以及选择合适的特征量.常见的基本建模方法包括动态运动原语(Dynamical movement primitives, DMP)、高斯混合模型(Gaussian mixture model, GMM)和隐马尔可夫模型(Hidden Markov model, HMM).

    这几种模型的主要区别在于看待问题的角度不同: DMP把技能特征看作是运动原语(Primitive), 用示教数据拟合DMP模型可得到运动原语序列; 后两种是从概率角度看待技能示教与传递, 即把技能的各个特征与模型的不同状态(State)相对应, 用示教数据(对应概率语境中的观察数据, Observed data)拟合GMM或HMM模型.因此, 学习出模型的状态信息也就得到了相应的技能特征信息.

    3.2.1   DMP基本数学描述

    DMP模型[27-28]是由正则系统驱动的弹簧–阻尼系统来表示运动轨迹.原始DMP模型表示为[29-30]:

    $ \begin{align} & \tau \dot{v} = \underbrace{K(x_g-x)-Dv}_{\text{线性部分}}+\underbrace{(x_g-x_0)f(s)}_{\text{非线性项}} \end{align} $

    (2)

    $ \begin{align} & \tau \dot{x} = v \end{align} $

    (3)

    $ \begin{align} & \tau \dot{s} = -\alpha_1 s \end{align} $

    (4)

    其中, $ K $, $ D $和$ \alpha_1 $是模型参数; $ x $和$ v $分别表示运动位置与速度; $ x_{0} $和$ x_{g} $表示运动轨迹的初始与目标. $ \tau $代表系统的时间常数, 决定系统的演化时间; $ s $代表系统的相位(Phase), 从1均匀收敛到0.

    DMP模型本质上是一个二阶非线性方程, 包含两个部分:线性部分和非线性部分.以图 6(a)为例, 线性部分构成运动轨迹的基本形状(实线表示), 保证收敛到目标值; 非线性部分可将其调节成不同形状(虚线表示), 在保证形状相似性的前提下, 得到丰富的运动轨迹. DMP分为离散型(Discrete)和节律型(Rhythmic), 区别在于非线性项的核函数不同:前者为高斯核; 后者为余弦函数.这两种DMP分别用于学习点到点(Point-to-point)运动和具有周期性规律的运动[31].

    图 6  DMP模型表征运动轨迹示例
    Fig. 6  Examples of DMP modelling: converging to goals

    可以用不同的非线性拟合方法逼近DMP模型中非线性项, 常用方法有局部加权回归算法(Locally weighted regression, LWR)和局部加权投影回归(Locally weighted projection regression, LWPR).通过DMP描述运动技能的的一个优点在于它的演化并不直接依赖于时间, 而是基于中间变量(即相位)的变化, 方便对运动轨迹进行拓展调节[28, 31].另外, 可通过对公式中初始位置、末端位置以及时间常数的调节来实现对运动轨迹在时间上或空间上的拓展与泛化(见图 6).

    3.2.2   基于DMP的技能传递

    目前, 学者在原始的DMP模型的基础上已经发展出了多个版本的DMP模型, 并应用于机器人技能示教学习. Ude等[32]不直接利用原有模型参数作为控制策略, 而提出了查询子(Queries)的概念来同时考虑任务参数与模型参数, 并可根据任务变化情况对其进行调节, 该方法在扔球(Ball throwing)实验上得到了很好验证. Muelling等[33]提出了一种DMP框架用来让机器人学习打乒乓球, 他们的框架考虑了以目标为中心(Goal-centered)的运动原语, 既考虑运动目标位置又考虑运动目标速度, 并可以同时对二者进行调节与拓展.

    原始DMP模型有两个缺点: 1)当目标位置与初始位置很接近时, 则会产生很大的加速度, 这可能会损坏机器人本体, 也不利于协作者的安全; 2)如果拓展的位置目标相对于原始目标过零点(如从1拓展到$ -1 $), 则拓展的运动轨迹可能会相对于坐标轴发生翻转.为了克服这些问题, Hoffmann等[34]改进了原始DMP模型中的变换系统(Transform system), 提出了一种基于新的变换系统能够将外部物体位置信息耦合到该系统中, 可以实现实时在线避障, 通过Pick-and-place实验验证了他们的方法.

    Rückert等[35]提出了参数化的动态原语模型(Parametrized DMP, PDMP), 将肌肉协同概念引入到该模型中, 用参数化的基函数替换原DMP中的径向基函数, 实验证明了其有效性. Krug等[36]提出了一种泛化的DMP模型(Generalized DMP, GDMP), 该模型把DMP的参数估计变成一个约束非线性最小二乘问题, 并把模型预测机制集成到示教系统中, 可以根据机械臂在当前运动状态下产生多种控制策略, 可起到意图预测、避障等作用. Meier等[37]提出了一种DMP的概率表示方法, 把该模型重构成带有控制输入的线性动态系统的概率模型, 方便直接将感知测量单元耦合到系统中, DMP系统可自动在线获取反馈信息, 并可根据似然估计结果对任务成败作出预判. Gašpar等[38]提出了弧长参数化的动态原语模型(Arc-length DMP, AL-DMP), 基本思想是将空间信息与时间信息分开表示, 可解决示教中存在较大运动速度差异的问题. Gams等[39]提出了适应于双臂交互的DMP模型, 基本做法是在两个DMP (分别用于机器人的左、右臂)的变换系统中耦合一对虚拟的相反作用力, 使得一只机械臂可以感知到另外一机械臂的位置与力的变化, 以达到良好的双臂协调控制效果(如图 7所示).

    图 7  基于DMP模型的双臂技能示教学习[39]
    Fig. 7  DMP-based robot bimanual skill learning by demonstration[39]

    在人机示教过程中, 往往需要多次示教才能学习出好的控制策略, 而原始的DMP模型只能学习单一的示教轨迹.为了从多次示教数据中学习出技能特征, Yin等[40]用联合概率分布的方式替换了原有DMP模型中的归一化的径向基函数(Normalized radical basis function), 即将相位与非线性函数用联合概率分布表示, 再从多次示教数据中学习出一个非线性函数项, 便可以学习多次示教的结果. Matsubara等[41]提出了风格化(Stylistic)的动态原语模型(SDMP), 通过将运动风格(Style)信息耦合到DMP的转换系统中, SDMP可以同时描述多样化的运动轨迹, 达到了学习多次示教的目的, 该方法适合于多次示教数据差异较大的任务.

    可以通过强化学习方法优化示教获得的运动原语.在人机示教技能传递的语境中, 强化学习方法的基本特征在于可实现对连续、高维原语空间的运动策略优化, 这区别于一般的强化学习方法.在技能复现阶段, 可以通过强化学习技术对变换系统中的非线性函数进行调节与优化[42], 按照一定目标来调节运动轨迹, 如按照最小加速度原则收敛到目标点、要求运动轨迹经过某些特定位置等. Kober等[43]将感知单元耦合到了DMP的系统中, 可以提高系统抵抗外部的干扰能力; 提出了一种基于权重探索的策略学习方法(Policy learning by weighting exploration with the returns, PoWER)对DMP学习到的控制策略进行优化. Theodorou等[44]提出了一种可应用于高维状态空间的算法, 即基于路径积分的策略优化方法(Policy improvement with path integrals, PI$ ^{2} $). Buchli等[45]将PI$ ^{2} $算法用于机器人技能学习, 用以优化运动原语模型参数. Li等[46]又将PI$ ^{2} $算法应用到了移动机器人的抓取操作上, 同时对机械臂与机械手关节空间进行轨迹优化, 取得良好的实验效果. Stulp等[47]利用PI$ ^{2} $算法用于机器人学习序列化的运动, 不仅优化模型参数, 还优化运动目标参数. Stulp等[48]又提出了一种进化策略方法(Evolution strategies, ES), 基本思想是将运动原语的演化调优看作是一个进化优化问题, 并通过数值仿真比较了PoWER、PI$ ^{2} $和ES的异同以及在同等条件下的收敛情况.

    3.3.1   GMM基本数学描述

    GMM提出的时间比较早, 有很多变形版本, 已经被应用于诸多领域.我们只考虑在人机示教中对运动信息的表征情况.

    在示教阶段获取的数据可以组合成数据对$ \lbrace\xi_{t}, z_{t} \rbrace_{t = 1}^{T} $.假设观测值$ \xi_{t} $是一个随机过程独立变量, $ z_{t}\in\lbrace 1, \cdots, K \rbrace $也相互独立.则其概率密度函数可表示为[49]:

    $ \begin{align} & \mathcal{P} = \sum\limits_{i = 1}^{K}\pi_{i}f_{i}(\xi_{t}) \end{align} $

    (5)

    $ \begin{align} & \sum\limits_{i = 1}^{K}\pi_{i} = 1 \end{align} $

    (6)

    $ \begin{align} & f_{i}(\xi_{t}) = \mathcal{N}(\xi_{t}|\mu_{i}, \Sigma_{i}) \end{align} $

    (7)

    其中, $ \pi_{i} $表示第$ i $个高斯组分对应的系数; $ f_{i}(\xi_{t}) $是条件概率密度函数, 通常可表示成高斯分布$ \mathcal{N} $. GMM模型参数可概括成:

    $ \begin{align} & \Theta_{\rm GMM} = \lbrace \pi_{i}, \mu_{i}, \Sigma_{i}\rbrace_{i = 1}^{K} \end{align} $

    (8)

    一般可以利用EM (Expectation-maximization)算法估计得到$ \Theta_{\rm GMM} $. GMM仅仅是用来对数据表征, 若要最终获得机械臂的运动控制策略, 还需要根据GMM模型参数生产运动控制变量.在机器人技能学习领域中, 高斯混合回归(Gaussian mixture regression, GMR)是实现这一目标的简单且高效的方法[50].例如, 控制变量$ \dot{\xi}^{*} $可以通过以下公式计算得到:

    $ \begin{align} \dot{\xi}^{*} = &\sum\limits_{i = 1}^{K}h_{i}(x)\mathcal{P}(\dot{\xi}|\xi, i) = \\ & \sum\limits_{i = 1}^{K}h_{i}(s)[\mu_{i}^{\dot{\xi}} + \Sigma_{i}^{\dot{\xi}\xi}(\Sigma_{i}^{\xi\xi})^{-1}(\xi_{t}-\mu_{i}^{\xi})] \end{align} $

    (9)

    其中, $ h_{i}(x) $是归一化的权重, 上式中的参数即是由EM算法评估得到的GMM模型参数.

    3.3.2   基于GMM的技能传递

    近年来, 基于GMM模型的技能示教学习方法在文献中屡见报道.在算法方面, Muhlig等[51]将GMM模型引入到类人机器人的模仿学习框架中, 利用GMM学习到的运动信息, 可以根据目标物体的移动信息而动态调节相应的动作. Gribovskaya等[52]利用GMM模型来描述机器人运动中的多变量之间的关联信息, 能够在时间和空间扰动下快速重新规划机械臂路径. Khansari等[53]提出了一种利用GMM学习稳定非线性动态系统的方法, 可保证机械臂在接近目标位置时能够尽可能地跟随示教者的运动姿态, 这有利于机械臂可以更好地捕获示教者的运动信息. Cederborg等[54]提出了一种新的GMM模型(Incremental, local and online variation of Gaussian mixture regression, ILO-GMR), 相比于传统GMM模型, ILO-GMR将任务信息耦合到局部动态系统中, 能够使得机器人在线学习新的运动技能, 而不需要重复地调整模型参数, 在一定程度上提高了技能传递的效率.

    Calinon等[55]提出了一种基于GMM的运动技能的示教学习框架, 能够同时处理关节空间与笛卡尔空间的任务限制, 并可使得机器人能够重复利用已经学习到的技能来处理新的任务情形. Calinon等[56]又提出了一种将任务信息参数化的混合模型(Task-parameterized mixture model, TP-GMM), 其核心思想是把模型参数与任务参数结合起来, 即把任务参数耦合到GMM模型中, 在任务复现阶段能够实时地调节参数化的轨迹以满足不同的作业任务要求. Alizadehl等[57]拓展了TP-GMM模型, 使之能够解决在示教阶段或者复现阶段中的部分任务参数信息缺失的问题. Huang等[58]对TP-GMM进行了优化, 选择直接优化任务参数而不是GMM的组分(Component), 这样将模型学习变成一个低维空间的优化问题, 并且设计了一种特征选择机制, 可以自动选出重要的任务帧(Task frame)而剔除不重要的任务帧.为了有效表征机械臂末端执行器在完成任务中的旋转特征, Zeestraten等[59]提出了在黎曼流形域中的GMM模型, 该方法能够有效表征机械臂在任务空间的位姿联合分布状态, 可使得机器人学习到示教者的更加丰富的技能特征.

    在应用方面, GMM被应用于不同类型的作业任务以及不同的机器人平台上. Reiley等[60]将GMM应用到了机器人辅助手术任务中, 用GMM表征医生手术过程中的动作信息, 再将生成的控制策略传递给手术机器人.此外, Chen等[61]利用GMM模型把技能传递给柔性手术机器人. Wang等[62]将GMM模型应用到软体机器人的运动技能学习中, 用GMM表征示教数据并评估出执行器的合适路径, 在试验中取得了良好效果. Kinugawa等[63]者的运动意图, 并可以根据人的意图预测结果自适应地对装配任务进行任务规划, 达到了良好人机交互效果. Goil等[64]利用GMM模型解决辅助轮椅导航系统中人机混合控制问题, 将用户的控制命令作为任务限制耦合到运动学习过程中, 实验取得了良好人机协同控制效果.

    3.4.1   HMM基本数学描述

    在人机示教技能传递的语境中, 常用一阶HMM模型分析时间序列.给定一个状态序列$ \lbrace{s_{1}, s_{2}, \cdots, s_{T}}\rbrace $, 可用以下公式表示其其联合分布[65]:

    $ \begin{align} & \mathcal{P}(s_{1}, s_{2}, \cdots, s_{T}) = \mathcal{P}(s_{1})\prod\limits_{t = 2}^{T}\mathcal{P}(s_{t}|s_{t-1}) \end{align} $

    (10)

    并且假设当前状态只与上一时刻状态有关, 即:

    $ \begin{align} &\mathcal{P}(s_{t}|(s_{t-1}) = \mathcal{P}(s_{t}|s_{1}, s_{2}, \cdots, s_{t-1}) \end{align} $

    (11)

    与GMM模型参数相对应, HMM模型参数可表示为:

    $ \begin{align} & \Theta_{\rm HMM} = \lbrace \lbrace a_{i, j}\rbrace_{j = 1}^{K}, \pi_{i}, {\mu}_{i}, {\Sigma}_{i} \rbrace_{i = 1}^{K} \end{align} $

    (12)

    其中, $ a_{i, j} $为状态转移矩阵中的元素. HMM的参数可用前向–后向算法(Forwar-backward)或者EM算法估计得到.与GMM类似, 在用HMM对示教数据建模后, 也需要利用回归算法生成机器人的运动控制命令.

    在GMM模型中, 状态之间相互独立, 状态之间的转移与时间信息无关; 和HMM模型中, 状态驻留概率为均匀分布.因此, GMM模型和HMM模型不能很好地表征运动技能的时间信息.而隐半马尔科夫模型(Hidden semi-Markov models, HSMM)用高斯函数表示HMM中的状态驻留概率, 可以改善HMM在表征时间信息的性能.相应地, HSMM的参数可表示为:

    $ \begin{align} & \Theta_{\rm HSMM} = \lbrace \lbrace a_{i, j}\rbrace_{j = 1, j\neq i}^{K}, \pi_{i}, {\mu}_{i}, \mu_{i}^{d}, \Sigma_{i}^{d}, {\Sigma}_{i} \rbrace_{i = 1}^{K} \end{align} $

    (13)

    其中, $ {\mu}_{i} $和$ \mu_{i}^{d} $分别表示第$ i $个状态的均值与方差. 图 8反映了在两个状态下GMM, HMM与HSMM建模示例以及三者之间的主要区别.

    图 8  GMM, HMM, HSMM三种模型关系图[65]
    Fig. 8  Graphical representation of the GMM, HMM and HSMM models[65]
    3.4.2   基于HMM的技能传递

    Asfour等[66]将HMM模型引入到类人机器人的模仿学习中, 用示教数据中的关键特征来训练HMM模型, 实验表明相对于GMM, HMM可以很好地反映出机器人双臂之间在完成任务过程中的时间关联性. Calinon等[67]提出了一种基于HMM-GMR模型的架构使机器人可以学习人的运动技能, 用HMM对人体运动信息建模, 用GMR做回归得到机器人的运动控制命令.该架构与GMM-GMR类似, 但可以表征更加丰富的运动信息, 该算法具有更强的鲁棒性.

    Vuković等[68]首次将该方法应用到移动机器人的示教学习中, 用HMM对机器人的移动信息建模, 试验证明了其有效性. Medina等[69]结合HMM模型和线性参数变化(Linear parameter varying, LPV)系统, 提出了HMM-LPV模型, 用HMM对复杂任务建模, 用LPV保证HMM每一个状态或子任务(Subtask)的稳定性, 该模型可以学习序列化的、与时间变化无关的运动控制策略.

    Hollmann等[70]提出了一种基于HMM的机器人示教编程方法, 通过对机器人的运动控制信息添加约束, 使得机器人可以自动地根据人的运动特征做出相应的反应, 并在一家金属加工公司的生产线上验证了所提方法. Vakanski等[6]提出了一种机器人运动轨迹学习方法, 用HMM表征示教轨迹, 并通过在状态转移时设置关键点(Key points)的办法, 实现对轨迹的拓展与调整, 在刷漆(Painting)作业中验证了该方法的有效性. Rafii-Tari等[71]提出了一种基于分层级的(Hierarchical HMM, HHMM)模型以应用于机器人辅助血管内导管插入术.他们把该手术任务分成多个序列化的运动原语, 用HHMM模型分别对各个原语状态以及它们之间的关联信息建模, 可以使得机器人对协作者的运动输入有一定识别和预测能力.

    如前文所述, HMM无法表征每个状态的驻留时间.为此, Calinon等[26]将HSMM引入到机器人示教学习中, 利用HSMM同时对时间信息和运动信息建模, 即保留了HMM模型的优点, 又能提高抗干扰能力, 尤其在时间域上的抗干扰能力. Pignat等[72]利用HSMM表征人机协作场景中的感知信息与运动控制信息, 即把协作者的运动与机器人的运动在空间位置与时间上都关联起来, 机器人可以根据人的当前运动状态而做出在空间域与时间域上的运动响应, 该方法被应用到了机器人辅助穿衣任务. Rozo等[73]进一步提出了可自适应调节每个状态持续时间的HSMM模型(Adaptive duration hidden semi-Markov model, ADHSMM).与传统的HSMM模型相比, 不再用固定的高斯分布来表征其状态驻留时间, 而是可以根据与环境交互情况自适应地调节, 因而ADHSMM对运动的时间信息具有更强的表示能力, 具有更强抗外部干扰能力.

    DMP、GMM、HMM三种模型比较:由于模型差异, 难以对三者细致比较.总体来说, DMP具有模型简洁, 计算效率高, 泛化能力强的优点, 但DMP独立表征各运动维度信息, 丢失了各维度之间的关联信息.例如, 当用DMP模型对机械臂末端运动位置与交互力建模时, 只能对力与位置分别建模与描述, 就无法表征出位置与力的关联信息, 可能会导致信息丢失而不能很好地学习到示教者的运动.另外, 在模型学习阶段需要提前选择离散型DMP或节律型DMP[24].而GMM和HSMM可以表达出各维度的关联信息, 但模型复杂, 计算效率相对较低, 通常需要较长的时间学习模型参数. HSMM可以反映各个状态之间的转换信息, 因而比GMM具有更强的运动信息表达能力, 但在同等条件下需要更长的计算时间[26]. 表 2总结了这三种模型与其常见变种模型的的基本特点, 以及利用它们学习到的技能示例.

    表 2  DMP、GMM、HMM模型特点总结
    Table 2  The summary of DMP、GMM、HMM models
    模型 常见变种 基本特点 技能示例
    DMP - 模型简单; 拓展性好; 学习单次示教; 计算效率高$^{1}$. Tennis swings[75]
    Bio-inpisred DMP 可以克服跨过零点问题, 可在线动态避障. Pick-and-place[34]
    PDMP 适用高维$^{2}$、连续系统; 对多种运动灵活表达. Walking[36]
    GDMP 可实现多种控制策略, 起到意图预测等作用. Grasping[37]
    AL-DMP 空间与时间信息分别表示, 更好地表达运动速度. Reaching positions[39]
    SDMP 可从多次差异较大的示教结果中学习技能特征$^{3}$. Table tennis[41]
    ProMP$^{4}$ 对运动原语概率化表示; 可有机混合不同运动原语. Robot hockey[76]
    Coupling DMP 耦合双臂运动信息, 适宜双臂、协作操作任务. Bimanual tasks[35]
    DMP-based RL 通过强化学习方法对DMP轨迹优化. Ball-in-a-cup[43]
    GMM - 可表达不同维度的关联信息; 可表征多次示教; 计算效率相对低. Gripper assembly[77]
    ILO-GMM 局部耦合运动信息; 增量学习运动技能. Moving[54]
    TP-GMM 耦合任务参数到模型中; 对参数化轨迹在线调节. Rolling out a pizza[56]
    TP-GMM on RM$^{5}$ 用黎曼流形表示GMM, 有效表达末端位姿分布信息. Bimanual pouring[59]
    HMM - 相比GMM对运动的信息表达能力更强; 计算效率相比较低. Ball-in-box[78]
    HMM-GMR 用GMR做回归模型, 可在线生成运动控制命令; 鲁棒性好. Feeding[67]
    HMM-LPV 保证每个子状态的稳定性, 适宜复杂任务建模. Reach-Peel-retractg[69]
    HSMM 可表达状态驻留时间, 相比HMM抗外界干扰能力强. Button pushing[12]
    ADHSMM 自适应调节状态驻留时间, 对时间信息表达能力更强. Pouring[73]
    1 计算效率高是指离线下模型学习时间短, 这里不包括基于DMP的强化学习算法.
    2 指对多个自由度个数, 如对7-DOF的机械臂同时学习位置与速度, 则维度为14.
    3 指多次示教的轨迹重合度小, 难于对齐, 如打乒乓球时的运动轨迹.
    4 概率化运动原语(Probabilistic movement primitives, ProMP).
    5 指黎曼流形(Riemannian manifolds, RM).
    下载: 导出CSV 
    | 显示表格

    在建模阶段, 除了需要考虑对运动做通用化描述外, 还有一些问题需要考虑, 主要包括: 1)轨迹对齐(Alignment)问题; 2)技能分割(Segmentation)问题.

    1) 轨迹对齐问题

    由于示教的差异, 多次示教的运动轨迹往往在时间轴上长短不同, 在空间上也会有一定差异, 这种差异有时候还会比较大, 影响模型学习结果.为了达到更好的运动技能学习效果, 需要对示教数据进行对齐处理.动态时间规整(Dynamic time warping, DTW)是常用的对齐数据的技术, 在机器人技能学习领域应用广泛. Muhlig等[51]在用GMM对示教数据建模之前, 用DTW在时间上对运动轨迹进行了对齐处理. Vakanski等[6]结合HMM与DTW技术, 利用DTW对运动轨迹的关键点进行对齐, 实验证明该方法要比没有对齐的情况获得更好的效果.为了对齐人机协作场景中示教者与机器人的运动轨迹, Amor等[74]把DMP与DTW模型结合起来, 利用DTW把人与机器人的各自运动相位变量对齐, 这样二者的运动内部信息便可关联起来, 人机双方的运动便能够得以协调起来, 该方法比较适合人机协作的作业任务.

    2) 技能分割问题

    技能分割主要针对以下情况: a)复杂的任务往往包含多个步骤, 其运动轨迹的动态特征非常复杂, 用上述三种模型对其整体运动轨迹一次性建模比较困难; b)对于序列化的运动轨迹, 经常需要分阶段拓展, 即轨迹拓展的目标不止一个, 因而需要分段处理; c)在机器人复现任务过程中, 对其分阶段添加不同的限制, 需要机器人在各阶段作出不同的响应.面对这三种情况, 技能(或任务、轨迹)分割是解决问题的有效办法.基本思想简单、直接:把作业任务分割成多个阶段, 用上述模型对分割后的各个运动片段(Segments)分别建模, 再针对每一阶段具体情况分别考虑.

    目前, 关于技能分割的文献报道较少, 主要有以下几种方法. Fox等[79]提出了$ \beta $过程自回归隐马尔科夫模型(Beta process autoregressive HMM, BP-AR-HMM), 用于分割连续的人体运动. Niekum等[80]对BP-AR-HMM进行了改善, 将其应用到机器人示教学习领域, 把BP-AR-HMM与DMP结合形成了一个完整的示教学习框架, 前者用于分割; 后者用于表征.随后, Chi等[81]将这一框架应用到了安装在轮椅上的机械臂示教学习中, 实验取得了良好效果. BP-AR-HMM算法的优点是全自动分割, 不需要先验设置分割的片段数量; 缺点是鲁棒性差, 容易导致过分割的情况.

    最近, Lioutikov等[82]提出了一种概率分割(Probabilistic segmentation, ProS)方法, 该算法是基于对DMP的概率表示[38], 在对轨迹建模的同时完成技能的分割.在同等条件下, ProS比BP-AR-HMM具有更强的鲁棒性, 可获得更好的分割效果.但ProS是一种半自动的分割方式, 需要先验设置分割数量.

    机械臂的仿人控制是一个很大的范畴, 一直得到了广泛的关注与研究.在人机技能传递领域, 仿人控制具有比较明确的目标与意义.这里的仿人控制是指如何借鉴人的手臂灵活的操作能力, 来实现机械臂的灵巧控制, 或者说如何实现将人手臂的自适应控制模式传递给机械臂.

    对于雕刻这样的任务, 机器人难以胜任, 而人却可以比较轻松地完成.学者对了解人类是如何拥有灵巧的操作能力表现出了浓厚的兴趣, 在探究人体神经肌肉运动控制机理方面展开了大量研究. Schweighofer等[83]展示了小脑能够补偿人的手臂与外界的相互作用力矩, 进而通过学习部分逆动态模型而改进预先存储在运动神经元皮层的基本逆动态模型, 从而在目标定向运动中提高精确度, 又进一步将人体肌肉的同步收缩解释为一种不受时延影响的分布式的局部控制策略, 表明主动改变系统刚度的能力可以克服反馈滞后的缺点.

    特别地, Shadmehr等[84]在运动神经元控制方面的研究中发现共同收缩(人改变内在的肌肉–骨骼刚度的能力)在处理不确定性和不可预测性方面起到了关键性作用. Burdet等[85]证实了人的手臂具有一种类似弹簧的性质, 在中枢神经系统(Central neural system, CNS)的控制下, 手臂可以自适应地调节阻抗/刚度以适应任务的变化, 当外部环境变化时, 手臂能够自然地增加阻抗以提高抗干扰能力, 而当不需要高刚度时, 又能够自然地降低刚度. Mitrovic等[86]研究表明中枢神经系统可以通过适当的主动肌/对抗肌的同步收缩来控制手臂平衡, 并研究证实了共同收缩在处理不确定性最小化方面具有重要作用.

    上述研究成果表明人的这种变阻抗/刚度控制能力是完成灵巧作业任务的关键, 这对于实现机械臂的灵巧控制、改善机器人的操作技能具有重要启示作用.近年来, 人机示教领域的学者开始关注于如何使机器人学习自适应变刚度控制策略.这些方法基本可以分为两类: 1)基于学习的变刚度控制方法; 2)人机变刚度控制策略传递.

    阻抗控制是实现力控的常用方式, 一个典型的关节阻抗控制器可用以下公式表示:

    $ \begin{equation} \begin{aligned} \tau_{cmd} & = K^{P}(x_{des}-x_{cur})+K^{D}(\dot{x}_{des}-\dot{x}_{cur}) +\\ & \tau_{for}+\tau_{dyn}(x, \dot{x}, \ddot{x}) \end{aligned} \end{equation} $

    (14)

    其中, $ \tau_{cmd} $是控制输入力矩, $ \tau_{for} $是前馈项, 用于补偿机械臂与外界的交互作用力, $ x_{des} $和$ x_{cur} $分别代表目标关节角度和当前的关节角度, $ \tau_{dyn} $用以补偿系统的动态力如重力和科里奥利力等. $ K^{P} $和$ K^{D} $分别表示刚度与阻尼, 通常阻尼项设置为$ K^{D} = \lambda \sqrt{K^{P}} $, $ \lambda $是预设常值.变阻抗控制的目标是适当地调节刚度值, 以达到提高机械臂柔性的目的[87-90].

    基于学习的方法实现机械臂的变刚度控制是指通过学习技术(如强化学习)来对刚度轨迹进行调节, 获得适当的变刚度控制策略. Buchli等[45]提出了一种基于强化学习的方法来调节刚度轨迹.其基本思路是利用DMP模型变换系统的最后一项即非线性项(参见式(2))来表示刚度, 再用PI$ ^{2} $算法对这一非线性优化, 通过设置一个合适的代价函数, 最终可以得到变化的刚度轨迹.该算法用一固定的初始值拟合PI$ ^{2} $算法, 因此收敛速度与初始值的选择有很大关系, 通常需要很长的训练时间和较多的训练次数.

    Steinmetz等[89]提出了一种基于DMP的方法来实现力控, 他们的主要思路与Buchli的方法相似, 不过没有直接利用强化学习技术来优化非线性项, 而是设计了一种刚度值选择机制来调节刚度, 例如当机械臂在运动过程中把刚度设定一个较高值, 而当与外部环境接触, 将刚度设定为零.他们的方法不需要很长的学习时间, 但不能连续调节刚度值.

    Rozo等[90]提出了一种基于HMM-GMR的方法来学习变刚度轨迹.其基本思路是在示教阶段, 同时记录位置信息与力信息.在建模阶段, 用联合概率分布来同时表示位置与力, 学习后的HMM模型就能够表征力的变化信息, 再通过以下公式将力与刚度联系起来:

    $ \begin{align} F_{t} = \sum\limits_{i = 1}^{N}h_{t, i}[K^{P}(\mu_{n, t}^{x}-x_{t})] \end{align} $

    (15)

    其中, $ \mu_{n, t} $是HMM模型第$ n $个状态在时间$ t $时候的位置均值, $ h_{t, i} $是状态的权重(参见式(9)).通过式(15)可以获得变刚度轨迹, 并且可以反映出相应的力的变化情况.

    受此启发, Racca等[24]进一步利用HSMM-GMR模型来学习刚度, 用HSMM模型替换HMM模型可以提高系统对外界的抗干扰能力, 这对于接触型(In-contact)任务十分有利.并且, 他们还将机械臂末端的旋转力矩信息耦合到HSMM模型中, 因而还可以学习出旋转刚度轨迹, 即实现了在旋转方向上的变刚度调节.

    上述的学习刚度的方法都需要在一个学习过程才能够获得刚度轨迹, 显然不够直接, 并且很难准确反应人体的刚度变化特征.另外, 在这些方法中刚度是通过基于力计算得到的, 往往需要额外的传感器测量力, 增加整体机器人系统的成本.更加直接的方式是人机变刚度控制策略传递, 即在人机交互过程中, 提取人的肢体刚度变化特征, 将其直接传递给机械臂, 以达到变刚度控制的目的.

    研究者们发现利用人体生理肌电信号(Eletromyography, EMG)可以实现人手臂到机械臂的力传递策略.肌电信号是运动单位产生的动作电位序列(Motor unit action potential trains, MUAPT)在皮肤表面叠加而成的一种非平稳微弱信号, 由中枢神经系统进行调节控制, 表征了肌肉的伸缩以及关节力度和刚度变化等信息, 因而EMG信号与肌肉力度/刚度的调节、运动意图等具有很大的关联性.肌电信号使得我们能够从生理层次提取运动肌肉控制特性, 弥补传统的示教技术仅从物理层次上实现人机交互的不足.

    近些年来, 机器人领域的学者开始利用EMG信号提取人的肢体刚度特征, 并用于控制机械臂. He等[88]提出了一种基于EMG信号的变阻抗遥操作系统, 如图 9所示, 根据EMG估计出人的手臂刚度, 人在视觉反馈下调节手臂刚度, 并传递给机械臂, 实现机械臂的自适应柔性控制. Ajoudani等[11]又提出了一种基于扰动测量的手臂刚度简化的评估方法, 通过肌肉共收缩情况定义一个刚度指示器, 其变化可反映出人体肌肉活化程度, 该方法可实现基于EMG信号实时估计出人体刚度. Yang等[4]进一步将触觉反馈机制引入到该类系统中, 同时在触觉和视觉反馈的帮助下, 人可以更加自然地示教, 增加了技能传递的临场感.

    图 9  基于EMG信号的人机变刚度传递系统[91]
    Fig. 9  The EMG-based human-robot stiffness transfer system[91]

    Liang等[3]提出了一种人体刚度增量估计算法, 利用刚度与力增量之间的线性映射关系, 估计出肢体刚度系数, 这种方式可以忽略掉EMG信号的非线性残差, 他们通过教授机器人写字, 证明了该算法的有效性. Li等[92]进一步利用该方法估计人体刚度, 并将其用于控制上肢外骨骼机器人, 可实现外骨骼自适应地调节刚度, 取得了良好实验效果.

    Howard等[93]比较了在不同层级上将人的行为传递给变阻抗驱动器(Variable impedance actuators, VIAs), 主要分析了基于EMG信号的人体阻抗调节特征的传递, 指出特征传递比直接动作模仿具有更好效果, 他们的结论可提供很好的借鉴作用. Peternel等[94]提出了一种人机协作系统, 如图 10所示, 将人的手臂刚度与机械臂的刚度协调起来, 机械臂的刚度由示教者的手臂刚度的变化决定.例如, 当在一个拉锯任务场景中, 当人拉锯时增大手臂力度, 机械臂就减小刚度处于松弛状态, 反之亦然, 这种方法适合于人机协同调节交互力的任务场景.

    图 10  基于变刚度控制的人机协作[94]
    Fig. 10  Human-robot collaboration based on variable stiffness control[94]

    在上述的刚度传递过程中, 大多只关注于将评估出的人体刚度轨迹直接映射到机械臂的控制器中, 而对刚度的动态特性分析不足. Yang等[25, 95-96]提出了一种人机示教框架, 将运动轨迹与刚度轨迹等同看待, 提出用统一的框架对二者分别建模, 这样可实现运动特征与刚度特征从人向机器人的同时传递, 获得更加完整的技能传递过程.并且, 他们的方法可学习多次示教刚度轨迹, 保留对空间位置与刚度分别调节的空间, 可实现对二者同时或者分别拓展与分割, 有利于提高机器人的技能学习能力.

    上述刚度传递的一般过程是:先离线估计出示教者手臂末端的刚度, 再映射到机械臂的末端工作空间, 最后通过逆运动学作用到关节力矩控制器. Fang等[97]利用零关节空间刚度特性, 开发了基于模型的人体关节空间估计方法, 实现在线在多个位置和不同程度的肌肉活化度下对手臂7个关节的刚度估计, 该方法有望实现人机关节空间的刚度直接传递, 提高变刚度自适应控制的效率.

    综上所述, 人机技能传递技术虽然取得了一定进展, 但仍然存在多个方面问题.主要体现在:

    1) 在人机技能传递方式方面, 目前的交互方式过于单一、感知信息不足, 人机融合程度不高, 造成示教的浸入感不足, 示教者缺乏比较真实的临场感, 从而影响示教性能.

    针对这一问题, 未来会集中在寻求更加直观、自然、友好的示教方式.首先, 在人机交互接口上, 多种交互方式相结合是发展趋势, 将先进的交互技术引入到机器人技能示教学习领域是确实可行的办法, 例如, 利用虚拟现实(VR)、混合现实(MR)以及三维再现等技术[98-101]构建人机示教交互与作业环境, 有望缩小人机隔离状态, 达到更好人机共融效果, 可提高示教质量.

    多模态信息融合也将是改善人机交互性能的发展方向.通过将物理的或者生理的多种形式的信号(如空间位置、交互力、触觉、视觉、肌电信号等)在更高层次上融合, 纳入到人机技能传递过程中, 可以更直观地表达出人的技能特征.

    2) 在技能建模、学习方面, 目前所用的模型大多是传统的机器学习模型, 泛化能力不足, 使得机器人学习技能过程在很大程度上受到具体示教场景、示教者本身、作业环境等诸多因素的制约.

    结合示教学习和深度强化学习等技术是解决这一问题的有效方式之一.近年来, 人工智能技术在机器人视觉感知、技能学习等方面展现出较大的应用潜力[102-105].虽然现有的基于人工智能的机器人技能学习方法侧重于机器人自主提升技能, 与人机示教技能传递存在很大差别, 但人工智能有望作为一种辅助技术手段以提高人机示教的性能.一种思路是先利用示教技术使机器人具备一定的类人化的操作技能, 再通过深度强化学习提高机器人的技能泛化能力.例如, 可考虑如何用深度强化学习技术优化运动原语控制策略.

    3) 在机械臂控制方面, 虽然目前可以实现人体刚度特征向机器人的传递, 但对人体刚度调节机制理解不够深入, 人手臂与机械臂在结构上具有差异性, 影响刚度评估的准确性.刚度估计方法也繁琐复杂, 影响技能学习效率.

    为了进一步理解肌肉活化、信息感知、运动控制等内容, 有必要深入探究人体的运动机理.更好地理解人体肌肉模型, 开发具有普适应的刚度估计方法.从人类的运动控制中汲取经验, 是未来提高机器人类人化操作能力的重要研究方向[106].

    本文主要介绍人机技能传递取得的研究进展.首先, 阐述了机器人技能学习在新一代智能制造时代的研究背景, 尤其是与HCPS之间的关系.介绍了技能传递一般过程:示教–建模–技能复现, 以及几种主要的人机技能传递方式, 并分析了各自的优缺点.接着阐述了三种基本的技能建模模型: DMP、GMM、HMM, 以及它们的主要变种, 总结了各自的特点.接着, 介绍了两种实现机械臂变刚度控制的方式:基于学习算法和人机刚度特征传递, 并分析了各自的优缺点.最后, 总结了示教学习在三个方面面临的主要问题、现阶段不足之处, 并给出了可能的解决之道与未来发展方向.

    在过去的十年里, 人机技能传递技术得到了较快发展, 无论是在人机接口设计与建模, 还是在仿人手臂自适应控制上都取得了一些可喜的成果.但有诸多不足, 与达到应用的地步还有一段距离.人机技能传递是个典型的交叉学科问题, 需要机器人学、控制、机器学习、神经科学等多个学科的研究人员共同努力, 才能推动其不断进步, 最终走向工业界.

    目前, 我国在此领域处于刚刚起步阶段, 相关成果报道很少, 离国际先进水平有很大的差距, 需要国内学者加倍努力, 在理论与技术上都有所建树, 争取早日把人机示教技术推向应用, 助力我国智能制造业发展.

  • 图  1  空间控制技术三个方面包含关系韦恩图

    Fig.  1  Venn diagram illustrating the relationship between the three aspects of space control technology

  • [1] 中国空间技术研究院. 中国航天器. 北京: 电子工业出版社, 2008.

    China Academy of Space Technology. Chinese Spacecraft. Beijing: Publishing House of Electronics Industry, 2008.
    [2] Iwata T. Precision on-board orbit model for attitude control of the advanced land observing satellite (ALOS). Journal of Aerospace Engineering Sciences and Applications, 2012, 4(3): 62-74
    [3] ALOS-2 — Satellite overview [Online], available: https://spaceflight101.com/spacecraft/alos-2/, November 20, 2022
    [4] WorldView-4 [Online], available: https://www.eoportal.org/satellite-missions/worldview-4#worldview-4-formerly-geoeye-2, January 28, 2023
    [5] 屠善澄, 吕振铎, 邹广瑞, 邢光谦, 刘良栋. 中国同步试验通信卫星STW-1的控制. 宇航学报, 1986, 7(4): 1-13

    Tu Shan-Cheng, Lü Zhen-Duo, Zou Guang-Rui, Xing Guang-Qian, Liu Liang-Dong. Control of the Chinese geostationary experimental communication satellite STW-1. Journal of Astronautics, 1986, 7(4): 1-13
    [6] 吕振铎. 地球同步通信广播卫星的两种姿态控制方式. 中国空间科学技术, 1990(1): 28-35

    Lü Zhen-Duo. Two different attitude control methods for geostationary communication broadcasting satellite. Chinese Space Science and Technology, 1990(1): 28-35
    [7] 吕振铎, 李铁寿, 刘良栋. 实用通信广播卫星控制软件的改进. 宇航学报, 1990(1): 1-6

    Lü Zhen-Duo, Li Tie-Shou, Liu Liang-Dong. Improvements in attitude and orbit control software for Chinese STW-2 satellite. Journal of Astronautics, 1990(1): 1-6
    [8] 齐春子, 于嘉茹. FY-2C星控制分系统设计. 上海航天, 2005, 22(S1): 36-41 (查阅所有网上资料, 未找到对应的卷号信息, 请联系作者确认)

    Qi Chun-Zi, Yu Jia-Ru. Control subsystem design of FY-2C meteorological satellite. Aerospace Shanghai, 2005, 22(S1): 36-41
    [9] 徐福祥. 第二颗风云一号试验气象卫星的技术改进. 世界导弹与航天, 1991(1): 5-7

    Xu Fu-Xiang. The technological improvements of FY-l(B). Missiles & Spacecraft, 1991(1): 5-7
    [10] Xiong Y Z, Wu Y P, Cheng H Y, Liu D. The online estimation of relative alignments for multiple heads star tracker based on the invariability of inter-star angle principle. In: Proceedings of SPIE 10141, Selected Papers of the Chinese Society for Optical Engineering Conferences. Changchun, China: SPIE, 2016. 60−66
    [11] 李骥, 张洪华, 赵宇, 梁俊, 张晓文, 关轶峰, 等. 嫦娥三号着陆器的陀螺在轨标定. 中国科学: 技术科学, 2014, 44(6): 582-588 doi: 10.1360/092014-54

    Li Ji, Zhang Hong-Hua, Zhao Yu, Liang Jun, Zhang Xiao-Wen, Guan Yi-Feng, et al. In-flight calibration of the gyros of the Chang’E-3 lunar lander. Scientia Sinica Technologica, 2014, 44(6): 582-588 doi: 10.1360/092014-54
    [12] 韩京清. 自抗扰控制技术 — 估计补偿不确定因素的控制技术. 北京: 国防工业出版社, 2008.

    Han Jing-Qing. Active Disturbance Rejection Control Technique — The Technique for Estimating and Compensating the Uncertainties. Beijing: National Defense Industry Press, 2008.
    [13] Han J Q. From PID to active disturbance rejection control. IEEE Transactions on Industrial Electronics, 2009, 56(3): 900-906 doi: 10.1109/TIE.2008.2011621
    [14] Guo L, Cao S Y. Anti-disturbance control theory for systems with multiple disturbances: A survey. ISA Transactions, 2014, 53(4): 846-849 doi: 10.1016/j.isatra.2013.10.005
    [15] Chen W H, Yang J, Guo L, Li S H. Disturbance-observer-based control and related methods - An overview. IEEE Transactions on Industrial Electronics, 2016, 63(2): 1083-1095 doi: 10.1109/TIE.2015.2478397
    [16] 斯祝华, 刘一武. 帆板驱动影响下的卫星姿态高精度高稳定度控制. 宇航学报, 2010, 31(12): 2697-2703

    Si Zhu-Hua, Liu Yi-Wu. High accuracy and high stability attitude control of a satellite with a rotating solar array. Journal of Astronautics, 2010, 31(12): 2697-2703
    [17] Chak Y C, Varatharajoo R, Razoumny Y. Disturbance observer-based fuzzy control for flexible spacecraft combined attitude & sun tracking system. Acta Astronautica, 2017, 133: 302-310 doi: 10.1016/j.actaastro.2016.12.028
    [18] Zou A M, de Ruiter A H J, Dev Kumar K. Disturbance observer-based attitude control for spacecraft with input MRS. IEEE Transactions on Aerospace and Electronic Systems, 2019, 55(1): 384-396 doi: 10.1109/TAES.2018.2852369
    [19] Liu Y W, Si Z H, Tang L, Chen S L. Angular momentum management strategy of the FengYun-4 meteorological satellite. Acta Astronautica, 2018, 151: 22-31 doi: 10.1016/j.actaastro.2018.05.031
    [20] Tang L, Chen S L, Wang K, Liu Y W. Fengyun-4 attitude control system design and its in-flight performance. Journal of Spacecraft and Rockets, 2019, 56(1): 200-210 doi: 10.2514/1.A34226
    [21] 李明群, 雷拥军, 牟小刚. 具有载荷扰动抑制的卫星姿态控制方法及验证. 中国空间科学技术, 2019, 39(1): 73-77, 86

    Li Ming-Qun, Lei Yong-Jun, Mu Xiao-Gang. Satellite attitude control method and physical test with load disturbance suppression. Chinese Space Science and Technology, 2019, 39(1): 73-77, 86
    [22] Lei Y J, Lu D N, Mu X G, Li L J, Chen C. Modelling and mitigation of dual-axis antenna-induced disturbances on spacecraft. In: Proceedings of the Chinese Control Conference (CCC). Guangzhou, China: IEEE, 2019. 3202−3207
    [23] 陆栋宁, 雷拥军, 陈超. 具有运动约束的姿态机动路径规划方法研究. 见: 惯性技术与智能导航学术研讨会论文集. 昆明, 中国: 中国惯性技术学会, 2019. 237−244

    Lu Dong-Ning, Lei Yong-Jun, Chen Chao. Research on attitude maneuvering path planning method with motion constraints. In: Proceedings of the Symposium on Inertial Technology and Intelligent Navigation. Kunming, China: China Inertial Technology Society, 2019. 237−244
    [24] 陆栋宁, 郭超勇, 王淑一, 陈超. 星载运动附件扰动抑制方法研究. 中国空间科学技术, 2020, 40(5): 26-33

    Lu Dong-Ning, Guo Chao-Yong, Wang Shu-Yi, Chen Chao. A disturbance mitigation method for moving appendages on spacecraft. Chinese Space Science and Technology, 2020, 40(5): 26-33
    [25] 郭超勇, 陆栋宁, 陈超, 张猛, 于国庆. 高分七号卫星太阳翼驱动主动控制方案. 航天器工程, 2020, 29(3): 151-156

    Guo Chao-Yong, Lu Dong-Ning, Chen Chao, Zhang Meng, Yu Guo-Qing. Drive and active control scheme of solar array for GF-7 satellite. Spacecraft Engineering, 2020, 29(3): 151-156
    [26] Pinilla-Alonso N, Stansberry J A, Holler B J. Surface properties of large TNOs: Expanding the study to longer wavelengths with the James Webb Space Telescope. The Trans-Neptunian Solar System. Amsterdam: Elsevier, 2020. 395−412
    [27] 关新, 郑钢铁. 空间相机隔振与姿态控制一体化设计. 宇航学报, 2013, 34(2): 214-221

    Guan Xin, Zheng Gang-Tie. Integrated design of space telescope vibration isolation and attitude control. Journal of Astronautics, 2013, 34(2): 214-221
    [28] 刘潇翔, 胡军. 包含密集模态的空间结构的模糊主动振动控制. 空间控制技术与应用, 2010, 36(4): 18-24

    Liu Xiao-Xiang, Hu Jun. Fuzzy vibration control of space structures with close modes. Aerospace Control and Application, 2010, 36(4): 18-24
    [29] 李东旭. 大型挠性空间桁架结构动力学分析与模糊振动控制. 北京: 科学出版社, 2008.

    Li Dong-Xu. Large Flexible Space Truss Structures: Dynamic Analyses and Vibration Fuzzy Control. Beijing: Science Press, 2008.
    [30] 杨鸿杰, 刘磊, 李新国. 超静空间科学卫星分离式主动隔振技术. 中国空间科学技术, 2021, 41(4): 102-110

    Yang Hong-Jie, Liu Lei, Li Xin-Guo. Separated active vibration isolation technology for ultra-quiet scientific satellites. Chinese Space Science and Technology, 2021, 41(4): 102-110
    [31] 郝仁剑, 汤亮, 关新. 基于观测器的超静卫星平台关节-任务空间鲁棒控制方法. 空间控制技术与应用, 2019, 45(3): 8-16

    Hao Ren-Jian, Tang Liang, Guan Xin. Observer-based robust control for the Hexapod platform on the ultra-quiet spacecraft in the joint-task space. Aerospace Control and Application, 2019, 45(3): 8-16
    [32] 王有懿, 汤亮, 何英姿. 超静平台动力学建模与解耦控制. 空间控制技术与应用, 2016, 42(4): 6-11

    Wang You-Yi, Tang Liang, He Ying-Zi. Dynamic modeling and decoupled control of ultra quiet platform. Aerospace Control and Application, 2016, 42(4): 6-11
    [33] Kong Y F, Huang H. Vibration isolation and dual-stage actuation pointing system for space precision payloads. Acta Astronautica, 2018, 143: 183-192 doi: 10.1016/j.actaastro.2017.11.038
    [34] 廖波, 梁健, 刘胜, 刘磊. 双超敏捷卫星载荷舱扰动补偿研究. 空间电子技术, 2019, 16(3): 48-54

    Liao Bo, Liang Jian, Liu Sheng, Liu Lei. Disturbance compensation research of disturbance-free payload agility satellite with disturbances in payload module. Space Electronic Technology, 2019, 16(3): 48-54
    [35] 许域菲, 赵艳彬. 基于音圈式Stewart平台的零刚度卫星复合姿态控制研究. 上海航天, 2017, 34(2): 52-60

    Xu Yu-Fei, Zhao Yan-Bin. Complex attitude control study of a zero stiffness satellite based on voice coil Stewart platform. Aerospace Shanghai, 2017, 34(2): 52-60
    [36] Tang L, Guo Z X, Guan X, Wang Y Y, Zhang K B. Integrated control method for spacecraft considering the flexibility of the spacecraft bus. Acta Astronautica, 2020, 167: 73-84 doi: 10.1016/j.actaastro.2019.08.030
    [37] Tang L, Guo Z X. Integrated control and magnetic suspension for fast attitude maneuvering and stabilization. IEEE Transactions on Aerospace and Electronic Systems, 2019, 55(6): 3273-3283 doi: 10.1109/TAES.2019.2907343
    [38] Wie B, Bailey D, Heiberg C. Rapid multitarget acquisition and pointing control of agile spacecraft. Journal of Guidance, Control, and Dynamics, 2002, 25(1): 96-104 doi: 10.2514/2.4854
    [39] 袁利, 王淑一, 雷拥军. 航天器姿态敏捷稳健控制方法与应用. 北京: 科学出版社, 2021.

    Yuan Li, Wang Shu-Yi, Lei Yong-Jun. Agile and Robustifying Attitude Control of Spacecraft: Methods and Applications. Beijing: Science Press, 2021.
    [40] Kojima H. Singularity analysis and steering control laws for adaptive-skew pyramid-type control moment gyros. Acta Astronautica, 2013, 85: 120-137 doi: 10.1016/j.actaastro.2012.12.019
    [41] 孙羽佳, 袁利, 雷拥军. 基于指令力矩螺旋式搜索的SGCMG奇异规避方法. 空间控制技术与应用, 2016, 42(6): 26-30

    Sun Yu-Jia, Yuan Li, Lei Yong-Jun. SGCMG singularity avoidance method based on command torque vector helix search. Aerospace Control and Application, 2016, 42(6): 26-30
    [42] 雷拥军, 姚宁, 刘洁, 赵江涛, 朱琦, 何海锋, 等. 一种基于指令力矩矢量调节的控制力矩陀螺奇异规避方法, 中国 105388902A, 2016-03

    Lei Yong-Jun, Yao Ning, Liu Jie, Zhao Jiang-Tao, Zhu Qi, He Hai-Feng, et al. A Command Torque Vector Regulation Based SGCMG Singularity Avoidance Method, CN 105388902A, March 2016
    [43] 雷拥军, 袁利, 王淑一, 田科丰. SGCMG系统的力矩指令调节及动态分配操纵方法. 宇航学报, 2019, 40(7): 794-802 doi: 10.3873/j.issn.1000-1328.2019.07.008

    Lei Yong-Jun, Yuan Li, Wang Shu-Yi, Tian Ke-Feng. A steering method with torque command adjustment and dynamic distribution for single-gimbal control moment gyro systems. Journal of Astronautics, 2019, 40(7): 794-802 doi: 10.3873/j.issn.1000-1328.2019.07.008
    [44] Creamer G, Delahunt P, Gates S, Levenson M. Attitude determination and control of Clementine during lunar mapping. Journal of Guidance, Control, and Dynamics, 1996, 19(3): 505-511 doi: 10.2514/3.21650
    [45] 周端, 申晓宁, 郭毓, 陈庆伟, 胡维礼. 基于多目标优化的挠性航天器姿态机动路径规划. 南京理工大学学报, 2012, 36(5): 846-853

    Zhou Duan, Shen Xiao-Ning, Guo Yu, Chen Qing-Wei, Hu Wei-Li. Profile planning for attitude maneuver of flexible spacecrafts based on multi-objective optimization. Journal of Nanjing University of Science and Technology, 2012, 36(5): 846-853
    [46] Zhang Y, Zhang J R. Combined control of fast attitude maneuver and stabilization for large complex spacecraft. Acta Mechanica Sinica, 2013, 29(6): 875-882 doi: 10.1007/s10409-013-0080-8
    [47] Wie B, Lu J B. Feedback control logic for spacecraft eigenaxis rotations under slew rate and control constraints. Journal of Guidance, Control, and Dynamics, 1995, 18(6): 1372-1379 doi: 10.2514/3.21555
    [48] Su W C, Drakunov S V, Ozguner U, Young K D. Sliding mode with chattering reduction in sampled data systems. In: Proceedings of the 32nd IEEE Conference on Decision and Control. San Antonio, USA: IEEE, 1993. 2452−2457
    [49] 雷拥军, 陆栋宁, 关新. 一种对地姿态重定向的机动轨迹规划及控制方法. 航天控制, 2020, 38(1): 9-16

    Lei Yong-Jun, Lu Dong-Ning, Guan Xin. A maneuver attitude trajectory planning and control method for earth remote-sensing satellite reorientations. Aerospace Control, 2020, 38(1): 9-16
    [50] Lee J F L, Yeichner J A, Matulenko R, Chang D S. Space station attitude control system. In: Proceedings of the 43rd International Astronautical Congress. Washington, USA: 1992.
    [51] 中国宇航学会. 2018–2019 航天科学技术学科发展报告. 北京: 中国科学技术出版社, 2020.

    Chinese Society of Astronautics. Report on Advances in Space Science and Technology. Beijing: China Science and Technology Press, 2020.
    [52] Zhang J, He Y Z, Zhang J J. Attitude control and momentum management of inertially oriented space station. IFAC Proceedings Volumes, 2013, 46: 1-6
    [53] 程迎坤, 孙承启, 张锦江. 空间站力矩平衡姿态和动量平衡姿态的研究. 航天控制, 2008, 26(2): 3-8

    Cheng Ying-Kun, Sun Cheng-Qi, Zhang Jin-Jiang. Study on torque equilibrium attitude and momentum equilibrium attitude of the space station. Aerospace Control, 2008, 26(2): 3-8
    [54] 刘将辉, 李海阳, 张亚坤. 空间站平均力矩平衡姿态的气动力矩影响. 国防科技大学学报, 2018, 40(5): 20-26 doi: 10.11887/j.cn.201805004

    Liu Jiang-Hui, Li Hai-Yang, Zhang Ya-Kun. Influence of air torque on average torque equilibrium attitude of space station. Journal of National University of Defense Technology, 2018, 40(5): 20-26 doi: 10.11887/j.cn.201805004
    [55] 张军, 张志方, 刘成瑞, 张锦江, 冯帅, 林瀚峥, 等. 中国空间站GNC系统设计与在轨验证. 中国科学: 技术科学, 2022, 52(9): 1355-1374 doi: 10.1360/SST-2021-0517

    Zhang Jun, Zhang Zhi-Fang, Liu Cheng-Rui, Zhang Jin-Jiang, Feng Shuai, Lin Han-Zheng, et al. Design and on-orbit verification of the guidance, navigation and control system of the China space station. Scientia Sinica Technologica, 2022, 52(9): 1355-1374 doi: 10.1360/SST-2021-0517
    [56] Flores-Abad A, Wei Z, Ma O, Pham K. Optimal control of space robots for capturing a tumbling object with uncertainties. Journal of Guidance, Control, and Dynamics, 2014, 37(6): 2014-2017 doi: 10.2514/1.G000003
    [57] Huang P F, Wang M, Meng Z J, Zhang F, Liu Z X. Attitude takeover control for post-capture of target spacecraft using space robot. Aerospace Science and Technology, 2016, 51: 171-180 doi: 10.1016/j.ast.2016.02.006
    [58] Huang P F, Wang M, Meng Z J, Zhang F, Liu Z X, Chang H T. Reconfigurable spacecraft attitude takeover control in post-capture of target by space manipulators. Journal of the Franklin Institute, 2016, 353(9): 1985-2008 doi: 10.1016/j.jfranklin.2016.03.011
    [59] 马广富, 高寒, 吕跃勇, 宋婷, 袁建平. 组合体航天器有限时间超螺旋反步姿态控制. 宇航学报, 2017, 38(11): 1168-1176 doi: 10.3873/j.issn.1000-1328.2017.11.005

    Ma Guang-Fu, Gao Han, Lv Yue-Yong, Song Ting, Yuan Jian-Ping. Super-twisting observer based finite-time backstepping attitude control for a combined spacecraft. Journal of Astronautics, 2017, 38(11): 1168-1176 doi: 10.3873/j.issn.1000-1328.2017.11.005
    [60] Han D, Huang P F, Liu X Y, Yang Y. Combined spacecraft stabilization control after multiple impacts during the capture of a tumbling target by a space robot. Acta Astronautica, 2020, 176: 24-32 doi: 10.1016/j.actaastro.2020.05.035
    [61] Huang X W, Biggs J D, Duan G R. Post-capture attitude control with prescribed performance. Aerospace Science and Technology, 2020, 96: Article No. 105572
    [62] 杨保华. 航天器制导、导航与控制. 北京: 中国科学技术出版社, 2011.

    Yang Bao-Hua. Guidance, Navigation and Control of Spacecraft. Beijing: China Science and Technology Press, 2011.
    [63] Crouch P. Spacecraft attitude control and stabilization: Applications of geometric control theory to rigid body models. IEEE Transactions on Automatic Control, 1984, 29(4): 321-331 doi: 10.1109/TAC.1984.1103519
    [64] Byrnes C I, Isidori A. On the attitude stabilization of rigid spacecraft. Automatica, 1991, 27(1): 87-95 doi: 10.1016/0005-1098(91)90008-P
    [65] 郭朝礼, 张笃周, 王淑一. 欠驱动航天器滑模速率阻尼控制. 空间控制技术与应用, 2013, 39(4): 12-17 doi: 10.3969/j.issn.1674-1579.2013.04.003

    Guo Chao-Li, Zhang Du-Zhou, Wang Shu-Yi. Sliding mode control for rate damping of underactuated spacecraft. Aerospace Control and Application, 2013, 39(4): 12-17 doi: 10.3969/j.issn.1674-1579.2013.04.003
    [66] 张洪华, 王芳, 胡锦昌, 王泽国. 欠驱动挠性航天器的全姿态控制. 宇航学报, 2015, 36(4): 419-429

    Zhang Hong-Hua, Wang Fang, Hu Jin-Chang, Wang Ze-Guo. All-attitude control for underactuated flexible spacecraft. Journal of Astronautics, 2015, 36(4): 419-429
    [67] Kim S, Kim Y. Spin-axis stabilization of a rigid spacecraft using two reaction wheels. Journal of Guidance, Control, and Dynamics, 2001, 24(5): 1046-1049 doi: 10.2514/2.4818
    [68] Lei Y J, Yuan L, Zhu Q, Wang Z G, Liu J. A steering method with multiobjective optimizing for nonredundant single-gimbal control moment gyro systems. IEEE Transactions on Industrial Electronics, 2022, 69(4): 4177-4184 doi: 10.1109/TIE.2021.3073357
    [69] 雷拥军, 袁利, 刘其睿, 刘洁. 2-SGCMGs与磁力矩器的对地姿态混合控制方法. 中国空间科学技术, 2021, 41(1): 75-83

    Lei Yong-Jun, Yuan-Li, Liu Qi-Rui, Liu Jie. An attitude hybrid control method for earth-orienting satellite systems with 2-SGCMGs and magnet torquers. Chinese Space Science and Technology, 2021, 41(1): 75-83
    [70] 胡军, 李毛毛. 航天器进入制导方法综述. 航空学报, 2021, 42(11): Article No. 525048

    Hu Jun, Li Mao-Mao. Review of spacecraft entry guidance method. Acta Aeronautica et Astronautica Sinica, 2021, 42(11): Article No. 525048
    [71] 吴宏鑫, 胡军. 特征建模理论、方法和应用. 北京: 国防工业出版社, 2019.

    Wu Hong-Xin, Hu Jun. Theory, Methods and Applications of Characteristic Modeling. Beijing: National Defense Industry Press, 2019.
    [72] 吴宏鑫, 胡军, 解永春. 基于特征模型的智能自适应控制. 合肥: 中国科学技术出版社, 2009.

    Wu Hong-Xin, Hu Jun, Xie Yong-Chun. Characteristic Model-based Intelligent Adaptive Control. Hefei: China Science and Technology Press, 2009.
    [73] 吴宏鑫. 全系数自适应控制理论及其应用. 北京: 国防工业出版社, 1990.

    Wu Hong-Xin. Theory and Applications of All Coefficient Adaptive Control. Beijing: National Defense Industry Press, 1990.
    [74] 胡军. 载人飞船全系数自适应再入升力控制. 宇航学报, 1998, 19(1): 8-12

    Hu Jun. All coefficients adaptive reentry lifting control of manned spacecraft. Journal of Astronautics, 1998, 19(1): 8-12
    [75] 解永春, 吴宏鑫. 黄金分割在自适应鲁棒控制器设计中的应用. 自动化学报, 1992, 18(2): 177-185

    Xie Yong-Chun, Wu Hong-Xin. The application of the golden section in adaptive robust controller design. Acta Automatica Sinica, 1992, 18(2): 177-185
    [76] 解永春, 胡军. 基于特征模型的智能自适应控制方法在交会对接中的应用. 系统科学与数学, 2013, 33(9): 1017-1023

    Xie Yong-Chun, Hu Jun. The application of the intelligent adaptive control method based on characteristic model in rendezvous and docking. Journal of Systems Science and Mathematical Sciences, 2013, 33(9): 1017-1023
    [77] 杨孟飞, 张高, 张伍, 彭兢, 王勇, 王晓磊, 等. 探月三期月地高速再入返回飞行器技术设计与实现. 中国科学: 技术科学, 2015, 45(2): 111-123 doi: 10.1360/N092014-00484

    Yang Meng-Fei, Zhang Gao, Zhang Wu, Peng Jing, Wang Yong, Wang Xiao-Lei, et al. Technique design and realization of the circumlunar return and reentry spacecraft of 3rd phase of Chinese Lunar exploration program. Scientia Sinica Technologica, 2015, 45(2): 111-123 doi: 10.1360/N092014-00484
    [78] 叶培建, 杨孟飞, 彭兢, 李齐, 董彦芝, 张钊, 等. 中国深空探测进入/再入返回技术的发展现状和展望. 中国科学: 技术科学, 2015, 45(3): 229-238 doi: 10.1360/N092015-00049

    Ye Pei-Jian, Yang Meng-Fei, Peng Jing, Li Qi, Dong Yan-Zhi, Zhang Zhao, et al. Review and prospect of atmospheric entry and earth reentry technology of China deep space exploration. Scientia Sinica Technologica, 2015, 45(3): 229-238 doi: 10.1360/N092015-00049
    [79] 张柏楠, 杨庆, 杨雷, 马晓兵, 黄震. 我国新一代载人飞船及其研制进展. 科学通报, 2021, 66(32): 4065-4073 doi: 10.1360/TB-2021-0228

    Zhang Bai-Nan, Yang Qing, Yang Lei, Ma Xiao-Bing, Huang Zhen. Progress on China’s new-generation manned spaceships. Chinese Science Bulletin, 2021, 66(32): 4065-4073 doi: 10.1360/TB-2021-0228
    [80] Li M M, Hu J, Huang H. A segmented and weighted adaptive predictor-corrector guidance method for the ascent phase of hypersonic vehicle. Aerospace Science and Technology, 2020, 106: Article No. 106231 doi: 10.1016/j.ast.2020.106231
    [81] Lu P. Predictor-corrector entry guidance for low-lifting vehicles. Journal of Guidance, Control, and Dynamics, 2008, 31(4): 1067-1075 doi: 10.2514/1.32055
    [82] Brunner C W, Lu P. Skip entry trajectory planning and guidance. Journal of Guidance, Control, and Dynamics, 2008, 31(5): 1210-1219 doi: 10.2514/1.35055
    [83] 水尊师, 周军, 葛致磊. 基于高斯伪谱方法的再入飞行器预测校正制导方法研究. 宇航学报, 2011, 32(6): 1249-1255 doi: 10.3873/j.issn.1000-1328.2011.06.007

    Shui Zun-Shi, Zhou Jun, Ge Zhi-Lei. On-line predictor-corrector reentry guidance law based on Gauss pseudospectral method. Journal of Astronautics, 2011, 32(6): 1249-1255 doi: 10.3873/j.issn.1000-1328.2011.06.007
    [84] 张洪波, 曾亮. 一种跳跃式返回再入的预测-校正制导方法. 飞行器测控学报, 2014, 33(1): 82-87

    Zhang Hong-Bo, Zeng Liang. A predictor-corrector guidance method for skip reentry missions. Journal of Spacecraft TT&C Technology, 2014, 33(1): 82-87
    [85] Zhang Z, Hu J. Prediction-based guidance algorithm for high-lift reentry vehicles. Science China Information Sciences, 2011, 54(3): 498-510 doi: 10.1007/s11432-011-4187-x
    [86] 胡军, 吴宏鑫, 杨鸣, 张钊, 董文强, 杨俊春. 一种基于一阶特征模型的全系数自适应控制方法, 中国 104570734B, 2015-04

    Hu Jun, Wu Hong-Xin, Yang Ming, Zhang Zhao, Dong Wen-Qiang, Yang Jun-Chun. All-coefficient Adaptive Control Method Based on One-order Characteristic Model, CN 104570734B, April 2015
    [87] 胡军. 自适应预测制导: 一种统一的制导方法. 空间控制技术与应用, 2019, 45(4): 53-63 doi: 10.3969/j.issn.1674-1579.2019.04.007

    Hu Jun. Adaptive predictive guidance: A unified guidance method. Aerospace Control and Application, 2019, 45(4): 53-63 doi: 10.3969/j.issn.1674-1579.2019.04.007
    [88] 解永春, 陈长青, 刘涛, 王敏. 航天器交会对接制导导航控制原理和方法. 北京: 国防工业出版社, 2018.

    Xie Yong-Chun, Chen Chang-Qing, Liu Tao, Wang Min. Theory and Methods of Guidance, Navigation and Control for Spacecraft Rendezvous and Docking. Beijing: National Defense Industry Press, 2018.
    [89] 解永春, 胡勇. 空间交会策略回顾及自主快速交会方案研究. 空间控制技术与应用, 2014, 40(4): 1-8 doi: 10.3969/j.issn.1674-1579.2014.04.001

    Xie Yong-Chun, Hu Yong. Reviews of space rendezvous strategy and short rendezvous profile design for autonomous spacecraft. Aerospace Control and Application, 2014, 40(4): 1-8 doi: 10.3969/j.issn.1674-1579.2014.04.001
    [90] 胡军, 解永春, 张昊, 于丹, 胡海霞, 张维瑾. 神舟八号飞船交会对接制导、导航与控制系统及其飞行结果评价. 空间控制技术与应用, 2011, 37(6): 1-5, 13 doi: 10.3969/j.issn.1674-1579.2011.06.001

    Hu Jun, Xie Yong-Chun, Zhang Hao, Yu Dan, Hu Hai-Xia, Zhang Wei-Jin. Shenzhou-8 spacecraft guidance navigation and control system and flight result evaluation for rendezvous and docking. Aerospace Control and Application, 2011, 37(6): 1-5, 13 doi: 10.3969/j.issn.1674-1579.2011.06.001
    [91] 杨震, 罗亚中, 张进. 近地快速交会调相策略设计与任务分析. 国防科技大学学报, 2015, 37(3): 61-67 doi: 10.11887/j.cn.201503011

    Yang Zhen, Luo Ya-Zhong, Zhang Jin. Analysis and design of phasing strategy for near-earth short rendezvous mission. Journal of National University of Defense Technology, 2015, 37(3): 61-67 doi: 10.11887/j.cn.201503011
    [92] 李萌, 龚胜平, 彭坤, 马晓兵. 直接优化算法在快速交会组合变轨策略中的应用. 载人航天, 2017, 23(2): 156-162 doi: 10.3969/j.issn.1674-5825.2017.02.003

    Li Meng, Gong Sheng-Ping, Peng Kun, Ma Xiao-Bing. Application of direct optimization algorithmin synthetic orbit maneuver strategy of short rendezvous. Manned Spaceflight, 2017, 23(2): 156-162 doi: 10.3969/j.issn.1674-5825.2017.02.003
    [93] 张强, 陈长青, 刘宗玉, 郝慧, 奚坤, 苏晏, 等. 天舟二号货运飞船全相位自主快速交会对接技术和在轨验证. 空间控制技术与应用, 2021, 47(5): 33-39 doi: 10.3969/j.issn.1674-1579.2021.05.005

    Zhang Qiang, Chen Chang-Qing, Liu Zong-Yu, Hao Hui, Xi Kun, Su Yan, et al. All-phase autonomous quick rendezvous and docking technology and in-orbit verification of Tianzhou-2 cargo spacecraft. Aerospace Control and Application, 2021, 47(5): 33-39 doi: 10.3969/j.issn.1674-1579.2021.05.005
    [94] 张昊, 解永春, 吴宏鑫. 交会对接光学成像敏感器光点布局求解有效性研究. 航天控制, 2008, 26(3): 44-48, 58

    Zhang Hao, Xie Yong-Chun, Wu Hong-Xin. Research on the target pattern solution validity of optical imaging sensor used in RVD. Aerospace Control, 2008, 26(3): 44-48, 58
    [95] 张昊, 石磊, 涂俊峰, 管乐鑫, 解永春. 基于交会对接CCD光学成像敏感器的双目测量算法. 空间控制技术与应用, 2011, 37(6): 66-71 doi: 10.3969/j.issn.1674-1579.2011.06.011

    Zhang Hao, Shi Lei, Tu Jun-Feng, Guan Yue-Xin, Xie Yong-Chun. A CCD optical sensor based new binocular vision measurement algorithm for rendezvous and docking. Aerospace Control and Application, 2011, 37(6): 66-71 doi: 10.3969/j.issn.1674-1579.2011.06.011
    [96] 王世新, 华宝成, 袁琦, 张良, 李明政, 赵春晖. 交会对接光学成像敏感器中合作目标的分析与设计. 空间控制技术与应用, 2020, 46(6): 56-62

    Wang Shi-Xin, Hua Bao-Cheng, Yuan Qi, Zhang Liang, Li Ming-Zheng, Zhao Chun-Hui. Analysis and design of cooperative targets for camera-type rendezvous and docking sensor. Aerospace Control and Application, 2020, 46(6): 56-62
    [97] 顾营迎, 王立, 华宝成, 刘达, 吴云, 徐云飞. 一种面向空间非合作目标位姿测量应用的三维点云滤波算法. 应用光学, 2019, 40(2): 210-216

    Gu Ying-Ying, Wang Li, Hua Bao-Cheng, Liu Da, Wu Yun, Xu Yun-Fei. 3D point cloud filtering method for pose measurement application of space non-cooperative targets. Journal of Applied Optics, 2019, 40(2): 210-216
    [98] 刘涛, 解永春. UKF稳定性研究及其在相对导航中的应用. 宇航学报, 2010, 31(3): 739-747 doi: 10.3873/j.issn.1000-1328.2010.03.019

    Liu Tao, Xie Yong-Chun. Stability analysis of UKF and its application in relative navigation. Journal of Astronautics, 2010, 31(3): 739-747 doi: 10.3873/j.issn.1000-1328.2010.03.019
    [99] 刘涛, 解永春. 一种自适应确定性采样滤波方法. 信息与控制, 2010, 39(6): 673-680

    Liu Tao, Xie Yong-Chun. Adaptive deterministic sampling filter algorithm. Information and Control, 2010, 39(6): 673-680
    [100] 刘涛, 解永春, 胡海霞. 粒子滤波及其在航天器交会对接相对导航中的应用. 空间控制技术与应用, 2011, 37(6): 19-27 doi: 10.3969/j.issn.1674-1579.2011.06.004

    Liu Tao, Xie Yong-Chun, Hu Hai-Xia. Application of particle filtering in relative navigation filter design for spacecraft. Aerospace Control and Application, 2011, 37(6): 19-27 doi: 10.3969/j.issn.1674-1579.2011.06.004
    [101] Sharma S, D’Amico S. Neural network-based pose estimation for noncooperative spacecraft rendezvous. IEEE Transactions on Aerospace and Electronic Systems, 2020, 56(6): 4638-4658 doi: 10.1109/TAES.2020.2999148
    [102] Valada A, Mohan R, Burgard W. Self-supervised model adaptation for multimodal semantic segmentation. International Journal of Computer Vision, 2020, 128(5): 1239-1285 doi: 10.1007/s11263-019-01188-y
    [103] 王颖, 解永春. 基于视线制导的空间交会停靠控制方法. 空间控制技术与应用, 2012, 38(2): 1-4, 23 doi: 10.3969/j.issn.1674-1579.2012.02.001

    Wang Ying, Xie Yong-Chun. Rendezvous and berthing control method based on line of sight guidance. Aerospace Control and Application, 2012, 38(2): 1-4, 23 doi: 10.3969/j.issn.1674-1579.2012.02.001
    [104] 陈志华, 解永春. 刚体卫星相平面控制闭环系统稳定性分析. 空间控制技术与应用, 2018, 44(1): 1-14, 29 doi: 10.3969/j.issn.1674-1579.2018.01.001

    Chen Zhi-Hua, Xie Yong-Chun. Stability analysis of the closed-loop system of a phase-plane controlled rigid satellite. Aerospace Control and Application, 2018, 44(1): 1-14, 29 doi: 10.3969/j.issn.1674-1579.2018.01.001
    [105] 胡勇, 徐李佳, 解永春. 针对失控翻滚目标航天器的交会对接控制. 字航学报, 2015, 36(1): 47-57

    Hu Yong, Xu Li-Jia, Xie Yong-Chun. Control for rendezvous and docking with a tumbling target spacecraft. Journal of Astronautics, 2015, 36(1): 47-57
    [106] 刘涛, 解永春, 王晓磊, 胡锦昌. 火星轨道交会自主导航与制导方法. 宇航学报, 2019, 40(4): 406-414 doi: 10.3873/j.issn.1000-1328.2019.04.005

    Liu Tao, Xie Yong-Chun, Wang Xiao-Lei, Hu Jin-Chang. An autonomous rendezvous navigation and guidance method in mars orbit. Journal of Astronautics, 2019, 40(4): 406-414 doi: 10.3873/j.issn.1000-1328.2019.04.005
    [107] Zhao Z M, Liu Y W, Xie B, Zhai F, Yao F, Li L. Flight result and achievement of SJ-9 technology demonstration satellite. In: Proceedings of the 64th International Astronautical Congress. Beijing, China: 2013.
    [108] 苟兴宇, 李克行, 张斌, 刘捷, 谭田, 董筠, 等. 实践九号编队飞行轨控中的姿轨耦合与推力损失研究. 空间控制技术与应用, 2013, 39(6): 1-5, 11

    Gou Xing-Yu, Li Ke-Hang, Zhang Bin, Liu Jie, Tan Tian, Dong Jun, et al. On attitude and orbit coupling and thrust loss of SJ-9 formation flying orbit control. Aerospace Control and Application, 2013, 39(6): 1-5, 11
    [109] 李克行, 苟兴宇, 张斌, 何英姿, 魏春岭, 白旭辉, 等. 一种星上相对运动状态获取方法, 中国 104765373A, 2015-07

    Li Ke-Hang, Gou Xing-Yu, Zhang Bin, He Ying-Zi, Wei Chun-Ling, Bai Xu-Hui, et al. A Method for Obtaining Satellite Relative Motion State, CN 104765373A, July 2015
    [110] 苟兴宇, 韩冬, 李克行, 张斌, 董筠, 赵键, 等. 一种航天器编队维持或绕飞撤离的控制方法, 中国 104317303A, 2015-01

    Gou Xing-Yu, Han Dong, Li Ke-Hang, Zhang Bin, Dong Jun, Zhao Jian, et al. A Control Method for Spacecraft Formation Maintenance or Orbiting Evacuation, CN 104317303A, January 2015
    [111] 陈统, 徐世杰, 李克行. 利用大气阻力的横向编队维持控制. 中国空间科学技术, 2008, 28(6): 8-13 doi: 10.3321/j.issn:1000-758X.2008.06.002

    Chen Tong, Xu Shi-Jie, Li Ke-Hang. Control strategy using atmospheric drag for along-track formation maintenance. Chinese Space Science and Technology, 2008, 28(6): 8-13 doi: 10.3321/j.issn:1000-758X.2008.06.002
    [112] 宋明轩, 邵晓巍, 刘付成, 王继河, 张德新. 基于差分气动力的J2项摄动下卫星编队构形重构研究. 航天控制, 2014, 32(4): 42-48, 61 doi: 10.3969/j.issn.1006-3242.2014.04.008

    Song Ming-Xuan, Shao Xiao-Wei, Liu Fu-Cheng, Wang Ji-He, Zhang De-Xin. Research on satellite formation reconfiguration by using differential aerodynamic forces under J2 perturbation. Aerospace Control, 2014, 32(4): 42-48, 61 doi: 10.3969/j.issn.1006-3242.2014.04.008
    [113] 范凡. 基于大气阻力微纳卫星编队轨道与姿态控制研究 [硕士论文], 国防科学技术大学, 中国, 2014

    Fan Fan. The Micro Satellite Formation and Attitude Control Based on the Atmospheric Drag [Master thesis], University of Defense Technology, China, 2014
    [114] 张亚博, 师鹏, 张皓, 赵育善. 电磁航天器编队悬停鲁棒协同控制方法. 北京航空航天大学学报, 2019, 45(2): 388-397

    Zhang Ya-Bo, Shi Peng, Zhang Hao, Zhao Yu-Shan. A robust coordinated control method for hovering of electromagnetic spacecraft formation. Journal of Beijing University of Aeronautics and Astronautics, 2019, 45(2): 388-397
    [115] 高策. 磁通钉扎作用的星间相对运动动力学与控制研究 [硕士论文], 国防科技大学, 中国, 2017

    Gao Ce. Research on Dynamics and Control of Flux-pinned Spacecraft Relative Motion [Master thesis], University of Defense Technology, China, 2017
    [116] Scharf D P, Hadaegh F Y, Ploen S R. A survey of spacecraft formation flying guidance and control. Part II: Control. In: Proceedings of the American Control Conference. Boston, USA: IEEE, 2004. 2976−2985
    [117] Mesbahi M, Hadaegh F Y. Formation flying control of multiple spacecraft via graphs, matrix inequalities, and switching. Journal of Guidance, Control, and Dynamics, 2001, 24(2): 369-377 doi: 10.2514/2.4721
    [118] Ren W. Formation keeping and attitude alignment for multiple spacecraft through local interactions. Journal of Guidance, Control, and Dynamics, 2007, 30(2): 633-638 doi: 10.2514/1.25629
    [119] Ran D C, Chen X Q, Misra A K, Xiao B. Relative position coordinated control for spacecraft formation flying with communication delays. Acta Astronautica, 2017, 137: 302-311 doi: 10.1016/j.actaastro.2017.04.011
    [120] Lasserre E, Dufour F, Bernussou J, Brousse P, Lefebvre L. A linear programming solution to the homogeneous satellite constellation station keeping. In: Proceedings of the 48th International Astronautical Congress. Turin, Italy: 1997.
    [121] 钱山, 李恒年, 张力军, 张智斌. 全球导航星座构型维持“死区”分析. 见: 第五届中国卫星导航学术年会论文集-S3 精密定轨与精密定位. 南京, 中国: 中国卫星导航学术年会组委会, 2014.

    Qian Shan, Li Heng-Nian, Zhang Li-Jun, Zhang Zhi-Bin. The station keeping dead-band budgets and analysis for GNSS constellation. In: Proceedings of the 5th China Satellite Navigation Conference-S3 Precise Orbit Determination and Positioning. Nanjing, China: Organizing Committee of China Satellite Navigation Academic Annual Meeting, 2014.
    [122] 杨晓龙, 刘忠汉. 基于覆盖性能的Walker-\delta星座构型保持. 空间控制技术与应用, 2012, 38(2): 53-57 doi: 10.3969/j.issn.1674-1579.2012.02.011

    Yang Xiao-Long, Liu Zhong-Han. Walker-\delta constellation configuration maintenance based on coverage performance. Aerospace Control and Application, 2012, 38(2): 53-57 doi: 10.3969/j.issn.1674-1579.2012.02.011
    [123] 胡松杰, 申敬松, 郇佩. 基于参考轨道的Walker星座相对相位保持策略. 空间控制技术与应用, 2010, 36(5): 45-49 doi: 10.3969/j.issn.1674-1579.2010.05.009

    Hu Song-Jie, Shen Jing-Song, Huan Pei. A relative phase-keeping strategy of Walker constellation based on reference orbit. Aerospace Control and Application, 2010, 36(5): 45-49 doi: 10.3969/j.issn.1674-1579.2010.05.009
    [124] 姜宇, 李恒年, 宝音贺西. Walker星座摄动分析与保持控制策略. 空间控制技术与应用, 2013, 39(2): 36-41 doi: 10.3969/j.issn.1674-1579.2013.02.007

    Jiang Yu, Li Heng-Nian, Baoyin He-Xi. On perturbation and orbital maintenance control strategy for Walker constellation. Aerospace Control and Application, 2013, 39(2): 36-41 doi: 10.3969/j.issn.1674-1579.2013.02.007
    [125] 李恒年, 李济生, 焦文海. 全球星摄动运动及摄动补偿运控策略研究. 宇航学报, 2010, 31(7): 1756-1761 doi: 10.3873/j.issn.1000-1328.2010.07.009

    Li Heng-Nian, Li Ji-Sheng, Jiao Wen-Hai. Analyzing perturbation motion and studying configuration maintenance strategy for Compass-M navigation constellation. Journal of Astronautics, 2010, 31(7): 1756-1761 doi: 10.3873/j.issn.1000-1328.2010.07.009
    [126] 孙泽洲, 陈百超, 贾阳, 袁宝峰, 刘国强, 马静雅, 等. 天问一号火星巡视探测技术. 中国科学: 技术科学, 2022, 52(2): 214-225 doi: 10.1360/SST-2021-0487

    Sun Ze-Zhou, Chen Bai-Chao, Jia Yang, Yuan Bao-Feng, Liu Guo-Qiang, Ma Jing-Ya, et al. The Tianwen-1 roving exploration technology for the Martian surface. Scientia Sinica Technologica, 2022, 52(2): 214-225 doi: 10.1360/SST-2021-0487
    [127] 袁利, 黄煌. 空间飞行器智能自主控制技术现状与发展思考. 空间控制技术与应用, 2019, 45(4): 7-18 doi: 10.3969/j.issn.1674-1579.2019.04.002

    Yuan Li, Huang Huang. Current trends of spacecraft intelligent autonomous control. Aerospace Control and Application, 2019, 45(4): 7-18 doi: 10.3969/j.issn.1674-1579.2019.04.002
    [128] 袁利. 面向不确定环境的航天器智能自主控制技术. 宇航学报, 2021, 42(7): 839-849 doi: 10.3873/j.issn.1000-1328.2021.07.004

    Yuan Li. Spacecraft intelligent autonomous control technology toward uncertain environment. Journal of Astronautics, 2021, 42(7): 839-849 doi: 10.3873/j.issn.1000-1328.2021.07.004
    [129] 袁利, 姜甜甜. 航天器威胁规避智能自主控制技术研究综述. 自动化学报, DOI: 10.16383/j.aas.c211027

    Yuan Li, Jiang Tian-Tian. Review on intelligent autonomous control for spacecraft confronting orbital threats. Acta Automatica Sinica, DOI: 10.16383/j.aas.c211027
    [130] 李茂登, 黄翔宇, 郭敏文, 徐超, 魏春岭, 张晓文, 等. 一种递归多子样大动态惯性导航方法, 中国 111351483A, 2020-06

    Li Mao-Deng, Huang Xiang-Yu, Guo Min-Wen, Xu Chao, Wei Chun-Ling, Zhang Xiao-Wen, et al. A Recursive Multi-sample Large Dynamic Inertial Navigation Method, CN 111351483A, June 2020
    [131] 张洪华, 李骥, 轶峰, 黄翔宇. 嫦娥三号着陆器动力下降的自主导航. 控制理论与应用, 2014, 31(12): 1686-1694 关 doi: 10.7641/CTA.2014.40795

    Zhang Hong-Hua, Li Ji, Guan Yi-Feng, Huang Xiang-Yu. Autonomous navigation for powered descent phase of Chang’E-3 lunar lander. Control Theory & Applications, 2014, 31(12), 1686-1694 doi: 10.7641/CTA.2014.40795
    [132] 吴伟仁, 李骥, 黄翔宇, 张洪华, 王大轶, 张哲. 惯导/测距/测速相结合的安全软着陆自主导航方法. 宇航学报, 2015, 36(8): 893-899

    Wu Wei-Ren, Li Ji, Huang Xiang-Yu, Zhang Hong-Hua, Wang Da-Yi, Zhang Zhe. INS/Rangefinder/Velocimetry based autonomous navigation method for safe landing. Journal of Astronautics, 2015, 36(8): 893-899
    [133] 李茂登, 黄翔宇, 徐超, 郭敏文, 胡锦昌, 赵宇, 等. 天问一号火星探测器EDL过程自主导航技术. 宇航学报, 2022, 43(1): 11-20 doi: 10.3873/j.issn.1000-1328.2022.01.002

    Li Mao-Deng, Huang Xiang-Yu, Xu Chao, Guo Min-Wen, Hu Jin-Chang, Zhao Yu, et al. Autonomous navigation technology of Tianwen-1 Mars probe during EDL process. Journal of Astronautics, 2022, 43(1): 11-20 doi: 10.3873/j.issn.1000-1328.2022.01.002
    [134] Li M D, Huang X Y, Wang D Y, Xu C, Guo M W, Hu J C, et al. Radar-updated inertial landing navigation with online initialization. IEEE Transactions on Aerospace and Electronic Systems, 2020, 56(5): 3360-3374 doi: 10.1109/TAES.2020.2987405
    [135] Li M D, Huang X Y, Xu C, Guo M W, Hu J C, Hao C, et al. Velocimeter-aided attitude estimation for Mars autonomous landing: Observability analysis and filter algorithms. IEEE Transactions on Aerospace and Electronic Systems, 2022, 58(1): 451-463 doi: 10.1109/TAES.2021.3103254
    [136] 张洪华, 梁俊, 黄翔宇, 赵宇, 王立, 关轶峰, 等. 嫦娥三号自主避障软着陆控制技术. 中国科学: 技术科学, 2014, 44(6): 559-568 doi: 10.1360/092014-51

    Zhang Hong-Hua, Liang Jun, Huang Xiang-Yu, Zhao Yu, Wang Li, Guan Yi-Feng, et al. Autonomous hazard avoidance control for Chang’E-3 soft landing. Scientia Sinica Technologica, 2014, 44(6): 559-568 doi: 10.1360/092014-51
    [137] 张洪华, 关轶峰, 程铭, 李骥, 于萍, 张晓文, 等. 嫦娥四号着陆器制导导航与控制系统. 中国科学: 技术科学, 2019, 49(12): 1418-1428

    Zhang Hong-Hua, Guan Yi-Feng, Cheng Ming, Li Ji, Yu Ping, Zhang Xiao-Wen, et al. Guidance navigation and control for Chang’E-4 lander. Scientia Sinica Technologica, 2019, 49(12): 1418-1428
    [138] Hu J C, Huang X Y, Li M D, Guo M W, Xu C, Zhao Y, et al. Entry vehicle control system design for the Tianwen-1 mission. Astrodynamics, 2022, 6(1): 27-37 doi: 10.1007/s42064-021-0124-y
    [139] 张洪华, 关轶峰, 黄翔宇, 李骥, 赵宇, 于萍, 等. 嫦娥三号着陆器动力下降的制导导航与控制. 中国科学: 技术科学, 2014, 44(4): 377-384 doi: 10.1360/092014-43

    Zhang Hong-Hua, Guan Yi-Feng, Huang Xiang-Yu, Li Ji, Zhao Yu, Yu Ping, et al. Guidance navigation and control for Chang’E-3 powered descent. Scientia Sinica Technologica, 2014, 44(4): 377-384 doi: 10.1360/092014-43
    [140] 李骥, 张洪华, 张晓文, 关轶峰. 载人月球软着陆GNC技术研究. 载人航天, 2020, 26(6): 733-740, 750 doi: 10.3969/j.issn.1674-5825.2020.06.009

    Li Ji, Zhang Hong-Hua, Zhang Xiao-Wen, Guan Yi-Feng. Research on GNC technology for crewed lunar soft landing. Manned Spaceflight, 2020, 26(6): 733-740, 750 doi: 10.3969/j.issn.1674-5825.2020.06.009
    [141] Zhang H H, Li J, Wang Z G, Guan Y F. Guidance navigation and control for Chang’E-5 powered descent. Space: Science & Technology, 2021, 2021: Article No. 9823609
    [142] Huang X Y, Li M D, Wang X L, Hu J C, Zhao Y, Guo M W, et al. The Tianwen-1 guidance, navigation, and control for Mars entry, descent, and landing. Space: Science & Technology, 2021, 2021: Article No. 9846185
    [143] Li J, Wang D Y. Autonomous positioning and orientating for Lunar launch. In: Proceedings of the 62nd International Astronautical Congress. Cape Town, South Africa: 2011. 5195−5202
    [144] 张洪华, 李骥, 于萍, 关轶峰, 王磊, 王志文, 等. 嫦娥五号月面起飞上升制导导航与控制技术. 中国科学: 技术科学, 2021, 51(8): 921-937 doi: 10.1360/SST-2021-0102

    Zhang Hong-Hua, Li Ji, Yu Ping, Guan Yi-Feng, Wang Lei, Wang Zhi-Wen, et al. Guidance navigation and control technology for the lunar ascent vehicle of the Chang’E-5 mission. Scientia Sinica Technologica, 2021, 51(8): 921-937 doi: 10.1360/SST-2021-0102
    [145] 李骥, 张洪华, 关轶峰, 张晓文. 主发动机故障下的月面上升应急制导策略. 见: 深空探测技术专业委员会第十六届学术年会. 青岛, 中国: 2019.

    Li Ji, Zhang Hong-Hua, Guan Yi-Feng, Zhang Xiao-Wen. Emergency guidance strategy for lunar surface ascent under main engine failure. In: Proceedings of the 16th Committee of Deep Space Exploration Technology Annual Academic Conference. Qingdao, China: 2019.
    [146] 杨孟飞, 贾阳, 陈建新. 月球巡视探测器系统研究. 空间控制技术与应用, 2008, 34(3): 3-6, 36 doi: 10.3969/j.issn.1674-1579.2008.03.001

    Yang Meng-Fei, Jia Yang, Chen Jian-Xin. Research on system design of lunar rover. Aerospace Control and Application, 2008, 34(3): 3-6, 36 doi: 10.3969/j.issn.1674-1579.2008.03.001
    [147] 邢琰, 魏春岭, 汤亮, 姜甜甜, 胡勇, 黄煌, 等. 地外巡视探测无人系统自主感知与操控技术发展综述. 空间控制技术与应用, 2021, 47(6): 1-8 doi: 10.3969/j.issn.1674-1579.2021.06.001

    Xing Yan, Wei Chun-Ling, Tang Liang, Jiang Tian-Tian, Hu Yong, Huang Huang, et al. Development of autonomous sensing and control technology for extraterrestrial mobile exploration unmanned systems. Aerospace Control and Application, 2021, 47(6): 1-8 doi: 10.3969/j.issn.1674-1579.2021.06.001
    [148] 陈建新, 邢琰, 李志平, 毛晓艳, 滕宝毅, 刘祥, 等. 祝融号火星车自主环境感知与避障技术. 中国科学: 技术科学, 2022, 52(8): 1186-1197 doi: 10.1360/SST-2022-0045

    Chen Jian-Xin, Xing Yan, Li Zhi-Ping, Mao Xiao-Yan, Teng Bao-Yi, Liu Xiang, et al. Autonomous environment perception and obstacle avoidance technologies of Zhurong Mars rover. Scientia Sinica Technologica, 2022, 52(8): 1186-1197 doi: 10.1360/SST-2022-0045
    [149] 陈建新, 邢琰, 滕宝毅, 毛晓艳, 刘祥, 贾永, 等. 嫦娥三号巡视器GNC及地面试验技术. 中国科学: 技术科学, 2014, 44(5): 461-469 doi: 10.1360/092014-48

    Chen Jian-Xin, Xing Yan, Teng Bao-Yi, Mao Xiao-Yan, Liu Xiang, Jia Yong, et al. Guidance, navigation and control technologies of Chang’E-3 Lunar rover. Scientia Sinica Technologica, 2014, 44(5): 461-469 doi: 10.1360/092014-48
    [150] Ding L, Gao H B, Deng Z Q, Nagatani K, Yoshida K. Experimental study and analysis on driving wheels’ performance for planetary exploration rovers moving in deformable soil. Journal of Terramechanics, 2011, 48(1): 27-45 doi: 10.1016/j.jterra.2010.08.001
    [151] 李楠, 高海波, 吕凤天, 丁亮, 刘振, 于海涛, 等. 车辙图像频域分析及星球车车轮滑转率估计方法. 宇航学报, 2016, 37(11): 1356-1364 doi: 10.3873/j.issn.1000-1328.2016.11.010

    Li Nan, Gao Hai-Bo, Lv Feng-Tian, Ding Liang, Liu Zhen, Yu Hai-Tao, et al. Wheel trace imprint image frequency domain analysis and rover wheel slip ratio estimation. Journal of Astronautics, 2016, 37(11): 1356-1364 doi: 10.3873/j.issn.1000-1328.2016.11.010
    [152] Gonzalez R, Chandler S, Apostolopoulos D. Characterization of machine learning algorithms for slippage estimation in planetary exploration rovers. Journal of Terramechanics, 2019, 82: 23-34 doi: 10.1016/j.jterra.2018.12.001
    [153] Cunningham C, Nesnas I A, Whittaker W L. Improving slip prediction on Mars using thermal inertia measurements. Autonomous Robots, 2019, 43(2): 503-521 doi: 10.1007/s10514-018-9796-4
    [154] 邢琰, 刘祥, 滕宝毅, 毛晓艳. 月球表面巡视探测自主局部避障规划. 控制理论与应用, 2019, 36(12): 2042-2046

    Xing Yan, Liu Xiang, Teng Bao-Yi, Mao Xiao-Yan. Autonomous local obstacle avoidance path planning of Lunar surface exploration rovers. Control Theory & Applications, 2019, 36(12): 2042-2046
    [155] 邢琰, 滕宝毅, 刘祥, 毛晓艳. 月球表面巡视探测GNC技术. 空间科学学报, 2016, 36(2): 196-201 doi: 10.11728/cjss2016.02.196

    Xing Yan, Teng Bao-Yi, Liu Xiang, Mao Xiao-Yan. Guidance, navigation and control technology for Lunar surface exploration. Chinese Journal of Space Science, 2016, 36(2): 196-201 doi: 10.11728/cjss2016.02.196
    [156] 董士伟, 侯欣宾, 王薪. 空间太阳能电站微波能量反向波束控制技术. 中国空间科学技术, 2022, 42(5): 91-102 doi: 10.16708/j.cnki.1000-758X.2022.0070

    Dong Shi-Wei, Hou Xin-Bin, Wang Xin. Retro-directive microwave power beam steering technology for space solar power station. Chinese Space Science and Technology, 2022, 42(5): 91-102 doi: 10.16708/j.cnki.1000-758X.2022.0070
    [157] 侯欣宾, 王立, 张兴华, 周璐. 多旋转关节空间太阳能电站概念方案设计. 宇航学报, 2015, 36(11): 1332-1338 doi: 10.3873/j.issn.1000-1328.2015.11.016

    Hou Xin-Bin, Wang Li, Zhang Xing-Hua, Zhou Lu. Concept design on multi-rotary joints SPS. Journal of Astronautics, 2015, 36(11): 1332-1338 doi: 10.3873/j.issn.1000-1328.2015.11.016
    [158] Roulette J. OneWeb, SpaceX satellites dodged a potential collision in orbit [Online], available: https://www.theverge.com/2021/4/9/22374262/onewebspacex-satellites-dodged-potential-collision-orbit-spaceforce, August 17, 2022
    [159] European Space Policy Institute. Towards a European Approach to Space Traffic Management, ESPI Report 71, European Space Policy Institute, Austria, 2020
    [160] Araguz C, Bou-Balust E, Alarcón E. Applying autonomy to distributed satellite systems: Trends, challenges, and future prospects. Systems Engineering, 2018, 21(5): 401-416 doi: 10.1002/sys.21428
    [161] Vassev E, Sterritt R, Rouff C, Hinchey M. Swarm technology at NASA: Building resilient systems. IT Professional, 2012, 14(2): 36-42 doi: 10.1109/MITP.2012.18
    [162] Sterritt R, Rouff C A, Hinchey M G, Rash J L, Truszkowski W. Next generation system and software architectures: Challenges from future NASA exploration missions. Science of Computer Programming, 2006, 61(1): 48-57 doi: 10.1016/j.scico.2005.11.005
    [163] Agle D C. NASA will inspire world when it returns Mars samples to Earth in 2033 [Online], available: https://www.nasa.gov/press-release/nasa-will-inspire-world-when-it-returns-mars-samples-to-earth-in-2033, October 8, 2022
    [164] 李林峰, 解永春. 空间机器人操作: 一种多任务学习视角. 中国空间科学技术, 2022, 42(3): 10-24

    Li Lin-Feng, Xie Yong-Chun. Space robotic manipulation: A multi-task learning perspective. Chinese Space Science and Technology, 2022, 42(3): 10-24
  • 期刊类型引用(9)

    1. 张辉,杜瑞,钟杭,曹意宏,王耀南. 电力设施多模态精细化机器人巡检关键技术及应用. 自动化学报. 2025(01): 20-42 . 本站查看
    2. 陈竑宇,陈提. 挠性航天器姿态动力学数据驱动辨识与控制. 力学学报. 2024(02): 433-445 . 百度学术
    3. 王路桥,李青山,吴磊,王璐,杨晓龙,李晓锋. 卫星成像任务指令序列自适应生成方法研究. 宇航学报. 2024(07): 1123-1134 . 百度学术
    4. 于洁,乔德治,王华强. 我国深空探测器制导导航与控制技术发展. 航天器工程. 2024(06): 92-102 . 百度学术
    5. 于洁,张洪华,李骥,王志文,张录晨,关轶峰,张晓文,李林峰,孙国健. 嫦娥六号月球背面自主起飞方案设计. 空间控制技术与应用. 2024(06): 12-23 . 百度学术
    6. 姜斌,孟庆开,杨浩. 航天器姿轨控制研究综述:微分几何控制方法. 控制与决策. 2023(08): 2079-2092 . 百度学术
    7. 牛书,苏萌,张晓佳,王卓骁. “仰望一号”太空望远镜在轨综合应用. 空间碎片研究. 2023(02): 13-20 . 百度学术
    8. 刘丰瑞,颜格,张晓龙,张文明,王国鹏. 基于深度强化学习的动基座双自由度系统动力学控制方法. 动力学与控制学报. 2023(10): 26-33 . 百度学术
    9. 贾玉鑫,贾英民. 空间机器人目标捕获的自适应零反作用控制. 宇航学报. 2023(12): 1894-1904 . 百度学术

    其他类型引用(8)

  • 加载中
图(1)
计量
  • 文章访问数:  5182
  • HTML全文浏览量:  794
  • PDF下载量:  767
  • 被引次数: 17
出版历程
  • 收稿日期:  2022-10-09
  • 录用日期:  2022-12-09
  • 网络出版日期:  2023-02-01
  • 刊出日期:  2023-03-20

目录

/

返回文章
返回