中医舌象分割技术研究进展: 方法、性能与展望

卢运西; 李晓光; 张辉; 张菁; 卓力

doi:10.16383/j.aas.c180807

文章导航 > 自动化学报 > 2021 > 47(5): 1005-1016

李公平, 陆耀, 王子建, 吴紫薇, 汪顺舟. 基于模糊核估计的图像盲超分辨率神经网络. 自动化学报, 2023, 49(10): 2109−2121 doi: 10.16383/j.aas.c200987

引用本文:

卢运西, 李晓光, 张辉, 张菁, 卓力. 中医舌象分割技术研究进展: 方法、性能与展望.自动化学报, 2021, 47(5): 1005-1016 doi: 10.16383/j.aas.c180807

Li Gong-Ping, Lu Yao, Wang Zi-Jian, Wu Zi-Wei, Wang Shun-Zhou. Blurred image blind super-resolution network via kernel estimation. Acta Automatica Sinica, 2023, 49(10): 2109−2121 doi: 10.16383/j.aas.c200987

Citation:

Lu Yun-Xi, Li Xiao-Guang, Zhang Hui, Zhang Jing, Zhuo Li. Review on tongue image segmentation technologies for traditional Chinese medicine: methodologies, performances and prospects. Acta Automatica Sinica, 2021, 47(5): 1005-1016 doi: 10.16383/j.aas.c180807

李公平, 陆耀, 王子建, 吴紫薇, 汪顺舟. 基于模糊核估计的图像盲超分辨率神经网络. 自动化学报, 2023, 49(10): 2109−2121 doi: 10.16383/j.aas.c200987

引用本文:

卢运西, 李晓光, 张辉, 张菁, 卓力. 中医舌象分割技术研究进展: 方法、性能与展望.自动化学报, 2021, 47(5): 1005-1016 doi: 10.16383/j.aas.c180807

Citation:

中医舌象分割技术研究进展: 方法、性能与展望

doi: 10.16383/j.aas.c180807

卢运西^{1, 2,},
李晓光^{1, 2, ,},
张辉^{1, 2,},
张菁^{1, 2,},
卓力^{1, 2, 3,}

1.
北京工业大学信号与信息处理研究室北京 100124
2.
北京工业大学信息学部微电子学院北京 100124
3.
北京电动车辆协同创新中心北京 100081

基金项目:

国家自然科学基金面上项目 61871006

详细信息

作者简介:
卢运西  北京工业大学计算机技术专业硕士研究生. 2015年获得北京工商大学信息工程系学士学位. 主要研究方向为图像处理和模式识别. E-mail: yunxilu@emails.bjut.edu.cn

张辉  北京工业大学信息学部讲师. 2010年获得北京理工大学信号与信息处理专业博士学位. 主要研究方向为计算机视觉, 机器学习在多媒体内容分析、视觉追踪、目标检测中的应用. E-mail: huizhang@bjut.edu.cn

张菁  北京工业大学教授. 2008年获得北京工业大学博士学位. 美国德州大学圣安东尼奥分校计算机科学系访问学者. 主要研究方向为图像处理, 图像识别, 图像检索. E-mail: zhj@bjut.edu.cn

卓力  北京工业大学教授. 1992年获得电子科技大学无线电技术系工学学士学位, 1998年和2004年分别获得东南大学信号与信息处理专业硕士学位和北京工业大学模式识别与智能系统专业博士学位. 主要研究方向为图像/视频编码和传输, 多媒体内容分析, 多媒体信息安全. E-mail: zhuoli@bjut.edu.cn

通讯作者:
李晓光北京工业大学副教授. 2003年于北京工业大学电子与信息工程专业获得学士学位, 2008年获得北京工业大学博士学位. 主要研究方向为计算机视觉/图像增强, 图像复原. 本文通信作者. E-mail: lxg@bjut.edu.cn

计量
- 文章访问数: 1467
- HTML全文浏览量: 1020
- PDF下载量: 387
- 被引次数: 8
出版历程
- 收稿日期: 2018-12-05
- 录用日期: 2019-02-13
- 刊出日期: 2021-05-21

Review on Tongue Image Segmentation Technologies for Traditional Chinese Medicine: Methodologies, Performances and Prospects

LU Yun-Xi^{1, 2
,},
LI Xiao-Guang^{1, 2
, ,},
ZHANG Hui^{1, 2
,},
ZHANG Jing^{1, 2
,},
ZHUO Li^{1, 2, 3
,}

1.
Beijing Key Laboratory of Computational Intelligence and Intelligent System, Beijing University of Technology, Beijing 100124
2.
College of Microelectronics, Faculty of Information Technology, Beijing University of Technology, Beijing 100124
3.
Beijing Collaborative Innovation Center of Electric Vehicles, Beijing 100081

Funds:

National Natural Science Foundation of China 61871006

More Information

Author Bio:
LU Yun-Xi  Master student in computer science and technology at Beijing University of Technology. He received his bachelor degree from the Department of information engineering at Beijing Technology and Business University in 2015. His research interest covers image processing and pattern recognition

ZHANG Hui  Lecturer at the Faculty of Information, Beijing University of Technology. He received his Ph. D. degree in signal and information processing from Beijing Institute of Technology in 2010. His research interest covers computer vision, and machine learning techniques applied to multimedia content analysis, visual tracking and object detection

ZHANG Jing  Professor at Beijing University of Technology, visiting scholar in the Department of Computer Science, University of Texas at San Antonio, USA. She received her Ph. D. degree from Beijing University of Technology in 2008. Her research interest covers image processing, image recognition, and image retrieval

ZHUO Li  Professor at Beijing University of Technology. She received her bachelor degree in radio technology from University of Electronic Science and Technology in 1992, master degree in signal and information processing from Southeast University in 1998, and Ph. D. degree in pattern recognition and intellectual system from Beijing University of Technology in 2004. Her research interest covers image/video coding and transmission, multimedia content analysis, and multimedia information security

Corresponding author: LI Xiao-Guang Associate professor at Beijing University of Technology. He received his bachelor degree in electronic and information engineering from Beijing University of Technology in 2003. He received his Ph. D. degree from Beijing University of Technology in 2008. His research interest covers computer vision, image enhancement, and image restoration. Corresponding author of this paper

摘要

摘要: 中医舌诊的客观化、定量化研究是中医现代化发展中的重要课题. 数字化采集到的舌图像包括舌体及部分面部区域, 为了便于后续舌象自动分析, 需要首先将舌体部分从图像中分割出来, 分割效果将直接影响后续舌象特征分析的准确性. 基于传统方法的舌象分割技术虽然取得了很大进展, 但其性能仅能达到半自动分割, 对较难分割的图像往往需要借助人机交互来完成. 近年来, 深度学习技术在图像处理及计算机视觉等多个领域取得了突破, 其在图像语义分割任务中也取得了远超传统方法的进展. 基于深度学习的舌象分割技术已经基本实现了全自动的鲁棒分割. 本文首先从传统分割方法和基于深度学习的分割方法两方面对中医舌象分割技术发展中的主要方法进行综述; 其次, 采用我们收集的舌象数据库对典型的方法进行性能评估, 并对不同舌象分割方法的特点进行分析与讨论. 最后, 对中医舌图像分割方法潜在的发展方向进行了展望.
- 中医舌图像 /
- 语义分割 /
- 迁移学习 /
- 性能评估
Abstract: The objectification and quantitative analysis of tongue diagnosis is an important topic in the development of traditional Chinese medicine (TCM) modernization. The digitally acquired tongue images include the tongue and part of the face region. In order to facilitate the automatic analysis of the tongue image, the tongue needs to be segmented from the whole image, and the segmentation results will directly affect the accuracy of the tongue image feature analysis. Although traditional methods of tongue-image segmentation has made great progress, their performance can only achieve semi-automatic segmentation. There are images that difficult to segment perfectly without human-computer interaction. In recent years, with the breakthrough of deep learning technology in the field of image processing and computer vision, it has achieved far more performance than traditional methods in the semantic segmentation tasks. The deep-learning based tongue-image segmentation technologies have achieved fully automatic robust segmentation. This survey gives a detailed overview of the history, state of the art, and typical methods in this domain. Firstly, the typical segmentation methods are presented. Then, they are used for migration learning and network testing based on our self-built tongue image database. In addition, this paper analyzes the characteristics of these segmentation methods and obtains the advantages and disadvantages of them. Finally, this paper summarizes the methods of Chinese medicine tongue image segmentation, and discussed to the development direction.
- Chinese medicine tongue image /
- semantic segmentation /
- transfer learning /
- performance evaluation
Recommended by Associate Editor LIU Cheng-Lin
注释:

1) 本文责任编委刘成林

HTML全文

表面肌电信号(Surface electromyography, sEMG)是由运动关联肌肉的运动单元动作电位(Motor unit action potential, MUAP)沿着肌纤维方向传播, 在人体皮肤表面形成的叠加电信号. 该信号直接反映了引起肢体运动的肌肉收缩状态, 可从中解码出运动直接关联意图, 其中蕴含丰富的肌肉收缩力、关节力矩等信息, 广泛应用于识别数十种肢体状态或预测关节连续信息^[1]; sEMG相对于刺入式肌电信号(Intramuscular EMG, iEMG)而言, 采集方式简单, 易于构建集成系统和开发可穿戴设备.

因此, sEMG广泛应用于助力机器人、康复机器人与智能假肢等系统中, 在人机协作型机器人中也逐渐成为研究热点^[2-3]. 与传统的程式控制机器人交互方式相比, 基于sEMG的人机交互方式赋予了机器人智能性与认知能力, 具有主动感知人行为意图的能力, 有利于实现人机的自然、直觉与准确交互. 尤其对残疾人而言, 肌电假肢自然直觉的控制方式, 能够极大地提高他们的生活质量.

为了满足不同场景下的人机交互需求, 基于sEMG的人体意图识别方法, 从起初基于幅值的阈值判别法, 慢慢发展为基于模式识别和机器学习的研究思路, 其主要遵从有监督学习的基本范式, 如图1所示. 其处理流程一般包含: 离线的模型训练和在线的意图识别. 第1阶段如该图的虚线箭头所示, 首先要求用户根据实验场景需求, 获取已知动作标签对应的肌电信号数据, 经数据预处理和特征提取等环节, 肌电信号特征与动作标签共同完成模型的训练. 而在第2阶段的在线意图识别中, 已经训练完成的识别模型对在线的肌电信号进行同样数据预处理和特征提取等环节, 最后对输入的肌电信号输出识别结果.

图 1 基于监督学习的sEMG识别模型训练与测试框架

Fig. 1 The training and testing framework of sEMG recognition model based on supervised learning

下载: 全尺寸图片幻灯片

依据识别模型的输出类型可分为两类问题: 离散动作分类和连续运动估计. 在离散动作分类识别方面, 由起初的张手和闭合的二分类问题, 逐渐发展成对几十种手部/腕部动作识别^[4-5]; 针对其中10种左右的常见手势识别, 其基本识别精度高达90%. 在连续运动估计方面, 对人体上/下肢多关节的角度估计误差约为5° 或更低^[6-7].

采用阈值判别法或模式识别方法的一个基本假设, 即训练集与测试集符合相同的分布. 然而在实际日常生活的肌电交互过程中, 往往会存在多种差异或干扰, 造成肌电信号的训练集与测试集的分布明显不同, 最终导致肌电识别准确性低、交互效果差^[8]. 目前大部分比较好的识别结果往往来自于无干扰情况或实验室理想环境, 未充分考虑肌电交互系统在日常使用中的潜在差异或干扰. 相对于实验室的理想环境, 本文将肌电系统在实际中可能涉及到的差异或干扰统称为“非理想因素”, 存在“非理想因素”的日常环境即为“非理想条件”. 这些非理想因素包括: 电极偏移、个体性差异、肌肉疲劳、姿态干扰、其他干扰或多种因素的综合干扰.

前期已有学者总结了sEMG的一般处理方法或应用场景, 多侧重在理想场景或无干扰的情况下如何识别更多类别, 通过对比分析不同特征处理、降维方法和识别模型等环节, 以提高肌电识别的精度和准确性^[1]; 对目前大量克服单个干扰的研究, 鲜有文献总结肌电系统鲁棒性方面的研究现状和进展, 更缺乏对实际应用中存在的诸多干扰因素给出应对方案的归纳和建设性的技术展望.

因此, 本文首先综述了在各种非理想条件中非理想因素干扰的影响程度或性质, 并总结归纳了目前研究针对各个干扰的消除与克服方法; 然后整体性讨论了各个非理想因素之间的耦合性和过渡性, 以及目前研究中存在的主要问题; 最后本文从构建统一的数据集测试平台等作为切入点, 对未来该领域的研究内容提出了一些展望, 为进一步推广肌电交互系统提供切实可行的技术方案.

1. 非理想条件下的干扰因素

本节主要针对肌电识别系统的准确性和鲁棒性问题, 分别从肌电采集技术的差异性和源于人的差异性两方面综述了相关干扰因素. 前者主要表现为电极偏移的干扰, 后者包括人与人之间的个体性差异, 以及源自人体内部的肌肉疲劳、肢体姿态等干扰.

1.1 电极偏移

诸多非理想场景下, 电极偏移是其中较为普遍出现的干扰因素之一, 主要源于电极或肌电假肢接受腔多次粘贴、固定后的位置不完全一致. 对使用者而言, 一方面严格要求与之前相同的粘贴位置, 既不现实且增加使用难度; 另一方面, 每次重新粘贴肌电电极或再次穿戴肌电假肢后, 重新获取大量有监督标签下的训练数据, 重新训练分类模型, 也比较费时费力. 这些方式都对用户不友好, 造成使用门槛过高, 或因训练时间过长而增加学习负担, 最终放弃使用肌电交互系统或假肢.

电极偏移最根本性的影响, 即偏移前后同一电极测量的肌肉位置不同, 导致特征分布明显不同. 由于各通道肌电信号变化而引起的特征空间分布变化, 传统基于模式识别方法的固定模型表现较差, 大大降低了肌电识别系统的准确性.

Hudgins等^[9]最早利用单通道的差分电极用于识别4类动作, 针对电极偏移的精度影响开展了实验性探究, 实验结果表明在假肢固定接受腔小范围内的偏移(小于1 cm)时, 电极偏移对精度影响不大, 而当偏移距离变大时会明显降低肌电识别精度. Stango等^[10]利用高密度表面肌电传感器(High-density sEMG, HD-sEMG), 研究了不同位置下的肌电信号空间相关性和受电极干扰的影响程度, 表示为

$$ 2\gamma \left(x,h\right)={\rm{E}}\left\{{\left[Z\left(x\right)-Z\left(x+h\right)\right]}^{2}\right\} $$

(1)

其中, E(·)表示数学期望, $ Z\left(x\right) $和$ Z\left(x+h\right) $表示两个随机位置处的采集结果, $ h $表示两个位置之间的空间距离, $ \gamma (·) $定义为一种空间分布结果的变异函数(Variogram).

大量相关研究更加细致地对比了在肌纤维横向、纵向、旋转等方向或距离维度上的干扰程度, 主要研究结果表明: 1)在电极布局上, 平行于肌纤维方向的差分电极更容易捕获准确的肌电信号, 而非垂直于肌纤维方向(即, 沿着肌肉方向固定电极, 目前已成为该领域的一般做法); 2)平行方向上的电极偏移干扰效应小于垂直方向偏移干扰; 3)电极与肌肉的接触面积越大, 越有利于提高肌电识别准确率和保证系统鲁棒性^[11–14].

尽管假肢的接受腔在一定程度上能通过穿戴方式保证小范围的电极偏移, 但在实验室和日常条件下, 涉及的电极类型或偏移形式多种多样, 如离散稀疏单通道肌电电极, 类似于Myo肌电手环类的环形多通道电极和高密度表面肌电电极HD-sEMG^[13–15] (如图2所示). 因此, 在诸多实际使用场景中, 肌电电极偏移现象是一个易出现且影响较大的干扰因素.

图 2 不同电极的偏移形式

Fig. 2 The offset form of different electrodes

下载: 全尺寸图片幻灯片

因此, 为了克服电极偏移引起的识别精度下降和系统鲁棒性降低问题, 按照如图1所示肌电识别框架内的关键环节, 分别探讨在数据、特征和模型等不同环节内用于消除或解决电极偏移干扰问题的方法.

1) 融合不同偏移位置下的多模数据. 在有监督学习的模型训练中, 一方面可以增加训练数据的数量, 通过引入更多电极测量更多或更精细的肌肉位置, 这种方式通过丰富训练数据集或包含更多电极场景, 来拓展模型的覆盖能力或泛化性能. Hargrove等^{[13, 16]}提出一种模型训练策略, 采集所有电极偏移位置上的数据用于模型训练, 相对于一般模型训练方式提高了10%的识别精度. He等^[12]利用HD-sEMG采集系统, 实验表明多通道相对于少通道而言, 更有利于提高干扰下的肌电识别精度, 32通道的肌电信号在电极偏移情况下(最大偏移1 cm)获得比少通道肌电更好的识别精度. 另一方面, 将肌电信号与其他类型传感器融合, 如惯导(Inertial measurement unit, IMU)等, 也能提高模型在电极偏移干扰的鲁棒性^[17-18].

2) 提取电极偏移不敏感的特征. 在特征提取环节, 如果能构造具有电极偏移无关的特征空间, 将极大地提高系统的鲁棒性; 同时, 也能够降低因为数据量或数据类型扩增而引起的数据采集阶段和模型训练阶段的耗时. 研究表明, 自回归系数特征(Autoregressive features, AR)、时域与自回归系数结合的特征(Combination of time-domain and AR feature, TDAR), 比TD (Time-domain)特征对电极偏移干扰具有更好的鲁棒性, 在10类常见的手部或腕部动作中, 识别误差由30%下降为10%左右^{[16, 19]}; Tkach等^[20]提出了EMG 的自回归系数特征和倒频谱系数(cepstrum coefficients)特征, Stango等^[10]提出了Variogram特征, Boschmann等^[21]利用结构相似性特征(Structural similarity index); Pan等^[22]提出了共空间模式(Common spatial patterns, CSP)特征, 并与传统的TDAR和Variogram等特征进行了对比, 取得了更高的识别精度, 表明该特征具有更好的电极偏移等干扰的不敏感性. 更进一步, He等^[14]借鉴了图像处理领域的纹理信息——灰度共生矩阵, 提取二维肌电信号中所构成肌肉活跃图的纹理信息, 并将阵列式电极首尾连接, 进一步改进了纹理特征, 表现出明显的电极位置无关优势. 另一方面, Huang等^[23]利用非负矩阵分解(Nonnegative matrix factorization, NMF)技术, 提出了一种半监督方式, 将原特征空间映射到隐变量新空间, 表现出对通道数目和偏移位置不敏感的优点.

3) 更新模型适应不同偏移位置. 迁移学习(Transfer learning)或领域自适应(Domain adaptation)技术常常被引入以解决这类干扰变化, 使得模型具有更新能力, 以适应不同的信号特征. Amsuss等^[24-25]在识别模型的结果上进行后处理作为模型自修正, 降低模型因为电极干扰引起的误分类, 或采用协方差偏移适应(Covariate shift adaptation)等迁移学习方法适应电极偏移等干扰. Prahm等^{[15, 26]}和Paaβen等^[27]针对Myo的旋转偏移干扰问题, 采用期望最大化的迁移学习(Expectation maximization transfer learning)估计因电极偏移前后肌电信号在特征空间中分布的关系(假设为一种线性映射), 仅利用少量训练数据将预训练模型适用于不同干扰下的肌电识别场景. 丁其川等^[28-29]提出一种自适应增量式混合分类器(Adaptive incremental hybrid classifier, AIHC)用于应对因重复穿戴后引起的电极偏移干扰. 李自由等^[30]针对环形Myo肌电传感器, 提出一种基于极坐标系内的活跃极角概念, 用于估计不同旋转位置之间的偏移程度, 并基于该偏移程度提出了自适应校正方法, 无需识别模型的再次训练, 仅利用少量单类别数据, 实现了常见手部8动作识别. Amma等^[31]基于HD-sEMG构建了CSL-HDEMG数据集, 并针对会话间的电极偏移问题, 提出了两种偏移估计方法: 利用少量校正数据估计小臂尺骨位置和肌肉活跃中心位置, 并以此进行偏移干扰的sEMG校正, 将识别精度由未校正的59%提升至75%. Ameri等^[32]通过卷积神经网络和迁移学习的方法, 仅利用少量肌电更新数据, 同时克服了个体性差异与电极偏移的综合干扰.

1.2 个体性差异

尽管人体的骨骼和肌肉分布大致相同, 但个体间在诸多方面的差异性(既包括个体的身高、体重、身体质量指数(Body mass index, BMI)、肌肉表层的脂肪含量等差异, 也包括不同个体在执行动作时的肌肉收缩方式和肌肉收缩力大小等方面的差异, 以及截肢患者的残肢肌肉功能或通过目标肌肉神经分布重建方法(Target muscle rehabilitation, TMR)的肌电信号差异^[33]), 尤其是健康者与肢体残疾者之间的肌电特征差异^[34], 都极大地限制了传统固定识别模型在不同用户之间的通用性. 大量的实验和研究表明, 传统基于有监督学习的固定识别模型, 在处理新用户的肌电信号识别问题上表现不佳, 因此个体差异问题逐渐成为阻碍肌电交互系统推广应用的主要问题之一, 引起研究者们的广泛关注^[35]. 而为了应对这种个体性差异导致的模型识别率下降问题, 本节总结当前文献的主要研究工作, 分别在数据、特征和模型等不同环节, 归纳用于消除或解决个体差异性问题的方法.

1)融合不同个体的多模数据. 即增加有监督学习模型中训练数据的数量或类型. Guo等^[36]将多人的数据融合后训练一个通用识别模型, 在新用户上的识别准确率可达85%, 其主要的优点是新用户无需采集数据重新训练或校正的过程, 方便即时使用. Stival等^[37]在回归问题研究方面引入IMU信息, 利用惯导所补充的个体特点降低识别模型在个体差异性方面的约束. Phinyomark等^[38]将个体相关的12个形态参数(如BMI等)用于更新模型权重因子或特征归一化, 提高了识别模型在不同用户上的适用性.

2)提取肌电分解与协同特征. 即通过肌电分解、多特征融合等方式构建统一化的共同特征空间. Xiong等^[39]利用肌电信号的逆向分解原理, 将不同个体的肌电信号分解到运动单元动作电位的信号空间. 通过MUAP的无监督聚类, 找到用于个体无关的表征方式, 降低个体之间的差异性. Ison等^[40]提出了基于多分辨率肌肉协同特征(Multire-solution muscle synergy)提取技术, 以构建个体适应的鲁棒特征. Chattopadhyay等^[41]探究了个体之间的相似性, 利用领域适应方法尽可能保持个体肌电信号的分布特征, 通过映射到共同空间, 以提高模型适应性.

3)采用少量数据更新通用模型. Tommasi等^[42-43]在基于迁移学习的个体模型适应性研究方面做出了一系列研究成果, 主要是在一般模型的基础上, 通过利用新用户的少量数据, 更新已知多用户的支持向量机(Support vector machine, SVM)识别模型的权重因子, 设计了一种低代价的权重更新方法

$$W = \mathop \sum \limits_{k = 1}^K {\beta ^k}{\hat W^k} + \mathop \sum \limits_{i = 1}^N {a_i}{\varnothing _i}\left( {{x_i}} \right) $$

(2)

其中, $\hat{W}$分别表示原有用户的SVM权重矩阵, $ \beta $为各个矩阵的加权系数, $ \mathrm{\varnothing }\left({x}_{i}\right) $为SVM中的核函数, $ {x}_{i} $表示新用户的少量样本, $ a $表示损失函数与约束构成的拉格朗日系数.

Khushaba^[44]利用典型相关分析(Canonical correlation analysis, CCA)方法, 将不同个体的肌电特征映射到一个低维的同一空间(unifiedstyle space)训练初始模型; 并对新用户的少量肌电信号与预训练模型的专家特征(Expert features)做典型相关分析, 将测试集数据更新至预训练模型高相关性空间, 提高了模型的适用性和泛化能力. Matsubara等^[45]采用形式和内容分离(Style and content spearation)的思想, 基于用户依赖因子(User-dependent factor)和动作依赖因子(Motion-dependent factor)构建用户无关特征(User-independent feature)的双线性模型(如图3所示), 针对新用户时仅需单类别的更新数据, 完成模型对新用户的多类别动作识别. Pan等^[46]仅利用个体的最大收缩力信息将个体模型拓展为通用模型, 其更新方式代价较低. 而Cote-Allard等^[47]利用深度学习中的卷积神经网络(Convolutional neural network, CNN)将模型迁移适用不同个体.

图 3 基于用户依赖因子和动作依赖因子构建用户无关特征的双线性模型^[45]

Fig. 3 User-independent bilinear model based on user-dependent factor and motion-dependent factor^[45]

下载: 全尺寸图片幻灯片

1.3 肌肉疲劳

从生理机制而言, 一方面肌肉在长期进行超负荷或持续收缩过程中, 即产生肌肉疲劳. 如图4所示, 其中最主要的表现就是肌肉所能够产生的最大输出力降低^[48-49]; 另一方面, 研究表明功能性电刺激(Functional electrical stimulation, FES)也能够诱发肌肉疲劳^[50]. 在有监督学习的肌电信号动作识别的一般框架下, 基于sEMG的意图识别与智能系统交互控制中, 研究者往往通过一定的实验条件或交互约束, 尽量避免在假肢等控制交互过程中的使用者产生肌肉疲劳^[51]. 然而在实际日常生活或临床应用中, 长时间佩戴肌电假肢、使用肌电助力或康复系统不可避免地导致使用者产生肌肉疲劳. 因此, 肌肉疲劳是在长时间使用中不可避免的重要问题之一^[52].

图 4 疲劳状态下肌电信号中值频率与肌肉输出力变化^[52]

Fig. 4 Changes of median frequency of EMG signal and muscle output force under fatigue condition^[52]

下载: 全尺寸图片幻灯片

研究表明, 肌肉疲劳在肌电信号的潜在表现主要包括但不限于: 1)幅值特征增加; 2)频谱能量下降; 3)传导速度下降^{[48, 53-54]}; 由于肌电幅值往往与肌肉收缩力正相关, 容易受使用者发力影响, 因此肌肉疲劳评估或监测更为关注频谱能量变化. De Luca^[52]通过要求被试者的第一骨间背肌持续收缩进行肌肉疲劳实验, 在该实验范式下, 该肌肉的肌电信号反映出频谱分析中值频率(Median frequency, MDF)在疲劳前后下降超过50%. 研究表明, 肌肉疲劳的肌电信号中包含了频谱能量、传导速度的下降趋势和幅值特征的上升趋势以及传导速度正比于肌电信号中值频率^[51].

sEMG的MNF和MDF的计算式为

$$ {f_{{\rm{MNF}}}} = \frac{{\mathop \sum\limits_{j = 1}^M {f_j}{P_j}}}{{\mathop \sum \limits_{j = 1}^M {P_j}}}$$

(3)

$$\mathop \sum \limits_{j = 1}^{MDF} {P_j} = \mathop \sum \limits_{j = MDF}^M {P_j} = \frac{1}{2}\mathop \sum \limits_{j = 1}^M {P_j}$$

(4)

其中, P表示信号的功率谱密度, MNF表示均值频率, MDF表示中值频率.

然而, 频谱分析的方法主要采用快速傅里叶变换(Fast Fourier transform, FFT), 其假设时间序列具有平稳特性, 在先前的大多数研究中也主要是等长收缩的实验范式. 这种实验范式及分析方法具有一定的局限性, 因此基于短时傅里叶变换(Short-time Fourier transform, STFT)和基于小波变换(Wavelet transform, WT)等时频域的特征, 改进的中值频率或均值频率也逐渐引入到肌肉疲劳监测中, 尤其适用于被试者的动态收缩过程^[55]. 综述当前的研究, 为处理非理想场景下的肌肉疲劳干扰, 主要从频域等疲劳特征与疲劳分类两方面提出解决方案.

1)频域等疲劳特征. 为应对肌肉在周期性、动态收缩下的肌肉疲劳监测, Bonato等^[56]在大拇指周期性动态收缩力下提出基于时频域变换的瞬时中值频域(Instantaneous MDF, iMDF)和瞬时均值频率(Instantaneous MNF, iMNF); Cao等^[57]提出循环平稳性特征作为疲劳因子; Thongpanja等^[58]提出了一种改进的频域特征(Time dependence of MNF, TD-MNF), 在肘关节不同负载下进行了多组重复性疲劳实验, 结果表明, 相对于MNF、MDF特征而言, TD-MNF可作为一种更为全局准确的肌肉疲劳评估方法, 并且与肌肉负载力之间具有线性关而非基于传统MNF、MDF非线性耦合关系. 肌肉疲劳源自比较复杂的生理过程, 并依赖于实验范式等, 因此有关肌肉疲劳评估的研究也不仅仅局限于上述几个方面的时域或频域特征. 除此之外, Al-Mulla等^[59]提出一维频谱—标准差(1D specto std)特征, Xu等^[60]在疲劳时的肌肉力估计中通过NMF分解技术提取疲劳因子; Sheng等^[61]提出多模态生理信号融合的方法克服肌肉疲劳.

2)疲劳分类. 研究人员将疲劳监测或克服疲劳问题作为一个“分类”问题研究. 如Al-Mulla等^{[59, 62]}在选用更多特征的基础上, 进一步与分类器相结合以区分非疲劳(Non-fatigue)、过渡疲劳(Transition-to-fatigue)和疲劳(Fatigue)等三类阶段; Wu等^[63-64]提出混合细菌觅食—粒子群优化方法(Bacterial foraging and particle swarm optimization, BF-PSO)和模糊SVM (Fuzzy SVM)等方法监测疲劳状态.

因此, 为克服肌肉疲劳所带来的的不良影响, 一般是在特征提取过程时对特征进行预处理, 如基于MNF或MDF的特征归一化处理^[65], 或采用概率模型和基于疲劳监测因子查表方式, 对多种识别模型进行切换控制^[66-67]; 此外, Mainardi等^[68]通过自主设计改善电极等配置, 避免商业采集系统的过多滤波环节, 保留更多肌肉疲劳有关频带信息; 而Peternel等^[69]则更加关注在人机协作场景中, 通过调整协作机械臂的不同刚度, 以适应人体的不同疲劳状态, 开拓了肌电识别与协作交互的新应用.

1.4 肢体姿态

在智能假肢的实际场景中, 肢体的姿态干扰一般可归纳为两种类型: 1)不同静态姿势下, 同一个末端(如手部)动作的差异; 2)静态、动态或不同肌肉收缩力对同一动作产生的差异^[70]. 传统基于有监督学习范式的sEMG识别系统, 仅将少部分姿态下的肌电信号作为训练集, 得到的分类模型往往容易受到多种姿态干扰. 如Liu等^[71]揭示了静态—动态手臂姿势对手部分类动作的影响; Jiang等^[72]在研究肌电连续估计时也发现手臂位置对识别精度的负面影响. 研究表明, 在针对不同姿态下的手部/手指动作分类时, 其中腕部和大臂的姿态均对手部动作识别产生较大的影响^[73-74]. 目前, 针对肢体姿态不同而引起的干扰问题, 大量研究工作与解决方法主要集中在数据和特征两方面:

1)融合不同姿态下的多模数据. 即增加训练数据集的数量或类型. 一方面可以通过采集更多场景下的数据作为模型的训练集, 使得模型能够覆盖更多的肌电识别场景. 大量的研究表明, 与仅利用单一位置下的数据作为训练集相比, 将更多(或所有)位置下的肌电数据引入到模型的训练集中, 能够取得比单一位置更好的识别准确率^[75–77]. 然而这种方式要求覆盖尽可能多的姿态场景, 当训练后的模型应用于从未出现的姿态数据时, 模型的泛化能力依然较弱^[78]. 并且这种通过丰富训练数据集以覆盖更多姿态的方法, 很明显将要求受试者在使用肌电交互系统时, 花费更多的时间用于训练集数据采集. 这种要求增加了用户学习和使用负担, 是导致用户弃用肌电假肢等设备的主要原因之一. 而在这种通过多姿态场景丰富训练数据集的数据采集范式下, Scheme等^[70]和Radmand等^[78]将多个静态姿态位置组合成动态的日常生活动作(如图5), 提出了“动态训练” (Dynamic training)方法. 训练数据采集时间由原来超过10分钟下降为1~2分钟. 另一方面, 通过增加其他类型传感器, 补充更多有关肢体姿态的信息, 增强系统判别能力, 如引入肢体的加速度信息^[17]. 肌电信息和加速度信息的融合方式包括两种类型: 串联和并联方式. 1)串联方式. 包含两阶段的层级结构. 即首先利用加速度信息训练分类器并用于识别肢体姿态或位置信息; 在判别了不同位置或姿态的基础上, 利用各自的肌电识别模型, 进一步确定手部动作类型^{[75-76, 79]}. 2)并联形式. 即使用加速度信息和肌电信息, 或其相关特征, 共同拓展模型的输入维度. 通过扩维的数据融合方式提升识别系统对姿态干扰的鲁棒性^[75].

图 5 动态训练方法的不同姿态

Fig. 5 Different postures of dynamic training approach

下载: 全尺寸图片幻灯片

2)提取肢体姿态不敏感特征. 不同于丰富训练集数量和类型的方式, 对肢体姿态不敏感的肌电信号鲁棒性特征方式由于降低对用户的学习和使用门槛, 将适用于更多交互场景. Khushaba等^[80-82]提出了频域的多个特征, 如谱矩(Spectral moments)、谱稀疏性(Spectral sparsity)、谱通量(Spectral flux)、不规则因子(Irregularity factor)、信号功率谱相关性(Signals power spectrum correlation)等, 以及用于量化位姿角度的特征等, 探究了这些特征对姿态干扰的鲁棒性. 而Betthauser等^[83-84]提出了肌电信号的稀疏表达特征与基于稀疏特点的自适应校正方法, 在新姿态下进行了离线和在线测试, 显著提高了新姿态下的识别精度和识别鲁棒性. 另外值得一提的是, 肢体姿态对识别结果的干扰影响, 正常人与截肢患者有明显不同, 对正常人的干扰性更为明显一些^{[72, 79]}. 因此, 在进行实验设计与方法验证时, 应尽可能包含更多用户数据, 使结果具有更强的说服力.

1.5 其他干扰或综合干扰

在日常复杂的实际人机交互应用中, 针对sEMG识别的非理想因素, 不仅仅局限于前述多个常见且影响严重的干扰, 还包括电极脱落导致的数据丢失问题^[85-86]、皮肤表面的汗液或温度变化导致的电极阻抗变化问题^[87]、工频干扰^[88-89]等, 以及实际应用中对新动作的需求等因素或多种因素的综合干扰, 依然制约着sEMG识别系统的应用与推广.

2. 研究现状中的主要问题

综上所述, 基于sEMG的识别方法在实际应用场景中面临着诸多的非理想干扰因素, 研究者们针对各个干扰因素, 提出了丰富的干扰估计和干扰克服方法, 在很大程度上提高了肌电识别系统的鲁棒性.

然而, 在前述的诸多文献中, 多数研究内容主要集中在克服单个干扰因素的影响; 且通过特定的实验范式, 控制单变量地仅引入单个干扰因素, 与实际肌电交互场景有明显差异. 因此, 针对实际肌电交互场景的诸多干扰因素, 现有研究弱化或忽略了各个干扰因素之间不同组合而带来的耦合性, 以及由场景变化或肌电信号的时变特点而引起的过渡性.

2.1 非理想因素之间的耦合性与过渡性

1)耦合性. 指同一肌电交互场景中存在多种干扰因素, 且无法判断各类干扰的影响程度. 如当预训练识别模型应用于新用户时, 其中显而易见会引入个体性差异的干扰; 不同人在完成动作时的姿态信息、肌肉收缩方式和收缩力大小也存在差异; 而在穿戴过程中由于粘贴位置的不同, 也会耦合电极偏移的问题. 并且, 这些实际日常生活中耦合的诸多干扰之间, 较难判断究竟是由哪一种干扰因素在起主导作用.

2)过渡性. 指长时间肌电交互场景中, 某些因素的干扰程度在不断变化, 或不同场景中对肌电识别模型的目标变化. 在长时间的肌电意图识别与交互控制中, 一方面主要由于肌肉的长时间反复收缩容易引入不同程度的肌肉疲劳问题; 另一方面用户在使用过程中, 尤其是通过视觉等方式不断接收实际交互效果的反馈后, 大脑或中枢神经在刺激肌肉收缩时也会逐渐适应这种交互方式, 不自主地改变肌肉发力方式或大小^[90]. 因此, 传统有监督模型, 受限于一经训练完成模型固定的特点, 将无法适用于实际应用中这类变化因素. 这一点在前述诸多干扰的应对方法中已有所体现, 部分研究者在传统有监督模型中引入自适应变量或引入迁移学习, 以增强模型的适应性, 但距离克服实际应用中的诸多干扰因素过渡性仍有较大差距.

2.2 抗干扰方法中的主要问题

如前文对诸多非理想因素的本质分析, 以及相关克服方法的综述, 如表1所示, 为克服实际应用中的诸多非理想因素, 相关研究方法可以归纳为三种基本内容: 数据扩增、鲁棒特征与模型更新.

表 1 非理想因素及解决方案

Table 1 Non-ideal factors and solutions

非理想因素	数据扩增	鲁棒特征	模型更新
电极偏移	1) 多位置数据扩增^{[13, 16]} 2) 多通道数据扩增^[12] 3) 惯导等数据融合^[17-18]	1) AR、TDAR特征^{[16, 19]} 2) 倒频谱特征^[20] 3) Variogram 特征^[10] 4) 结构相似性特征^[21] 5) 共空间模式特征^[22] 6) 灰度共生矩阵特征^[14]	1) 模型修正与协方差偏移适应^[24-25] 2) 期望最大化迁移学习^{[15, 26-27]} 3) 自适应增量式混合分类器^[28-29] 4) 偏移估计与模型更新^[30] 5) 骨骼位置估计与校正^[31]
个体性差异	1) 多人数据扩增^[36] 2) 惯导等数据融合^[37] 3) 个体形态参数归一化^[38]	1) 肌电分解特征^[39] 2) 多分辨率肌肉协同特征^[40] 3) 共同空间映射^[41]	1) SVM权重更新策略^{[42-43, 91]} 2) 典型相关分析低维共空间映射^[44] 3) 用户、动作依赖的双线性模型^[45] 4) 基于最大收缩力的模型泛化^[46] 5) 基于卷积神经网络的模型迁移^[47]
肢体姿态	1) 多姿态下的数据扩增^[75-77] 2) “动态训练”数据采集^{[70, 78]} 3) 惯导等数据融合^{[17, 75-76, 79]}	1) 谱矩等频域特征^[80-82] 2) 稀疏表达特征^[83-84]	—
肌肉疲劳	1) 频域特征归一化 (MDF, MNF^{[52, 92]}, STFT, WT^[93-94], iMDF, iMNF^[56], 一维频谱—标准差^[59]等) 2) 疲劳状态的分类识别^{[59, 62–64]}

下载: 导出CSV

| 显示表格

1)数据扩增. 主要是扩增更多场景下的肌电数据量, 或与其他模态传感器数据相融合; 其中扩增数据量, 一定程度上花费大量时间, 需要综合考虑个体用户的学习成本与使用负担. 而多传感器数据融合, 提供了更多人体意图的冗余和互补信息, 代表着人机交互的未来趋势之一.

2)鲁棒特征. 虽然在某些单一非理想场景中, 精心设计的鲁棒特征表现良好, 但是其推广性较差, 且在新的场景中探寻鲁棒特征较为困难. 因此, 应当结合特征工程或特征学习等方法, 为提高系统的鲁棒性提供通用的理论指导.

3)模型更新. 该方面的研究成果较为丰富, 是肌电识别研究的重要环节与主要内容. 但模型更新的代价问题, 如所需的新样本量或模型更新时间等, 则是其不得不考虑的重要因素; 另外, 多数研究中的模型更新策略通用性较差, 仅适用于特定的分类模型, 如SVM等.

最后, 即使针对同一类非理想干扰因素, 由于采用了各自的实验设备、实验范式和实验数据等, 所提方法之间未进行充分的对比. 大部分研究仅相对于未采取任何措施的方法进行对比, 验证了算法的可行性和有效性. 以往方法鲜有在当前实验中进行复现, 方法之间缺乏直接对比.

3. 非理想肌电识别的关键技术展望

因此, 本文在综述了非理想肌电的诸多干扰因素与现有文献方法的基础上, 将当前研究所面临的关键问题总结为: 1)缺乏统一的算法比较平台, 2)忽略了干扰之间的耦合性和过渡性.

本节将针对上述问题, 进一步总结分析并提出了“一个平台 + 两种方法”的关键技术展望(见图6), 包括:

1)构建统一开放的肌电等多传感器数据集作为基准平台, 使得不同研究方法之间能够进行统一比较;

2)探索基于“机器学习”和“机理建模”的肌电识别方法, 分别从特征层面与机理层面, 研究肌电信号在非理想场景下的过渡变化与多干扰之间的耦合关系.

图 6 非理想肌电的关键技术展望

Fig. 6 The key technology prospects of non-ideal EMG

下载: 全尺寸图片幻灯片

3.1 构建统一开放的肌电等多传感器数据集

大规模有标签数据集作为主要的推动力之一, 促进了以深度学习为核心的机器学习技术, 在语音识别、图像处理与识别、自然语言处理等领域的飞速发展. 该技术主要利用了大规模有监督数据集与深层神经网络, 突破了传统机器学习算法中依赖于手工特征的局限性.

而在肌电信号识别领域, 虽然基于机器学习和模式识别的方法已经非常普遍, 但是统一开放的肌电识别数据集仍然非常鲜见. 究其原因, 一方面受限于肌电信号采集设备, 目前实验室用高精度肌电传感器普遍非常昂贵, 且采集设备在电极配置、调理电路和采样率等方面存在较大差异; 另一方面, 有别于常见的语音信号、图像、视频、文本等信息, 原始肌电信号的可理解性较差, 无法直接验证数据的真实性和可靠性, 仅能通过合理的实验范式保证数据的有效性与准确性; 并且囿于不同的应用场景和识别目标, 数据采集范式也有一定的差异.

表 2 sEMG数据集

Table 2 Surface EMG signal datasets

	数据集	传感器	参与人数	动作类别
NinaPro^[4]	DB1	1) Otto Bock MyoBock 13E200 电极, (10 通道, 肌电 RMS 特征) 2) 数据手套 Cyberglove (22 通道)	27 名健康人	52 类手部动作重复 10 次
	DB2/3	1) Delsys Trigno Wireless 肌电系统, (12 通道双差分 EMG, 36 通道 ACC) 2) 数据手套 Cyberglove (22 通道) 3) 手指力传感器 (6 通道) 4) 腕部倾角传感器 (2 通道)	40 名健康人	49 个手部动作重复 6 次
	DB4	1) Cometa 单差分无线肌电电极 (12 通道单差分)	10 名健康人	52 类手部动作重复 6 次
	DB5	1) Thalmic Myo 肌电臂环 (2 套, 共计 2×8 通道单差分) 2) 数据手套 Cyberglove (22 通道)	10 名健康人	52 类手部动作重复 6 次
	DB6	1) Delsys Trigno Wireless 肌电系统 (14 通道, 42 通道 ACC) 2) Tobii Pro Glasses II (追踪眼动和视野)	10 名健康人	7 个抓握动作重复 12 次重复 5 天
	DB7	1) Delsys Trigno Wireless 肌电系统 (12 通道 EMG, 9 轴 IMU) 2) 数据手套 Cyberglove (22 通道)	20 名健康人 2 名截肢者	40 个手部动作重复 6 次
	DB8	1) Delsys Trigno Wireless 肌电系统 (16通道 EMG, 9 轴 IMU, 采样至 2 kHz) 2) 数据手套 Cyberglove (22 通道)	10 名健康人 2 名截肢者	9 个手部动作
CSL-HDEMG^[31]		1) HD-EMG (8×24 = 192通道)	5 名健康人	27 个手部/手指动作
CapgMyo^[95]	DB-a	1) HD-EMG (8×16 = 128 通道)	18 名健康人	8 个手指动作 8 个手指动作 (同上) 不同时间段重复两次 12 个手指动作
	DB-b		10 名健康人
	DB-c		10 名健康人
UCI 等	Myo^[96]	1) Thalmic Myo 肌电臂环 (8 通道)	36 名健康人	8 个抓握动作
UCI 等	Christos-Delsys^[97]	1) Delsys Trigno Wireless (2 通道)	6 名健康人	6 个抓握动作

下载: 导出CSV

| 显示表格

如同语音识别或图像处理等领域, 肌电信号识别领域亟需统一开放的数据集. 经调研, 在该领域仅存在少量公开的肌电信号相关数据集, 如NinaPro^[4], CSL-HDEMG^[31], CapgMyo^[95]等, 其简要介绍如表2所示. 其中以NinaPro的数据集最为系统、丰富和完整, 涉及正常人和不同截肢患者的数十种手部常见动作(高达52类离散动作), 数据采集过程采用了多种常见肌电采集系统(如Delsys, Myo等), 同时引进了数据手套、力矩传感器等其他类型传感器采集, 更丰富而全面的获取手部运动信息. 目前, 已有部分研究利用该数据集进行方法测试与比较. 而CSL-HDEMG和CapgMyo等数据集, 参考了NinaPro类似的实验数据采集范式, 但更侧重在新型高密度阵列式表面肌电信号传感器, 如CSL-HDEMG重点采集了更精细手指运动范式下的肌电信号.

然而, 现有的大部分公开数据集目前仍然局限于研究理想场景下的准确性方面, 对非理想场景下的鲁棒性研究借鉴意义有限, 仅对个体性差异等干扰可以直接测试比较. 面对更多如电极偏移、肌肉疲劳、姿态干扰等非理想因素, 则无法直接处理. 因此, 针对非理想干扰的统一开放肌电数据集仍然非常重要和迫在眉睫, 需要通过系统的实验范式有目的地引入更多的干扰, 覆盖更多实际应用场景. 同时, 由前面综述的诸多非理想干扰应对方法可知, 通过融合IMU等其他类型数据是克服诸如电极偏移和姿态干扰等因素的重要途径之一. 尤其是大多数的商用sEMG传感器一般都内置IMU等传感器, 因此通常无需增加肌电交互系统的硬件成本, 可通过多传感器融合技术的方式提高人机交互的鲁棒性和稳定性. 因此, 以肌电信号为核心, 尽可能地融合更多其他类型传感器数据, 如脑电信号、眼电信号和视觉信息等, 构建统一开放的肌电等多传感器数据集, 越来越成为肌电识别与人机交互的基础研究内容之一.

3.2 探索基于机器学习的肌电识别方法

借助于机器学习的识别技术(如深度学习和迁移学习等), 研究人员逐渐克服了语音识别中的个体差异问题, 图像领域中的目标检测与分割问题, 和自然语言处理中的上下文问题等, 然而类似的科学问题在基于sEMG的人体意图识别中同样存在, 尤其存在于非理想场景下的sEMG识别中. 因此, 探索基于机器学习的肌电识别方法, 以解决非理想肌电的诸多干扰问题, 具有重要研究价值与实用意义.

3.2.1 基于深度学习的特征表示与特征学习

深度学习在图像处理等领域近期的诸多研究进展和文献综述表明, 深度学习方法之所以有效地解决了其中许多关键问题, 其最核心在于摒弃了传统机器学习方法中的手工特征等环节. 深度学习方法采用多层次的神经网络结构, 能够自主地进行特征学习和层级特征表示. 而归纳肌电识别领域的研究进展, 目前大多数的研究者, 仍然依赖于传统的机器学习范式, 尤其是依赖于大量的手工设计特征, 如时域特征、频域特征与时频域特征^[1]. 目前已有部分研究开始借鉴其他领域的深度学习方法进行特征学习方面研究, 如采用时序卷积网络(Temporal-convolutional networks, TCN)提取肌电信号时序、层级特征, 提高肌电识别的准确度^[98] (如图7所示); 针对多通道肌电时间序列构造二维输入, 或对单通道肌电序列提取小波变换转换成二维时频域特征表示, 进而采用类图像处理方法中的CNN网络结构, 进行特征学习^[99]; 更进一步, 将传统特征与学习特征进行比较, 以实现更准确、更本质的肌电特征描述^[100]. 因此采用深度学习方法, 聚焦在肌电信号的特征学习与层级特征表示方面, 是未来提高肌电识别准确性和保证非理想场景下肌电识别鲁棒性的重要研究内容之一.

图 7 基于TCN网络结构的肌电信号时序、层级特征提取框架^[98]

Fig. 7 Sequential and hierarchical feature extraction framework of EMG signal based on TCN network^[98]

下载: 全尺寸图片幻灯片

但目前受限于肌电信号有限的数据集, 无法有效地在大规模的肌电数据集中通过深度神经网络进行特征学习和特征表示. 退而求其次, 更系统全面的特征提取方法研究, 对基于深度学习的肌电识别仍然具有铺垫与递进意义. 一方面传统特征提取方法具有明确的生理和物理意义. 尽管目前已有部分文献对特征提取及其他环节等进行了讨论, 但涉及的特征数量较少(一般不超过20个), 未来仍然需要更加全面和系统的特征对比、讨论和探究. 如采用TSFRESH (Time series feature extraction based on scalable hypothesis tests)等开源库进行大量的特征提取、假设性检验和特征选择等^[101-102]. 另一方面, 在现有有限的数据集上, 利用已知的大量有效肌电特征作为深度神经网络的输入, 提高肌电信号的表征能力, 拓展深度神经网络的输入类型, 并降低深度神经网络的特征学习压力, 也是非常有意义的未来研究内容之一.

3.2.2 基于迁移学习的模型更新

相对于非理想因素引起的样本分布差异问题, 非理想场景下训练集与测试集之间仍然潜在着较强的关联关系或不变特征, 同样具有重要的研究意义. 如迁移学习基本框架(如图8所示), 即利用源域的相关知识或特征, 来提高模型在目标域上的识别性能(目标域虽然与源域不同但是包含相关的信息)^[103]. 如前文综述, 在解决电极偏移和个体性差异等问题上, 已有部分研究者沿着这类子空间对齐^[104]的迁移学习方法开展了相关的研究工作. 其原理如式(5)和式(6)所示, 以优化的思路求解特征空间的映射关系.

$$ F\left( M \right) = \left\| {{X_s}M - {X_t}} \right\|_{\rm{F}}^2$$

(5)

$${M^*} = {\rm{arg}}\mathop {\min }\nolimits_M \left( {F\left( M \right)} \right)$$

(6)

其中, $ {X}_{s} $表示源域的特征, $ {X}_{t} $表示目标域的特征, $ F(\cdot) $为损失函数, $ M $即在特征空间中源域与目标域之间的线性变换矩阵.

图 8 基于迁移学习的理想场景与非理想场景之间肌电识别模型的更新与适应

Fig. 8 Update and adaptation of sEMG-based recognition model between ideal and non-ideal scenarios based on transfer learning

下载: 全尺寸图片幻灯片

因此, 基于迁移学习的肌电识别研究, 尤其是结合深度神经网络的特征表示方法, 为肌电识别的准确性与鲁棒性研究提供了新的研究思路.

采用迁移学习解决非理想因素的干扰问题时, 目前主要挑战之一是迁移学习或模型更新的代价, 其常常需要大量额外的样本数据用于求解源域与目标域之间的映射, 如式(5)和式(6)中的线性变换矩阵. 而主动学习(Active learning)可用于挑选最具有信息量和判别性的样本, 在未来的研究工作中, 将有利于采用最少的有监督样本与最低标注成本, 完成理想模型在非理想场景下的迁移或更新^[105–107].

3.3 探索基于机理建模的肌电识别方法

前述的多种研究思路或方法, 主要从机器学习或模式识别角度展开, 但肌电信号的形成机理与肌肉收缩机制仍然具有重要的启发意义, 可用于开展基于机理建模的肌电识别研究.

图9展示了肌电信号分解的生理机制: 位于皮肤表面的肌电信号传感器所采集到的电信号, 实际上是由来自多个运动单元动作电位序列(MUAP trains), 在皮肤表面叠加而成的综合信号. 因此, 肌电分解正是将传感器采集到的sEMG还原成多个MUAP, 是肌电信号形成的逆过程. 基于肌电分解的精细建模方法将基于对运动单元的刺激收缩作为研究切入点, 在更精细和微观的层次进行肌肉收缩建模研究, 从而在生理本质上保证识别模型的可解释性和准确性, 开拓了肌电识别在机理建模方面的重要研究方向^[108].

图 9 sEMG分解与MUAP^[109]

Fig. 9 Surface EMG signal decomposition and MUAP^[109]

下载: 全尺寸图片幻灯片

基于肌电分解等生理机制的研究思路, 由因导果(按照机体的意图产生和作用的因果关系, 逐步推导或建立肢体受刺激的动力学模型); 相对而言, 基于机器学习或模式识别的研究思路, 则是由果索因(利用已知或标定的动作标签或更高精度传感器数据作为“参考真值”, 通过识别模型的参数训练等方式, 反向建立以肌电信号为输入、运动信息为输出的模型). 两者的侧重点不同, 但对于肌电识别研究均具有重要的研究意义和实用价值. 尤其是以生理机制为基础的研究方法, 在解决非理想场景中各类干扰问题时, 更易于在机理上探索出解释性合理与鲁棒性强的肌电识别方法.

但目前而言, 基于机理建模的肌电识别方法, 除了在肌肉疲劳等方面有部分相关研究外, 在克服其他干扰方面的研究比较鲜见. 因此, 在肌电分解与肌肉机理建模的研究方面, 仍有大量的未知研究内容, 这类机理方面的研究不仅仅直接有助于更准确与更稳定的肌电识别结果; 对深度学习模型的网络设计与迁移学习的映射求解, 也将具有十分显著的启发意义.

4. 结论

随着智能假肢、可穿戴外骨骼与助力设备等康复机器人系统在本体机械结构设计与控制系统方面的不断完善, 以及高精度肌电信号硬件采集系统的性能提升, 如何实现人—机的准确、自然与稳定交互, 越来越成为人机共融系统中的瓶颈环节, 也已经逐渐成为研究热点问题. 目前, 大量基于机器学习和模式识别的肌电意图解码方法不断推陈出新, 将意图识别的准确率或精度不断提升.

然而当基于肌电信号的诸多康复机器人系统从实验室环境推广到实际日常使用时, 却面临着大量的非理想因素干扰. 本文主要聚焦在电极偏移、个体性差异、肌肉疲劳、肢体姿态和其他综合性干扰方面, 详细归纳了当前研究的干扰及其应对方法; 接着总结并讨论了研究现状中的关键问题; 最后, 提出了“一个平台+两个方法”的未来关键技术展望, 包括构建统一开放的多传感器融合数据集、探索深度学习的特征学习和基于迁移学习的模型更新与适应, 以及肌电分解研究等技术内容, 旨在为后续深入研究提供潜在的研究思路.

本文责任编委刘成林

图 1 几种基于图像特征的舌体分割方法分割效果

Fig. 1 The results of several traditional algorithms

下载: 全尺寸图片幻灯片

图 2 卷积神经网络卷积化

Fig. 2 Convolutionalization of CNN

下载: 全尺寸图片幻灯片

图 3 全卷积网络结构图

Fig. 3 The architecture of FCN

下载: 全尺寸图片幻灯片

图 4 SegNet网络结构图

Fig. 4 The architechture of SegNet

下载: 全尺寸图片幻灯片

图 5 基于Atrous卷积的空间金字塔池化结构图

Fig. 5 The architechture of ASPP

下载: 全尺寸图片幻灯片

图 6 改进的基于Atrous卷积的空间金字塔池化结构图

Fig. 6 The architechture of the improved ASPP

下载: 全尺寸图片幻灯片

图 7 Tongue dataset中的部分舌图像

Fig. 7 Some pictures of the tongue dataset

下载: 全尺寸图片幻灯片

图 8 测试舌图像(彩色图像见网络版)

Fig. 8 Pictures of test dataset (Refer to the internet version for color images

下载: 全尺寸图片幻灯片

图 9 不同分割算法的分割效果(彩色图像见网络版)

Fig. 9 The results of diffierent segmentation algorithms (Refer to the internet version for color images)

下载: 全尺寸图片幻灯片

表 1 不同舌象分割方法性能比较

Table 1 Comparison on performances of diffierent algorithms

网络名称	mIoU	预测时间(s)
FCN8S	0.8322	7.4227
FCN16S	0.8718	7.4403
FCN32S	0.9272	7.5273
SegNet	0.9277	0.0014
Mask R-CNN	0.9361	0.1412
Deeplab V2	0.9678	0.0021
DeeplabV3	0.9810	4.9999×10^-6
DeeplabV3+	0.9818	2.9999×10^-6

下载: 导出CSV

参考文献(52)

[1]	沈兰荪, 蔡轶珩, 张新峰. 中医舌象的采集与分析. 北京: 北京工业大学出版社, 2007. Shen Lan-Sun, Cai Yi-Heng, Zhang Xin-Feng. Capturation and Analysis of Chinese Medicine Tongue Images. Beijing: Beijing University of Technology Press, 2007.
[2]	李国正, 史淼晶, 李福凤, 王忆勤. 舌体图像分割技术的实验分析与改进. 山东大学学报(工学版), 2010, 40(5): 87-95 https://www.cnki.com.cn/Article/CJFDTOTAL-SDGY201005017.htm Li Guo-Zheng, Shi Miao-Jing, Li Fu-Feng, Wang Yi-Qin. An empirical study on tongue image detection. Journal of Shandong University (Engineering Science), 2010, 40(5): 87-95 https://www.cnki.com.cn/Article/CJFDTOTAL-SDGY201005017.htm
[3]	Kim K H, Do J H, Ryu H, Kim J Y. Tongue diagnosis method for extraction of effective region and classification of tongue coating. In: Proceedings of the 1st Workshops on Image Processing Theory, Tools and Applications. Sousse, Tunisia: IEEE, 2008. 1-7
[4]	邬文隽, 马利庄, 肖学中. 一种结合亮度和粗糙度信息的舌像分割方法. 系统仿真学报, 2006, 18(S1): 374-376, 379 https://www.cnki.com.cn/Article/CJFDTOTAL-XTFZ2006S1115.htm Wu Wen-Jun, Ma Li-Zhuang, Xiao Xue-Zhong. Method of tongue image segmentation based on luminance and roughness information. Journal of System Simulation, 2006, 18(S1): 374-376, 379 https://www.cnki.com.cn/Article/CJFDTOTAL-XTFZ2006S1115.htm
[5]	张志顺, 刘勇. 基于动态阈值和修正模型的舌体提取算法. 计算机与现代化, 2014, (11): 49-52 doi: 10.3969/j.issn.1006-2475.2014.11.011 Zhang Zhi-Shun, Liu Yong. Tongue extraction algorithm based on dynamic thresholds and correction model. Computer and Modernization, 2014, (11): 49-52 doi: 10.3969/j.issn.1006-2475.2014.11.011
[6]	赵忠旭, 王爱民, 沈兰荪. 基于数学形态学和HIS模型的彩色舌图像分割. 北京工业大学学报, 1999, 25(2): 67-71 https://www.cnki.com.cn/Article/CJFDTOTAL-BJGD199902011.htm Zhao Zhong-Xu, Wang Ai-Min, Shen Lan-Sun. The color tongue image segmentation based on mathematical morphology and HIS model. Journal of Beijing Polytechnic University, 1999, 25(2): 67-71 https://www.cnki.com.cn/Article/CJFDTOTAL-BJGD199902011.htm
[7]	Chen L, Wang D Y, Liu Y Q, Gao X H, Shang H L. A novel automatic tongue image segmentation algorithm: Color enhancement method based on Lab* color space. In: Proceedings of the 2015 IEEE International Conference on Bioinformatics and Biomedicine. Washington, DC, USA: IEEE, 2015. 990-993
[8]	李丹霞, 韦玉科. 基于自适应阈值的舌像分割方法. 计算机技术与发展, 2011, 21(9): 63-65 doi: 10.3969/j.issn.1673-629X.2011.09.016 Li Dan-Xia, Wei Yu-Ke. Tongue image segmentation method based on adaptive thresholds. Computer Technology and Development, 2011, 21(9): 63-65 doi: 10.3969/j.issn.1673-629X.2011.09.016
[9]	蒋依吾, 陈建仲, 张恒鸿. 电脑化中医舌诊系统. 中国中西医结合杂志, 2000, 20(2): 145-147 doi: 10.3321/j.issn:1003-5370.2000.02.023 Jiang Yi-Wu, Chen Jian-Zhong, Zhang Heng-Hong. Computerized Chinese medicine tongue diagnosis system. Chinese Journal of Integrated Traditional and Western Medicine, 2000, 20(2): 145-147 doi: 10.3321/j.issn:1003-5370.2000.02.023
[10]	Zhi L, Yan J Q, Zhou T, Tang Q L. Tongue shape detection based on b-spline. In: Proceedings of the 2006 International Conference on Machine Learning and Cybernetics. Dalian, China: IEEE, 2006. 3829-3832
[11]	Yu S Y, Yang J, Wang Y G, Zhang Y. Color active contour models based tongue segmentation in traditional Chinese medicine. In: Proceedings of the 1st International Conference on Bioinformatics and Biomedical Engineering. Wuhan, China: IEEE, 2007. 1065-1068
[12]	Li X, Li J, Wang D. Automatic tongue image segmentation based on histogram projection and matting. In: Proceedings of the 2014 IEEE International Conference on Bioinformatics and Biomedicine (BIBM). IEEE, 2014: 76-81
[13]	Fu Z C, Li W, Li X Q, Li F F, Wang Y Q. Automatic tongue location and segmentation. In: Proceedings of the 2008 International Conference on Audio, Language, and Image Processing. Shanghai, China: IEEE, 2008. 1050-1055
[14]	Xie T, Xia C M, Chen F F, Zhang S L, Zhang Y. A method of tongue image segmentation based on kernel FCM. In: Proceedings of the 9th International Congress on Image and Signal Processing, BioMedical Engineering, and Informatics. Datong, China: IEEE, 2016. 319-324
[15]	Liu Z, Yan J Q, Zhang D, Li Q L. Automated tongue segmentation in hyperspectral images for medicine. Applied Optics, 2007, 46(34): 8328-8334 doi: 10.1364/AO.46.008328
[16]	Li X Q, Li J D, Wang D. Automatic tongue image segmentation based on histogram projection and matting. In: Proceedings of the 2014 IEEE International Conference on Bioinformatics and Biomedicine. Belfast, UK: IEEE, 2014. 76-81
[17]	Xu W T, Kanawong R, Xu D, Li S, Ma T, Zhang G X, et al. An automatic tongue detection and segmentation framework for computer-aided tongue image analysis. In: Proceedings of the 13th IEEE International Conference on e-Health Networking, Applications and Services. Columbia, MO, USA: IEEE, 2011. 189-192
[18]	Pang B, Zhang D, Wang K Q. The bi-elliptical deformable contour and its application to automated tongue segmentation in Chinese medicine. IEEE Transactions on Medical Imaging, 2005, 24(8): 946-956 doi: 10.1109/TMI.2005.850552
[19]	Shi M J, Li G Z, Li F F, Xu C. Computerized tongue image segmentation via the double geo-vector flow. Chinese Medicine, 2014, 9: Article No. 7 doi: 10.1186/1749-8546-9-7
[20]	Kass M, Witkin A, Terzopoulos D. Snakes: Active contour models. International Journal of Computer Vision, 1988, 1(4): 321-331 doi: 10.1007/BF00133570
[21]	Kang D J. A fast and stable snake algorithm for medical images. Pattern Recognition Letters, 1999, 20(5): 507-512 doi: 10.1016/S0167-8655(99)00019-7
[22]	Luo H, Gaborski R, Acharya R. Automatic segmentation of lung regions in chest radiographs: A model guided approach. In: Proceedings of the 2000 International Conference on Image Processing. Vancouver, BC, Canada: IEEE, 2000. 483-486
[23]	McInerney T, Terzopoulos D. Deformable models in medical image analysis: A survey. Medical Image Analysis, 1996, 1(2): 91-108 doi: 10.1016/S1361-8415(96)80007-7
[24]	王爱民, 沈兰荪. 图像分割研究综述. 测控技术, 2000, 19(5): 1-6, 16 doi: 10.3969/j.issn.1000-8829.2000.05.001 Wang Ai-Min, Shen Lan-Sun. Study surveys on image segmentation. Measurement and Control Technology, 2000, 19(5): 1-6, 16 doi: 10.3969/j.issn.1000-8829.2000.05.001
[25]	沈兰荪, 王爱民. 图像分割的分级性研究. 北京工业大学学报, 2000, 26(3): 33-38 doi: 10.3969/j.issn.0254-0037.2000.03.007 Shen Lan-Sun, Wang Ai-Min. Hierarchy of image segmentation. Journal of Beijing Polytechnic University, 2000, 26(3): 33-38 doi: 10.3969/j.issn.0254-0037.2000.03.007
[26]	McInerney T, Terzopoulos D. Topologically adaptable snakes. In: Proceedings of the 1995 IEEE International Conference on Computer Vision. Cambridge, MA, USA: IEEE, 1995. 840-845
[27]	王艳清, 卫保国, 蔡轶珩, 沈兰荪. 一种基于先验知识的自动舌体分割算法. 电子学报, 2004, 32(3): 489-491 doi: 10.3321/j.issn:0372-2112.2004.03.031 Wang Yan-Qing, Wei Bao-Guo, Cai Yi-Heng, Shen Lan-Sun. A knowledge-based arithmetic for automatic tongue segmentation. Acta Electronica Sinica, 2004, 32(3): 489-491 doi: 10.3321/j.issn:0372-2112.2004.03.031
[28]	王郁中, 杨杰, 周越, 郑元杰, 王忆勤. 图像分割技术在中医舌诊客观化研究中的应用. 生物医学工程学杂志, 2005, 22(6): 1128- 1133 doi: 10.3321/j.issn:1001-5515.2005.06.011 Wang Yu-Zhong, Yang Jie, Zhou Yue, Zheng Yuan-Jie, Wang Yi-Qin. Image segmentation in tongue characterization. Journal of Biomedical Engineering, 2005, 22(6): 1128- 1133 doi: 10.3321/j.issn:1001-5515.2005.06.011
[29]	吴佳, 张永红, 白净, 翁维良, 吴煜, 韩垚, 等. 基于分水岭变换和主动轮廓模型的舌体轮廓图像分割. 清华大学学报(自然科学版), 2008, 48(6): 1040-1043 doi: 10.3321/j.issn:1000-0054.2008.06.032 Wu Jia, Zhang Yong-Hong, Bai Jing, Weng Wei-Liang, Wu Yu, Han Yao, et al. Tongue contour image extraction using a watershed transform and an active contour model. Journal of Tsinghua University (Science and Technology), 2008, 48(6): 1040-1043 doi: 10.3321/j.issn:1000-0054.2008.06.032
[30]	Zhai X M, Lu H D, Zhang L Z. Application of image segmentation technique in tongue diagnosis. In: Proceedings of the 2009 International Forum on Information Technology and Applications. Chengdu, China: IEEE, 2009. 768-771
[31]	覃武星, 李斌, 岳小强. 一种基于初始化Snake轮廓线的混合舌图像分割算法. 中国科学技术大学学报, 2010, 40(8): 807-811 doi: 10.3969/j.issn.0253-2778.2010.08.007 Qin Wu-Xing, Li Bin, Yue Xiao-Qiang. A hybrid tongue image segmentation algorithm based on initialization of snake contours. Journal of University of Science and Technology of China, 2010, 40(8): 807-811 doi: 10.3969/j.issn.0253-2778.2010.08.007
[32]	Pang B, Wang K Q, Zhang S, Zhang F M. On automated tongue image segmentation in Chinese medicine. In: Proceedings of the 2002 Object Recognition Supported by User Interaction for Service Robots. Quebec City, Quebec, Canada: IEEE, 2002. 616-619
[33]	Guo J W, Yang Y K, Wu Q W, Su J L, Ma F. Adaptive active contour model based automatic tongue image segmentation. In: Proceedings of the 9th International Congress on Image and Signal Processing, BioMedical Engineering and Informatics. Datong, China: IEEE, 2016. 1386-1390
[34]	孙晓琳, 庞春颖. 一种改进snake模型的中医舌体分割方法. 长春理工大学学报(自然科学版), 2013, 36(5): 154-156 doi: 10.3969/j.issn.1672-9870.2013.05.043 Sun Xiao-Lin, Pang Chun-Ying. An improved snake model method on tongue segmentation. Journal of Changchun University of Science and Technology (Natural Science Edition), 2013, 36(5): 154-156 doi: 10.3969/j.issn.1672-9870.2013.05.043
[35]	王明英, 张新峰, 卓力. 一种基于Snakes模型的中医舌象分割改进算法. 测控技术, 2011, 30(5): 32-35 doi: 10.3969/j.issn.1000-8829.2011.05.007 Wang Ming-Ying, Zhang Xin-Feng, Zhuo Li. An improved snakes model for tongue image segmentation. Measurement and Control Technology, 2011, 30(5): 32-35 doi: 10.3969/j.issn.1000-8829.2011.05.007
[36]	Zhang H Z, Zuo W M, Wang K Q, Zhang D. A snake-based approach to automated segmentation of tongue image using polar edge detector. International Journal of Imaging Systems and Technology, 2006, 16(4): 103-112 doi: 10.1002/ima.20075
[37]	Salakhutdinov R, Mnih A, Hinton G. Restricted Boltzmann machines for collaborative filtering. In: Proceedings of the 24th International Conference on Machine Learning. Corvalis, Oregon, USA: ACM, 2007. 791-798
[38]	Shelhamer E, Long J, Darrell T. Fully convolutional networks for semantic segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(4): 640 -651 doi: 10.1109/TPAMI.2016.2572683
[39]	He K M, Gkioxari G, Dollár P, Girshick R. Mask R-CNN. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2020, 42(2): 386-397 doi: 10.1109/TPAMI.2018.2844175
[40]	Ren S Q, He K M, Girshick R, Sun J. Faster R-CNN: Towards real-time object detection with region proposal networks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017, 39(6): 1137-1149 doi: 10.1109/TPAMI.2016.2577031
[41]	Badrinarayanan V, Kendall A, Cipolla R. SegNet: A deep convolutional encoder-decoder architecture for image segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, 39(12): 2481-2495
[42]	Qu P L, Zhang H, Zhuo L, Zhang J, Chen G Y. Automatic tongue image segmentation for traditional Chinese medicine using deep neural network. In: Proceedings of the 13th International Conference on Intelligent Computing. Liverpool, UK: Springer, 2017. 247-259
[43]	Ronneberger O, Fischer P, Brox T. U-Net: Convolutional networks for biomedical image segmentation. In: Proceedings of the 18th International Conference on Medical Image Computing and Computer-Assisted Intervention. Munich, Germany: Springer, 2015. 234-241
[44]	Chen L C, Zhu Y K, Papandreou G, Schroff F, Adam H. Encoder-decoder with atrous separable convolution for semantic image segmentation. In: Proceedings of the 15th European Conference on Computer Vision. Munich, Germany: Springer, 2018. 833-851
[45]	Chen L C, Papandreou G, Kokkinos I, Murphy K, Yuille A L. DeepLab: Semantic image segmentation with deep convolutional nets, atrous convolution, and fully connected CRFs. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2018, 40(4): 834-848 doi: 10.1109/TPAMI.2017.2699184
[46]	Zhao H S, Shi J P, Qi X J, Wang X G, Jia J Y. Pyramid scene parsing network. In: Proceedings of the 2017 IEEE Conference on Computer Vision and Pattern Recognition. Honolulu, HI, USA: IEEE, 2017. 6230-6239
[47]	Chen L C, Papandreou G, Schroff F, Adam H. Rethinking atrous convolution for semantic image segmentation. arXiv: 1706.05587, 2017.
[48]	He K M, Zhang X Y, Ren S Q, Sun J. Deep residual learning for image recognition. In: Proceedings of the 2016 IEEE Conference on Computer Vision and Pattern Recognition. Las Vegas, NV, USA: IEEE, 2016. 770-778
[49]	He K M, Zhang X Y, Ren S Q, Sun J. Spatial pyramid pooling in deep convolutional networks for visual recognition. In: Proceedings of the 13th European Conference on Computer Vision. Zurich, Switzerland: Springer, 2014. 346-361
[50]	Ioffe S, Szegedy C. Batch normalization: Accelerating deep network training by reducing internal covariate shift. In: Proceedings of the 32nd International Conference on Machine Learning. Lille, France: JMLR. org, 2015. 448-456
[51]	Zhang D, Zhang H Z, Zhang B. Tongue Image Analysis. Singapore: Springer, 2017.
[52]	Huang Q, Dom B. Quantitative methods of evaluating image segmentation. In: Proceedings of the 1995 International Conference on Image Processing. Washington, DC, USA: IEEE, 1995. 53-56

施引文献

期刊类型引用(4)

1.	方归，刘怀广. 面向板料精准堆垛的线特征位姿标定方法. 包装工程. 2024(09): 185-192 . 百度学术
2.	陈长俊，唐丹，杨浩，游安清，潘旭东. 基于神经网络特征线提取的飞机位姿识别方法研究. 强激光与粒子束. 2024(06): 161-169 . 百度学术
3.	马宁，曹云峰. 面向无人机自主着陆的视觉感知与位姿估计方法综述. 自动化学报. 2024(07): 1284-1304 . 本站查看
4.	魏振忠，冯广堃，周丹雅，马岳鸣，刘明坤，罗启峰，黄腾达. 位姿视觉测量方法及应用综述. 激光与光电子学进展. 2023(03): 144-176 . 百度学术

其他类型引用(4)

资源附件(0)

访问统计

图(9) / 表(1)

计量

文章访问数: 1467
HTML全文浏览量: 1020
PDF下载量: 387
被引次数: 8

1. 非理想条件下的干扰因素
1.1 电极偏移
1.2 个体性差异
1.3 肌肉疲劳
1.4 肢体姿态
1.5 其他干扰或综合干扰
2. 研究现状中的主要问题
2.1 非理想因素之间的耦合性与过渡性
2.2 抗干扰方法中的主要问题
3. 非理想肌电识别的关键技术展望
3.1 构建统一开放的肌电等多传感器数据集
3.2 探索基于机器学习的肌电识别方法
3.3 探索基于机理建模的肌电识别方法
4. 结论

1. 非理想条件下的干扰因素
1.1 电极偏移
1.2 个体性差异
1.3 肌肉疲劳
1.4 肢体姿态
1.5 其他干扰或综合干扰
2. 研究现状中的主要问题
2.1 非理想因素之间的耦合性与过渡性
2.2 抗干扰方法中的主要问题
3. 非理想肌电识别的关键技术展望
3.1 构建统一开放的肌电等多传感器数据集
3.2 探索基于机器学习的肌电识别方法
3.3 探索基于机理建模的肌电识别方法
4. 结论

参考文献(52)

施引文献

资源附件(0)

访问统计

姓名
邮箱
手机号码
标题
留言内容
验证码

留言板

中医舌象分割技术研究进展: 方法、性能与展望

doi: 10.16383/j.aas.c180807

通讯作者:
李晓光北京工业大学副教授. 2003年于北京工业大学电子与信息工程专业获得学士学位, 2008年获得北京工业大学博士学位. 主要研究方向为计算机视觉/图像增强, 图像复原. 本文通信作者. E-mail: lxg@bjut.edu.cn

计量

Review on Tongue Image Segmentation Technologies for Traditional Chinese Medicine: Methodologies, Performances and Prospects

1. 非理想条件下的干扰因素

1.1 电极偏移

1.2 个体性差异

1.3 肌肉疲劳

1.4 肢体姿态

1.5 其他干扰或综合干扰

2. 研究现状中的主要问题

2.1 非理想因素之间的耦合性与过渡性

2.2 抗干扰方法中的主要问题

3. 非理想肌电识别的关键技术展望

3.1 构建统一开放的肌电等多传感器数据集

3.2 探索基于机器学习的肌电识别方法

3.2.1 基于深度学习的特征表示与特征学习

3.2.2 基于迁移学习的模型更新

3.3 探索基于机理建模的肌电识别方法

4. 结论

期刊类型引用(4)

其他类型引用(4)

计量

目录

1. 非理想条件下的干扰因素

1.1 电极偏移

1.2 个体性差异

1.3 肌肉疲劳

1.4 肢体姿态

1.5 其他干扰或综合干扰

2. 研究现状中的主要问题

2.1 非理想因素之间的耦合性与过渡性

2.2 抗干扰方法中的主要问题

3. 非理想肌电识别的关键技术展望

3.1 构建统一开放的肌电等多传感器数据集

3.2 探索基于机器学习的肌电识别方法

3.3 探索基于机理建模的肌电识别方法

4. 结论

留言板

中医舌象分割技术研究进展: 方法、性能与展望

doi: 10.16383/j.aas.c180807

通讯作者: 李晓光 北京工业大学副教授. 2003年于北京工业大学电子与信息工程专业获得学士学位, 2008年获得北京工业大学博士学位. 主要研究方向为计算机视觉/图像增强, 图像复原. 本文通信作者. E-mail: lxg@bjut.edu.cn

计量

出版历程

Review on Tongue Image Segmentation Technologies for Traditional Chinese Medicine: Methodologies, Performances and Prospects

1. 非理想条件下的干扰因素

1.1 电极偏移

1.2 个体性差异

1.3 肌肉疲劳

1.4 肢体姿态

1.5 其他干扰或综合干扰

2. 研究现状中的主要问题

2.1 非理想因素之间的耦合性与过渡性

2.2 抗干扰方法中的主要问题

3. 非理想肌电识别的关键技术展望

3.1 构建统一开放的肌电等多传感器数据集

3.2 探索基于机器学习的肌电识别方法

3.2.1 基于深度学习的特征表示与特征学习

3.2.2 基于迁移学习的模型更新

3.3 探索基于机理建模的肌电识别方法

4. 结论

期刊类型引用(4)

其他类型引用(4)

计量

出版历程

目录

1. 非理想条件下的干扰因素

1.1 电极偏移

1.2 个体性差异

1.3 肌肉疲劳

1.4 肢体姿态

1.5 其他干扰或综合干扰

2. 研究现状中的主要问题

2.1 非理想因素之间的耦合性与过渡性

2.2 抗干扰方法中的主要问题

3. 非理想肌电识别的关键技术展望

3.1 构建统一开放的肌电等多传感器数据集

3.2 探索基于机器学习的肌电识别方法

3.3 探索基于机理建模的肌电识别方法

4. 结论

通讯作者:
李晓光北京工业大学副教授. 2003年于北京工业大学电子与信息工程专业获得学士学位, 2008年获得北京工业大学博士学位. 主要研究方向为计算机视觉/图像增强, 图像复原. 本文通信作者. E-mail: lxg@bjut.edu.cn