2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

稀疏贝叶斯混合专家模型及其在光谱数据标定中的应用

俞斌峰 季海波

陈玲玲, 李珊珊, 刘作军, 张燕. 基于表面肌电的下肢肌肉功能网络构建及其应用研究. 自动化学报, 2017, 43(3): 407-417. doi: 10.16383/j.aas.2017.c160230
引用本文: 俞斌峰, 季海波. 稀疏贝叶斯混合专家模型及其在光谱数据标定中的应用. 自动化学报, 2016, 42(4): 566-579. doi: 10.16383/j.aas.2016.c150255
CHEN Ling-Ling, LI Shan-Shan, LIU Zuo-Jun, ZHANG Yan. Construction of Lower Limb's Functional Muscle Network and Its Application Based on Surface EMG. ACTA AUTOMATICA SINICA, 2017, 43(3): 407-417. doi: 10.16383/j.aas.2017.c160230
Citation: YU Bin-Feng, JI Hai-Bo. Sparse Bayesian Mixture of Experts and Its Application to Spectral Multivariate Calibration. ACTA AUTOMATICA SINICA, 2016, 42(4): 566-579. doi: 10.16383/j.aas.2016.c150255

稀疏贝叶斯混合专家模型及其在光谱数据标定中的应用

doi: 10.16383/j.aas.2016.c150255
基金项目: 

国家高技术研究发展计划(863计划) AA2100100021

详细信息
    作者简介:

    季海波, 中国科学技术大学自动化系教授.1984年获得浙江大学力学与机械工程系学士学位, 1990年获得北京大学力学与工程科学系理学博士学位. 主要研究方向为非线性及自适应控制.E-mail:jihb@ustc.edu.cn

    通讯作者:

    俞斌峰, 中国科学技术大学自动化系博士研究生.2010年获得中国科学技术大学自动化系学士学位. 主要研究方向为机器学习和光谱分析. 本文通信作者.E-mail:ybfeng@mail.ustc.edu.cn

Sparse Bayesian Mixture of Experts and Its Application to Spectral Multivariate Calibration

Funds: 

National High Technology Research and Devel-opment Program of China (863 Program) AA2100100021

More Information
    Author Bio:

    Professor in the Depart- ment of Automation, University of Science and Technology of China. He received his bachelor degree and Ph. D. de- gree in mechanical engineering from Zhejiang University and Beijing University, in 1984 and 1990, respectively. His research interest covers nonlinear control and adaptive con- trol.

    Corresponding author: YU Bin-Feng Ph. D. candidate in the Department of Automation, Uni- versity of Science and Technology of China. He received his bachelor degree from University of Science and Tech- nology of China in 2010. His research interest covers ma- chine learning and spectral analysis. Corresponding author of this paper.
  • 摘要: 在光谱数据的多元校正中, 光谱数据通常是在多种不同的环境条件下收集的. 为了建模来源于不同环境中的高维光谱数据, 本文提出了一种新的稀疏贝叶斯混合专家模型, 并将其用来选择多元校正模型的稀疏特征. 混合专家模型能够把训练数据划分到不同的子类, 之后使用不同的预测模型来分别对划分后的数据进行预测, 因此这种方法适合于建模来自于多种环境下的光谱数据. 本文提出的稀疏的混合专家模型利用稀疏贝叶斯的方法来进行特征选择, 不依赖于事先指定的参数; 同时利用probit模型作为门函数以得到解析的后验分布, 避免了在门函数分类模型中进行特征提取时需要的近似. 本文提出的模型与其他几种常用的回归模型在人工数据集和几个公开的光谱数据集上进行了比较, 比较结果显示本文提出的模型对多个来源的光谱数据进行浓度预测时精度比传统的回归方法有一定的提高.
  • 肌电信号 (Electromyography, EMG) 在激发肌肉活动时产生, 是一种重要的运动生物力学信息, 与人体的期望动作直接相关, 尤其是表面肌电信号以其无创伤测量、易提取的优点, 成为感知人体运动意图的理想信息源, 广泛地应用于外骨骼助行机器人、假肢等下肢康复辅具控制[1-3].

    通过EMG可以在未做出动作前获取主动运动意图, 相对于仅仅采集姿态、速度等运动力学信息的传统方法具有明显优势[4-5].在肌电控制下肢康复辅具过程中, 为了得到更好的模式识别结果, 确定能更好地区分各模式的肌电信号采集位置非常重要.

    虽然下肢表面EMG蕴含足够的信息以表达患者应对运动模式更替的意愿, 但是目前肌电电极放置位置并没有成熟的理论依据和统一标准, 缺乏对不同运动模式过程中全面动态EMG的变化与联系的理论层次解读.

    通常是基于解剖学的已有知识, 通过对下肢各主要肌群进行统计学分析或实验[6-9], 分析比较各肌群的EMG关联关系.例如, 佟丽娜等[6]利用健康个体单侧8块主要肌群的表面EMG识别下肢踏车、行走和椭圆运动模式, 通过分析8路信号的平均相似度及标准差, 将8块肌肉减少到3块, 最终准确率高达91.67 %.又如佘青山等[7]通过大量反复实验, 选用4块大腿肌肉作为下肢EMG的来源, 将一个步态周期细分为支撑前期、支撑中期等5种运动模式. He等[8]则通过分析坐下、蹲、上下楼及行走过程中的单侧13块肌肉, 确定各种运动过程中的主要作用肌群.虽然以上肌肉采集位置的确定方法已经涵盖了下肢的大部分肌群, 取得了较好的研究成果, 但是仍未覆盖整个下肢表面.随着肌群个数的增加, 统计学分析或实验的工作量将急剧增加, 因此对整个下肢表面的EMG进行综合分析与比较是不现实的, 这就使得当前的运动模式识别结果有可能不是最理想的, 有可能通过肌电位置优化进一步提高识别效果.

    另一方面, 为了全面、深入了解不同运动模式中的电生理过程, 对运动模式做出准确的识别, 需要采集多个通道的EMG [10-11], 获取全面的动态肌电信息.但是肌肉之间又存在着严重的相似性, 需要通过分析各通道间的耦合关系最大限度地减少电极数目.

    常用主元分析法 (Principal component analysis, PCA) 根据各特征参数的贡献率降低特征参数维数[12].虽然对于特定信号效果很好, 但是对各肌肉贡献率描述中无法体现时间信息.由于各肌肉在每个运动阶段的作用不同, 贡献率也不同, 可能两块肌电特性相似的肌肉贡献率都很大, 也可能贡献率低的肌肉在某阶段运动描述中必不可少.所以, 简单的PCA分析并不能完全揭示下肢肌肉的神经动力学关系.

    复杂网络理论作为一种研究复杂系统动力学的有效方法, 首先由Watts等[13]和Barabási等[14]提出, 复杂网络的局部和全局特性能够清晰地刻画组成复杂系统的不同元素之间的相互关系和信息流动过程, 在大脑功能认识[15-16]、蛋白质互相作用网络[17]、网络搜索、传染病控制及突发事件预报等方面提供了很好的科学理解和定量分析.尤其是脑功能网络, 是复杂网络理论在神经科学中的重要应用, 已经得到很多重要成果, 并为揭示脑疾病的病理机制提供了新思路[15-16].

    本文将复杂网络理论应用于下肢EMG分析, 在下肢肌肉表面选取90个EMG采集点作为节点, 构建下肢肌肉功能网络; 通过网络拓扑属性分析[18-19], 证明下肢肌肉功能网络的小世界属性, 总结其统计学特点; 在网络层面分析不同运动模式过程中的拓扑结构差异和肌肉功能共异性, 深入分析不同运动模式状态下肌肉功能结构的共异性, 确定与运动模式更替关联度大的肌群和电极位置.下肢肌肉功能网络构建与分析将揭示下肢EMG与运动模式更替之间的关系, 为运动模式识别与调控提供可靠的理论支持.

    依次记录两侧下肢的整个肌肉系统在3种运动模式 (平地行走、上楼梯和下楼梯) 过程中的表面EMG, 构建下肢肌肉功能网络, 深入讨论各采集点与模式切换间的关系.

    定义1.一个无向无权网络$G=(V, E)$具有$n$个节点和$m$条边, 其顶点集为$V=\{V_1, \cdots, V_n \}$, 边集合为

    $ E= \left\{ {E_j|E_j\in V\times V, \ j =1, \cdots, m} \right\} $

    (1)

    定义2.构造网络$G$的邻接矩阵$A=(A_{ij})_{n\times n}$

    $ {A_{ij}} = \left\{ {\begin{array}{*{20}{l}} {1, }&{{\rm{若}}\left| {{C_{ij}}} \right| \ge TH}\\ {0, }&{若\left| {{C_{ij}}} \right| < TH} \end{array}} \right. $

    (2)

    其中, $C_{ij}$为节点$i$和节点$j$间的Pearson系数, $TH$为阈值.如果$A_{ij}=1$, 表示节点$i$与$j$之间有连边, 否则$A_{ij}=0$, 表示节点$i$与$j$之间无连边.

    将人体下肢与运动模式变化相关的肌肉系统分为10个区域, 左腿和右腿的EMG采集点分布情况相同, 以左侧下肢为例, 如图 1所示, 左侧下肢分为5个区域.在两侧下肢肌肉表面均匀选取$n=90$个EMG采集点作为节点, 记作$V1$ $\sim$ $V90$, 如表 1所示.

    图 1  左腿肌电电极放置位置
    Fig. 1  EMG electrodes placement of left leg
    表 1  肌电电极分区与分布情况
    Table 1  The partition and distribution of EMG electrodes
    区域 个数 节点 名称 位置 分布情况
    1 12 V01~V12 LTF1~LTF12 左侧大腿前侧 四排三列
    2 11 V13~V23 LTP1~LTP12 左腿大腿后侧 三列 (三排一列+四排两列)
    3 10 V24~V33 LTL1~LTL10 左腿大腿外侧 五排两列
    4 4 V34~V37 LCF1~LCF4 左侧小腿前侧 纵向排列
    5 8 V38~V45 LCP1~LCP8 左腿小腿后侧 四排两列
    6 12 V46~V57 RTF1~RTF12 右侧大腿前侧 四排三列
    7 11 V58~V68 RTP1~RTP12 右腿大腿后侧 三列 (三排一列+四排两列)
    8 10 V69~V78 RTL1~RTL10 右腿大腿外侧 五排两列
    9 4 V79~V82 RCF1~RCF4 右侧小腿前侧 纵向排列
    10 8 V83~V90 RCP1~RCP8 右腿小腿后侧 四排两列
    下载: 导出CSV 
    | 显示表格

    相对于上肢而言, 下肢的运动更具有周期性特点, 一个步态周期定义为从脚跟着地开始到同侧脚跟再次着地结束 (图 2 (a)), 可以分为支撑相和摆动相两个部分.采集不同步速下$(Fast: 1.75 {\rm m/s}$; $Normal:$ $1.25 {\rm m/s}$; $Slow: 0.75 {\rm m/s})$股直肌的表面EMG, 计算其均方根, 如图 2 (b) 所示, 在整个运动周期内, EMG呈周期性变化, 股直肌在支撑相末期至摆动相中期、摆动相末期至支撑相中期两阶段起作用, 肌电信号比较活跃, 并随步速增加而增加.而股二头肌EMG的均方根 (图 2 (c)) 在摆动相中末期、首次触地至承重反应结束过程中起作用.

    图 2  一个步态周期膝关节角度与EMG
    Fig. 2  The knee angle and EMG of a gait stride

    由于数据采集点来自双侧下肢, 所以仅记录并分析支撑相 (从脚跟着地开始到同侧脚脚尖离地结束) 过程的EMG.

    选取采集点支撑相的$i$的EMG样本数据, 采用移动时间窗进行处理, 将其分为$w$段信号, 进行去除零点漂移、滤波等预处理后, 通过提取时间窗内的特征向量, 用于下肢肌肉功能网络构建.为了便于兼顾过程的时变性和信息的完整性, 选择移动窗的窗口长度$h=150 \rm ms$, 步长$S=50 \rm ms$, 采样频率2 000 Hz.

    选择EMG采集点$i$ $(i=1, 2, \cdots, n)$的第$t$ $(t$=$1, 2, \cdots, w)$时间窗, 设时间窗内的$h$个EMG数据为$x_{it}=\left\{x_{it}(1), x_{it}(2), \cdots, x_{it}(h)\right\}$, 计算$x_{it}$的8个时域和频域特征向量, 包括最大值$(Ma_{it})$、绝对值平均$(Mav_{it})$、标准差$(Std_{it})$、均方根$(RMS_{it})$、能量$(V_{it})$、平均功率频率$(MPF_{it})$、中值频率$(MFP_{it})$、峰值频率$(F_{it})$.

    $ M{a_{it}} = \max \left\{ {{x_{it}}(1), {x_{it}}(2), \cdots, {x_{it}}(h)} \right\} $

    (3)

    $ Ma{v_{it}} = \sum\limits_{q = 1}^h {\frac{{\left| {{x_{it}}(q)} \right|}}{h}} $

    (4)

    $ St{d_{it}} = \sqrt {\sum\limits_{q = 1}^h {\frac{{{{\left[{{x_{it}}(q)-{{\bar x}_{it}}} \right]}^2}}}{{h -1}}} } $

    (5)

    其中, $\overline{x}_i=\sqrt {\sum_{q=1}^h{x^{2}_{it}(q)/h}}$.

    $ RM{S_{it}} = \sqrt {\sum\limits_{q = 1}^h {\frac{{x_{it}^2(q)}}{h}} } $

    (6)

    $ {V_{it}} = \sum\limits_{q = 1}^h {\left| {{x_{it}}} \right|} $

    (7)

    $ MP{F_{it}} = \frac{{\int_0^\infty f \times {s_{it}}(f){\rm{d}}f}}{{\int_0^\infty {{s_{it}}} (f){\rm{d}}f}} $

    (8)

    $ MF{P_{it}} = 0.5\int_0^\infty {{s_{it}}} (f){\rm{d}}f $

    (9)

    $ {F_{it}} = \max \left[{{s_{it}}(f)} \right] $

    (10)

    其中, $s_{it}(f)$为功率谱密度函数.

    比较发现, 增加时域或频域特征向量的个数对于复杂网络的连边影响很小.经过多次试验与对比, 选取绝对值平均$(Mav_{it})$、均方根$(RMS_{it})$、能量$(V_{it})$、中值频率$(MFP_{it})$四个特征值构建复杂网络.

    提取EMG采集点$i$的第$t$时间窗的特征值, 构建矩阵$T_{it}$:

    $ T_{it}=(Mav_{it}, RMS_{it}, V_{it}, MFP_{it}) $

    (11)

    其中, $i$表示EMG采集点的标号.

    EMG采集点$i$的特征值构建$w\times 4$的矩阵$T_i$:

    $ T_i=(Mav_i, RMS_i, V_i, MFP_i) $

    (12)

    对矩阵$T_i$进行归一化处理, 得到$T_i'$:

    $ T'_i=(mav_i, rms_i, v_i, mfp_i) $

    (13)

    所有EMG采集点的每个特征向量构成一个$w$ $\times$ $n$的特征矩阵$M_p$ $(p=1, 2, 3, 4)$, $M_1=mav$, $M_2$ $=$ $rms$, $M_3=v$, $M_4=mfp.$

    计算特征矩阵$M_p$的任意两列向量间的Pearson系数

    $ {C_{pij}} = \frac{{\sum\limits_{t = 1}^w {\{ [{M_{pi}}(t)-\langle {M_{pi}}\rangle] \times [{M_{pj}}(t)-\langle {M_{pj}}\rangle]\} } }}{{\sqrt {\sum\limits_{t = 1}^w {{{[{M_{pi}}(t)-\langle {M_{pi}}\rangle]}^2}} } \times \sqrt {\sum\limits_{t = 1}^w {{{[{M_{pj}}(t)-\langle {M_{pj}}\rangle]}^2}} } }} $

    (14)

    其中, $C_{pij}$为肌电采集点$i$和肌电采集点$j$间的第$p$个特征值的Pearson系数, $M_{pi}$和$M_{pj}$分别为第$p$个特征值的矩阵$M_p$的第$i$列和第$j$列$(i=1, 2$, $\cdots, n$, $j=1, 2, \cdots, n)$, $M_{pi}(t)$和$M_{pj}(t)$分别为向量$M_{pi}$和$M_{pj}$的第$t$行元素, $\langle M_{pi}\rangle$和$\langle M_{pj}\rangle$分别为向量$M_{pi}$和$M_{pj}$的$w$个元素的平均值.

    肌电采集点$i$和肌电采集点$j$间的Pearson系数

    $ C_{ij}=\frac{1}{{4}}{\sum\limits_{p=1}^4{C_{pij}}} $

    (15)

    计算$n$个EMG采集点间的Pearson系数构成一个对称矩阵$C=(C_{ij})_{n\times n}$, 评价各肌电采集点间的相关程度.

    构建下肢EMG网络, 把每个采集位置看作一个节点, 分析任意两点间的相关性, 如果两点间的相关系数大于给定阈值$TH$, 则认为两点间有功能性连接, 各采集点间的连接关系代表网络连边.

    如果阈值取得过小, 那么可能建立起一个完全连通的下肢肌肉功能网络图, 对于肌电电极采集点分析没有任何意义; 如果阈值取得过大, 则可能建立一个过于稀疏的网络, 致使大量有用信息丧失, 所以阈值选择对于网络构建至关重要.

    选取合适的阈值并在连接强度大于阈值的节点间建立连接边.阈值的选择直接影响邻接矩阵边的生成和下肢肌肉功能网络的拓扑结构, 不同的阈值会导致网络规模和网络结构发生明显变化, 以下楼梯为例, 如图 3所示, 构建不同阈值$TH$的下肢肌肉功能网络, 分析得到阈值$TH$与稀疏度$S_p$间的函数关系.

    图 3  网络稀疏度与阈值关系
    Fig. 3  The relationship of network sparsity and threshold

    $ S_p=-0.72 TH+0.674 $

    (16)

    即阈值与网络稀疏度成反比关系, 阈值越大, 网络越稀疏, 相应的节点之间的连边越少, 各节点之间的联系较分散; 反之, 阈值越小, 网络越密集, 相应节点之间的连边越多, 各节点之间联系越紧密.

    式 (16) 中, 在阈值$TH=0.75$时, 网络稀疏度为0.2, 如图 3 (b) 所示, 网络可以分为两个社团结构; 而当阈值过大时, 稀疏度过小, 如图 3 (a) 所示, 虽然也可看大体的社团分布情况, 但是会出现9个孤立点, 致使有些连接被忽视; 当阈值过小时, 稀疏度较大, 如图 3 (c)图 3 (d) 所示, 过于密集的网络结构致使社团结构不明显, 结构趋向于随机.

    计算两两肌电采集位置间的Pearson系数, 利用合适的阈值, 得到$90\times90$的邻接矩阵.当阈值$TH$ $=$ $0.75$时, 构建三种运动模式 (平地、上楼和下楼) 的邻接矩阵, 如图 4所示.其中, 横坐标和纵坐标表示EMG采集位置的节点序号, 黑色表示两点之间有连接, 白色表示无连接.三种模式相比, 节点间相关程度高的节点均不相同.

    图 4  三种运动模式的邻接矩阵
    Fig. 4  Adjacency matrix under three motions

    图 4 (a) 知, 平地模式中各节点间的联系比较紧密, 尤其是节点$10$ $\sim$ $72$间的大部分节点间的关系都比较紧密; 而上下楼梯模式的节点间的相关程度较低, 如图 4 (c) 所示, 下楼梯模式下, 只有节点$1$ $\sim$ $15$之间、节点$21$ $\sim$ $33$间的相关程度较高.所以, 可以利用所得的邻接矩阵构建下肢肌肉功能网络, 通过分析网络的拓扑属性确定与运动模式更替关系密切的EMG采集位置.

    利用图论方法, 计算节点度 (Node degree)、平均度 (Average degree)、聚类系数 (Clustering coefficient)、平均路径长度 (Average path length)、介数 (Betweenness) 等特征参数[13-19], 进一步分析网络的连接规律.

    2.3.1   节点度ki

    节点度${ k}_i$表示与节点$i$相关联的边的条数, 反映这个节点在网络中的活跃度, 和节点对其相邻节点的影响力.节点度越大, 节点对其相邻节点的重要度贡献越大, 在网络中起着更重要的作用.

    $ k_i=\sum\limits_{j=1}^n{A_{ij}} $

    (17)
    2.3.2   平均度$\langle \boldsymbol{k}\rangle $

    网络的平均度$ \langle { k} \rangle$表示整个网络中所有节点度的平均值.

    $ \langle k\rangle=\frac{1}{{N}}\sum\limits_{i, j=1}^n{A_{ij}} $

    (18)
    2.3.3   聚类系数$\boldsymbol{CC}_{\boldsymbol{i}}$

    聚类系数${ {CC}}_{i}$表示节点$i$聚集程度的系数, 是描述网络集团化的重要指标.

    $ CC_i=\frac{2e_i}{{k_i({k_i}-1)}} $

    (19)

    其中, $e_i$为节点$i$与相连的$k_i$个节点间实际存在的边数.

    2.3.4   平均路径长度$\boldsymbol{L}$

    平均路径长度${ L}$表示任意两个节点之间距离的平均值.

    $ L={\frac{n}{{K}}}f(nKp) $

    (20)

    其中, $f (\cdot)$为普适标度函数, $K$为平均节点度, $p$为重连概率.

    2.3.5   介数$\boldsymbol{B}_{\boldsymbol{i}}$

    介数${ B}_{i}$表示网络中所有的最短路径中, 经过该节点的数量, 反映了节点的影响能力, 因此介数大的点在网络信息传输中起关键作用.

    $ B_i=\sum\limits_{j, m\in V, i\neq j\neq m}{\frac{\sigma_{j.m}(i)}{{\sigma_{j, m}}}} $

    (21)

    其中, $\sigma_{j, m}$表示节点$j$和节点$m$间最短路径总数, $\sigma_{j, m}(i)$则表示经过节点$i$且连接节点$j$和节点$m$的最短路径总数.

    网络介数分析了网络中节点对间沿着最短路径传输信息的控制能力, 如果两个节点之间没有路径, 或者一个节点没有位于另外两个节点之间的任何一条最短路径上, 则说明该节点对另外两个节点之间的信息传输没有直接控制能力.

    利用Delsys公司的Trigno Wireless System无线采集系统, 记录3种行走模式 (平地、上楼和下楼, 其中楼梯台阶高度为15 cm) 在支撑相的下肢表面EMG, 如图 5所示.受试者具体情况如表 2所示, 均无下神经肌肉或肌肉骨骼方面疾病.

    图 5  右侧大腿肌电电极放置位置
    Fig. 5  EMG electrodes placement on the right
    表 2  受试者信息
    Table 2  The information of subjects
    实验对象 性别 年龄 身高 (cm) 体重 (kg)
    S1 24 165 48
    S2 24 170 54
    S3 45 162 65
    S4 65 155 73
    S5 23 172 80
    S6 27 180 95
    S7 42 175 70
    S8 62 170 72
    下载: 导出CSV 
    | 显示表格

    对每个节点采集的EMG进行预处理, 提取4个时频域特征向量 (绝对值平均、均方根、能量、中值频率).利用每个节点的特征向量计算皮尔森系数, 选取适当的阈值, 得到邻接矩阵, 其中0代表两个节点之间没有连边, 1代表两个节点之间有连边.利用netdraw软件画出各运动模式的功能网络, 如图 6所示.

    图 6  三种模式的肌肉功能网络
    Fig. 6  The functional muscle network of three patterns

    图 6可知, 不同运动模式下的复杂网络及作用节点均具有明显差异.其中, 平地模式连边数最多, 说明各节点间的相似程度较高, 在平地运动时, 存在相似电运动的电极位置较多.上楼和下楼模式的功能网络连边数相对少一些, 社团结构比较明显, 说明在两种模式过程中, 存在一些节点位置的EMG时域特性比较特殊, 与其他节点的相似程度比较低, 分析并确定这些特殊的、具有显著差异的节点, 有助于识别运动模式间的更替.

    经过大量的实验证明[13-19], 绝大部分复杂网络都具有小世界特性, 规则网络和随机网络都无法再现许多实际网络具有的小世界特征.小世界网络既不像随机网络具有较短的平均路径和较低的聚类系数, 也不像规则网络具有较长的平均路径和较高的聚类系数, 而是介于两者之间.

    为了证明下肢肌肉功能网络的小世界特性, 根据式 (18) $\sim$ (20) 计算三种运动模式的复杂网络特性, 包括网络节点数$n$, 网络节点的平均度$\langle k\rangle$, 总连边数$edges$, 聚类系数$CC$, 平均路径长度$L$, 对应的规则网络的聚类系数$C_{nc}$和平均路径长度$L_{nc}$, 对应的随机网络的聚类系数$C_{ER}$和平均路径长度$L_{ER}$.

    计算小世界特性的指标如下:

    $ \gamma =\frac{C}{{C_{ER}}} $

    (22)

    $ \lambda =\frac{L}{{L_{ER}}} $

    (23)

    $ \sigma =\frac{\gamma}{\lambda} $

    (24)

    只有当$\gamma>1$, $\lambda \approx 1$, $\sigma>1$同时满足时, 该网络才符合小世界网络特性.计算三种运动模式下复杂网络的主要特性参数, 如表 3所示.三种运动模式的复杂网络均符合$\gamma>1$, $\lambda \approx 1$, $\sigma>1$的小世界特性指标, 因此, 说明构建的下肢肌肉功能网络具有小世界的网络特性, 即任意两个节点间的距离都维持在一个相对较小的固定值, 可以通过分析网络的节点度、聚类系数等统计特征研究网络性质, 为分析下肢肌肉的协调工作机制提供新的方法.

    表 3  三种模式复杂网络的小世界特性参量统计
    Table 3  Three models of complex networks of small world characteristic parameter statistics
    运动模式 $n$ $langlekrangle$ $edges$ $CC$ $L$ $C_{nc}$ $L_{nc}$ $C_{ER}$ $L_{ER}$ $gamma=C/{C_{ER}}$ $lambda=L/{L_{ER}}$ $sigma=gamma/lambda$
    平地 90 30.0 2487 0.8883 1.7857 0.7241 1.3833 0.3659 1.2992 2.4277 1.3745 1.7662
    上楼梯 90 13.1 1091 0.8874 2.3736 0.6880 3.1679 0.1598 1.7129 5.5532 1.3857 4.0075
    下楼梯 90 16.1 1337 0.8318 2.0372 0.7003 2.5776 0.1963 1.5902 4.2374 1.2811 3.3076
    下载: 导出CSV 
    | 显示表格

    阈值的选取对于复杂网络的构建尤为重要, 为了确定合适的阈值, 利用不同阈值构建下肢肌肉功能网络.由于复杂网络的稀疏度不能超过0.5 [20], 所以阈值设定从0.5开始, 每次增加0.05, 直至0.95.以下楼梯模式为例, 计算各网络的稀疏度$S_p$、平均度$\langle k\rangle$及聚类系数$CC$, 如表 4所示.

    表 4  不同阈值下的网络统计特性
    Table 4  Network statistical characteristics under different threshold
    $TH$ 稀疏度$S_p$ 平均度$langlekrangle$ 聚类系数$CC$
    0.5 0.4916 40.81 0.7527
    0.55 0.4266 35.41 0.7665
    0.6 0.3648 30.28 0.7708
    0.65 0.3024 25.10 0.7899
    0.7 0.2472 20.52 0.7945
    0.75 0.1941 16.11 0.8318
    0.8 0.1418 11.77 0.8250
    0.85 0.0910 7.55 0.8193
    0.9 0.0565 4.69 0.7194
    0.95 0.0344 2.86 0.5770
    下载: 导出CSV 
    | 显示表格

    表 4可以看出, 下肢肌肉功能网络的平均度和稀疏度均与阈值成反比, 聚类系数则随着阈值增加呈现抛物线变化, 即会出现一个极大值点.聚类系数是描述一个复杂网络任意两节点之间互相关联的概率, 其值越大, 表示节点之间联系越紧密.所以选取聚类系数达到最大值 (0.8318) 时的阈值$TH$ $=$ $0.75$, 此时稀疏度为0.1941, 比较合适.

    从控制信息传输的角度而言, 介数越高的节点其重要性也越大.分析三种运动模式 (平地、上楼和下楼) 的下肢肌肉功能网络, 计算节点的介数, 如表 5所示.

    表 5  不同模式下节点介数特性统计
    Table 5  Node betweenness under different model
    排序 平地 下楼 上楼
    1 RTL4h   280.1 LCP6h   1644.4 RCP4h   557.2
    2 RTF9h   277.7 RTP6h   1473.8 RCP8h   366.5
    3 RTL10h   267.0 RCP3h   1369.9 RCP6h   344.4
    4 LTP5h   236.4 LTL4h   1304.2 RCP5h   327.2
    5 RTF10h   208.8 RTP3h   1216.6 RTP6h   318.2
    6 RTF7h   180.6 RCP2h   1212.6 LTP3h   301.6
    7 LTF10h   161.4 RTL1h   1198.6 RTF8h   287.5
    8 LCP3h   151.1 RTL9h   1141.3 RTP3h   221.2
    9 RTF1h   135.9 RTP2h   1048.7 RTP1h   218.5
    10 LCP5h   128.4 RTL2h   932.4 RTL8h   193.0
    下载: 导出CSV 
    | 显示表格

    表 5可知, 不同运动模式下介数最大的节点完全不同, 说明在各种运动模式中的重要节点不同.另外, 各运动模式的介数最大值也不同, 平地为280.1, 上楼梯为557.2, 下楼梯更是高达1 644.4, 这是因为各种功能网络的节点间连接不同, 连边数量也有差异.同时, 节点对之间的传输频率不完全相同, 也并非所有的传输都是基于最短路径的.因此, 介数最大值存在明显差异, 下楼数据远高于上楼及平地 (P < 0.001), 上楼数据平均也高于平地数据 (P=0.009).

    综合考虑所有肌电采集点的3个主要特性参数 (节点度$k_i$、聚类系数$CC_i$、介数$B_i$), 对上楼梯、下楼梯与平地进行组间差异分析, 并采用投票的方式选取出整个网络差异值最大的几个节点, 发现整个数据采集区域中共有8个采集点具有显著差异 (P < 0.05), 如表 6所示.

    表 6  不同模式下节点介数特性统计
    Table 6  Node betweenness under different model
    排序 节点标号 位置
    1 RTP5 右腿大腿后侧
    2 LTP1 左腿大腿后侧
    3 LTL7 左腿大腿后侧
    4 LTF9 左腿大腿前侧
    5 RTL6 右腿大腿外侧
    6 RCP2 右腿小腿后侧
    7 LCP5 左腿小腿后侧
    8 RTF11 右腿大腿前侧
    下载: 导出CSV 
    | 显示表格

    在三种运动模式的下肢功能网络中 (阈值均为0.75) 标出8个具有显著差异的节点, 如图 7所示, 用连线图形象直观地展示了不同模式的重要节点连接关系.发现各点分布很均匀, 左右腿各4个, 其中大腿3个, 小腿1个.另外, 由于平地与上/下楼梯运动过程中, 主要是后侧肌肉工作方式有区别, 因此重要节点有4个位于人体后侧, 前侧和两侧分别2个, 分析结果与实际运动情况相吻合.

    图 7  三种模式间具有显著差异的节点
    Fig. 7  The nodes with significant difference among three patterns

    利用表 7中列出的8个肌电采集位置 (单侧腿4个) 的表面EMG进行运动模式识别, 与常用各下肢肌肉肌腹中心位置[6-7]的表面EMG相比较.其中常用肌肉如下:

    表 7  不同特征提取方法的模式识别比较
    Table 7  Comparison of pattern recognition based on different methods of feature extraction
    序号 单侧肌肉数目 肌肉采集点 识别率 (%)
    LDA SVM NN
    S1 12 大腿:RF, VL, BF, VM, ST, SM, AL, KTF小腿:TA, PL, GM, SM 78.1 82.3 80.2
    S2 8 大腿:RF, VL, BF, VM, ST小腿:TA, GM, SM 91.4 93.1 92.2
    S3 6 大腿:RF, VL, BF, VM小腿:TA, GM 95.6 97.6 97.3
    S4 3 大腿:RF, VL小腿:SM[6] 84.4 85.7 86.4
    S5 4 大腿:VM, SM, AL, KTF[7] 87.4 90.6 89.9
    S6 4 下肢肌肉功能网络分析结果 95.3 98.4 97.9
    下载: 导出CSV 
    | 显示表格

    1) 大腿肌肉:股直肌 (RF)、股外侧肌 (VL)、股二头肌 (BF)、股内侧肌 (VM)、半腱肌 (ST)、半膜肌 (SM)、长收肌 (AL)、阔筋膜张肌 (KTF);

    2) 小腿肌肉:胫骨前肌 (TA)、腓骨长肌 (PL)、内侧腓肠肌 (GM)、比目鱼肌 (SM).

    分别利用常用的线性判别分析 (Linear discriminant analysis, LDA)、支持向量机 (Support vector machine, SVM) 和神经网络 (Neural networks, NN), 对各种肌肉组合形式的采集点进行三种运动模式识别 (平地、上/下楼梯), 如表 7所示.

    表 7可知, 基于下肢肌肉功能网络选出的采集节点$S6$, 在模式识别中各种识别算法均可得到较好的识别结果, 能够满足下肢运动识别的需求.肌群的个数并非越多越好, 例如$S1$, 选择过多的与模式更替无关的肌群, 不仅无法提高识别效果, 还会大大降低识别精度.

    虽然$S3$选择6组肌肉的情况也可以取得理想的识别效果, 但是所需电极数量将会增加, 人体两侧共需增加$2\times 2=4$个肌电电极, 将为信号的采集与处理带来不必要的麻烦.由于6组肌肉可以与网络选择的4组肌肉得到相近的识别效果, 说明6组肌肉中存在2组是冗余信息, 可以通过复杂网络分析有效地降低肌电采集个数.

    另一方面, $S4$所选肌群虽然在下肢踏车、行走和椭圆运动模式取得了较好的识别结果[6], 但是并不适用于平地与上/下楼梯运动识别, 需要针对不同的识别目的, 进行大量的统计学分析进行筛选.由于$S5$只选择了大腿肌肉, 因此识别效果也欠佳, 重新的选择仍需大量的实验与分析.

    综上所述, 基于下肢肌肉功能网络可以对运动相关肌肉的全面动态EMG进行综合分析, 确定与不同模式关联度大的肌群和电极放置位置, 为运动模式识别提供可靠的基础支持.

    选取下肢主要肌肉表面的90个肌电采集位置作为节点, 通过分析各节点的表面EMG间的相关性, 构建下肢肌肉功能网络.在网络层面分析不同运动模式状态下的拓扑结构差异, 深入分析平地、上下楼梯三种模式中下肢肌肉功能网络的共异性, 最终确定了与运动模式更替关联度大的肌群和电极位置, 为下肢康复辅具中的肌电采集位置的确定提供了理论依据.

    此方法可以推广到其他肌电控制康复辅具, 尤其是肌电假肢膝关节[21], 由于大腿截肢, 部分肌肉被切除, 原有的机能受到了很大的破坏, 残肢肌肉无法像健康人一样有力的收缩, 不能完全参考健肢肌肉放置电极.可以构建残肢肌肉功能网络, 确定与运动模式更替关联度更大的肌电采集位置.

    下肢肌肉功能网络的研究中, 还有很多亟待解决的问题, 包括社团探寻、加权网络及动态网络的构建及分析等.随着研究的深入, 基于复杂网络的下肢肌电分析方法必将为下肢康复辅具控制提供更多的理论支持.

  • 图  1  SME的概率图模型

    Fig.  1  The probabilistic graph of the SME model

    图  2  不同专家数时的似然函数下界

    Fig.  2  Plot of the lower bound L(q) versus the number of experts

    图  3  专家模型在不同维度上的精度矩阵A 的后验均值

    Fig.  3  The means of the coe±cients of expert models

    图  4  门函数在不同维度上的精度矩阵C 的后验均值

    Fig.  4  The means of the coe±cients of gate function

    图  5  根据玉米数据集的全部样本训练的三个专家的SME 模型的专家模型回归系数的均值

    Fig.  5  The means of the coe±cients of the three expert models of SME trained with the corn data set

    表  1  在人工数据集上的预测结果

    Table  1  The prediction results in the arti-cial data set

    Method RMSECV
    PLS 5.1617 ± 0.7679
    SVR 4.9164 ± 0.5646
    LASSO 5.2411 ± 0.4112
    Ridge 5.0103 ± 0.5044
    ME 10.236 ± 1.5720
    SME 1.5130 ± 0.3117
    下载: 导出CSV

    表  2  玉米光谱数据集的预测结果

    Table  2  The prediction results in corn data set

    Method RMSECV
    PLS0.1480±0.0093
    SVR0.1504±0.0084
    LASSO0.1510±0.0114
    Ridge0.1511±0.0083
    Bagging-ridge0.1239±0.0113
    SME0.1124±0.0034
    Multi-task0.1145±0.0094
    下载: 导出CSV

    表  3  温度数据集的预测结果

    Table  3  The prediction results in temperature data set

    Method RMSECV
    PLS0.0148±0.0026
    SVR0.0180±0.0019
    LASSO0.0208±0.0031
    Ridge0.0345±0.0013
    Bagging-ridge0.0143±0.0018
    SME0.0106±0.0008
    Multi-task0.0225±0.0032
    下载: 导出CSV

    表  4  药片光谱数据集的预测结果

    Table  4  The prediction results in pharmaceutical data set

    Method RMSECV
    PLS0.0148±0.0026
    SVR0.0180±0.0019
    LASSO0.0208±0.0031
    Ridge0.0345±0.0013
    Bagging-ridge0.0143±0.0018
    SME0.0106±0.0008
    Multi-task0.0225±0.0032
    下载: 导出CSV
  • [1] Jacobs R A, Jordan M I, Nowlan S J, Hinton G E. Adaptive mixtures of local experts. Neural Computation, 1991, 3(1): 79-87 doi: 10.1162/neco.1991.3.1.79
    [2] Bishop C M. Pattern Recognition and Machine Learning. New York: Springer, 2006. http://www.oalib.com/references/17189298
    [3] Yuksel S E, Wilson J N, Gader P D. Twenty years of mixture of experts. IEEE Transactions on Neural Networks and Learning Systems, 2012, 23(8): 1177-1193 doi: 10.1109/TNNLS.2012.2200299
    [4] Jordan M I, Jacobs R A. Hierarchical mixtures of experts and the EM algorithm. Neural Computation, 1994, 6(2): 181-214 doi: 10.1162/neco.1994.6.2.181
    [5] Bo L F, Sminchisescu C, Kanaujia A, Metaxas D. Fast algorithms for large scale conditional 3D prediction. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition. Anchorage, AK: IEEE, 2008. 1-8 https://www.computer.org/csdl/proceedings/cvpr/2008/2242/00/index.html
    [6] Rasmussen C E, Ghahramani Z. Infinite mixtures of Gaussian process experts. In: Proceedings of the 2002 Advances in Neural Information Processing Systems. Cambridge MA: MIT Press, 2002. 881-888
    [7] Meeds E, Osindero S. An alternative infinite mixture of Gaussian process experts. In: Proceedings of the 2006 Advances in Neural Information Processing Systems. Cambridge MA: MIT Press, 2006. 883-890
    [8] Peralta B, Soto A. Embedded local feature selection within mixture of experts. Information Sciences, 2014, 269: 176-187 doi: 10.1016/j.ins.2014.01.008
    [9] Pan W, Shen X T. Penalized model-based clustering with application to variable selection. The Journal of Machine Learning Research, 2007, 8: 1145-1164 http://cn.bing.com/academic/profile?id=2108435369&encoded=0&v=paper_preview&mkt=zh-cn
    [10] Khalili A. New estimation and feature selection methods in mixture-of-experts models. Canadian Journal of Statistics, 2010, 38(4): 519-539 doi: 10.1002/cjs.10083
    [11] Tipping M E. Sparse Bayesian learning and the relevance vector machine. The Journal of Machine Learning Research, 2001, 1: 211-244 http://cn.bing.com/academic/profile?id=1648445109&encoded=0&v=paper_preview&mkt=zh-cn
    [12] Ding Y F, Harrison R F. A sparse multinomial probit model for classification. Pattern Analysis and Applications, 2011, 14(1): 47-55 doi: 10.1007/s10044-010-0177-7
    [13] 徐丹蕾, 杜兰, 刘宏伟, 洪灵, 李彦兵. 一种基于变分相关向量机的特征选择和分类结合方法. 自动化学报, 2011, 37(8): 932-943

    Xu Dan-Lei, Du Lan, Liu Hong-Wei, Hong Ling, Li Yan-Bing. Joint feature selection and classification design based on variational relevance vector machine. Acta Automatica Sinica, 2011, 37(8): 932-943
    [14] Bishop C M, Svensen M. Bayesian hierarchical mixtures of experts. In: Proceedings of the 19th Conference on Uncertainty in Artificial Intelligence. Acapulco, Mexico: Morgan Kaufmann Publishers Inc., 2003. 57-64
    [15] Wülfert F, Kok W T, Smilde A K. Influence of temperature on vibrational spectra and consequences for the predictive ability of multivariate models. Analytical Chemistry, 1998, 70(9): 1761-1767 doi: 10.1021/ac9709920
    [16] Feudale R N, Woody N A, Tan H W, Myles A J, Brown S D, Ferré J. Transfer of multivariate calibration models: a review. Chemometrics and Intelligent Laboratory Systems, 2002, 64(2): 181-192 doi: 10.1016/S0169-7439(02)00085-0
    [17] Thissen U, Üstün B, Melssen W J, Buydens L M C. Multivariate calibration with least-squares support vector machines. Analytical Chemistry, 2004, 76(11): 3099-3105 doi: 10.1021/ac035522m
    [18] Thissen U, Pepers M, Üstün B, Melssen W J, Buydens L M C. Comparing support vector machines to PLS for spectral regression applications. Chemometrics and Intelligent Laboratory Systems, 2004, 73(2): 169-179 doi: 10.1016/j.chemolab.2004.01.002
    [19] Hernández N, Talavera I, Biscay R J, Porro D, Ferreira M M C. Support vector regression for functional data in multivariate calibration problems. Analytica Chimica Acta, 2009, 642(1-2): 110-116 doi: 10.1016/j.aca.2008.10.063
    [20] Barman I, Kong C R, Dingari N C, Dasari R R, Feld M S. Development of robust calibration models using support vector machines for spectroscopic monitoring of blood glucose. Analytical Chemistry, 2010, 82(23): 9719-9726 doi: 10.1021/ac101754n
    [21] Hernández N, Talavera I, Dago A, Biscay R J, Ferreira M M C, Porro D. Relevance vector machines for multivariate calibration purposes. Journal of Chemometrics, 2008, 22(11-12): 686-694 doi: 10.1002/cem.v22:11/12
    [22] Pan S J, Yang Q. A survey on transfer learning. IEEE Transactions on Knowledge and Data Engineering, 2010, 22(10): 1345-1359 doi: 10.1109/TKDE.2009.191
    [23] Chen J H, Tang L, Liu J, Ye J P. A convex formulation for learning a shared predictive structure from multiple tasks. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2013, 35(5): 1025-1038 doi: 10.1109/TPAMI.2012.189
    [24] Ando R K, Zhang T. A framework for learning predictive structures from multiple tasks and unlabeled data. The Journal of Machine Learning Research, 2005, 6: 1817-1853 http://cn.bing.com/academic/profile?id=2130903752&encoded=0&v=paper_preview&mkt=zh-cn
    [25] Romera-Paredes B, Argyriou A, Bianchi-Berthouze N, Pontil M. Exploiting unrelated tasks in multi-task learning. In: Proceedings of the 15th International Conference on Artificial Intelligence and Statistics. La Palma, Canary Islands, 2012. 951-959
    [26] Caruana R. Multitask learning. Machine Learning, 1997, 28(1): 41-75 doi: 10.1023/A:1007379606734
    [27] Argyriou A, Evgeniou T, Pontil M. Convex multi-task feature learning. Machine Learning, 2008, 73(3): 243-272 doi: 10.1007/s10994-007-5040-8
    [28] Zhang W L, Li R J, Zeng T, Sun Q, Kumar S, Ye J P, Ji S W. Deep model based transfer and multi-task learning for biological image analysis. In: Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2015. 1475-1484
    [29] Liu A A, Xu N, Su Y T, Hong L, Hao T, Yang Z X. Single/multi-view human action recognition via regularized multi-task learning. Neurocomputing, 2015, 151: 544-553 doi: 10.1016/j.neucom.2014.04.090
    [30] Archambeau C, Guo S B, Zoeter O. Sparse Bayesian multi-task learning. In: Proceedings of the 2011 Advances in Neural Information Processing Systems. Cambridge MA: MIT Press, 2011. 1755-1763
    [31] Ueda N, Nakano R. Deterministic annealing EM algorithm. Neural Networks, 1998, 11(2): 271-282 doi: 10.1016/S0893-6080(97)00133-0
    [32] Katahira K, Watanabe K, Okada M. Deterministic annealing variant of variational Bayes method. Journal of Physics: Conference Series, 2008, 95(1): 012015 http://cn.bing.com/academic/profile?id=2108849983&encoded=0&v=paper_preview&mkt=zh-cn
    [33] Lin Z Z, Xu B, Li Y, Shi X Y, Qiao Y J. Application of orthogonal space regression to calibration transfer without standards. Journal of Chemometrics, 2013, 27(11): 406-413 doi: 10.1002/cem.2536
    [34] Jun L, Ji S W, Ye J P. Multi-task feature learning via efficient L2, 1-norm minimization. In: Proceedings of the 25th Conference on Uncertainty in Artificial Intelligence. Montreal, Canada, 2009. 339-348 http://cn.bing.com/academic/profile?id=1871180460&encoded=0&v=paper_preview&mkt=zh-cn
  • 期刊类型引用(10)

    1. 罗彪,欧阳志华,易昕宁,刘德荣. 基于自适应动态规划的移动机器人视觉伺服跟踪控制. 自动化学报. 2023(11): 2286-2296 . 本站查看
    2. 王睿,孙秋野,张化光. 微电网的电流均衡/电压恢复自适应动态规划策略研究. 自动化学报. 2022(02): 479-491 . 本站查看
    3. 伍起荣,李彦哲. 基于动态规划的动车组追踪间隔时间优化. 控制工程. 2021(09): 1835-1841 . 百度学术
    4. 吕永峰,田建艳,菅垄,任雪梅. 非线性多输入系统的近似动态规划H_∞控制. 控制理论与应用. 2021(10): 1662-1670 . 百度学术
    5. 郑云水,高生霖,束展逸. 高速铁路列车追踪间隔时间优化研究. 测控技术. 2019(06): 120-125 . 百度学术
    6. 王鼎. 基于学习的鲁棒自适应评判控制研究进展. 自动化学报. 2019(06): 1031-1043 . 本站查看
    7. 代伟,陆文捷,付俊,马小平. 工业过程多速率分层运行优化控制. 自动化学报. 2019(10): 1946-1959 . 本站查看
    8. 郭子杰,白伟伟,周琪,鲁仁全. 基于性能指标约束的一类输入死区非线性系统最优控制. 自动化学报. 2019(11): 2128-2136 . 本站查看
    9. 李宇栋,黄志坚,王升堂,张成,郑欢,熊雪梅. 船舶航向自适应控制的改进ADHDP方法. 湖北民族学院学报(自然科学版). 2018(02): 178-183 . 百度学术
    10. 李琦,于明伟,赵峰. 基于DHP算法的热力站一次网热量分配控制. 信息与控制. 2018(06): 738-745 . 百度学术

    其他类型引用(21)

  • 加载中
图(5) / 表(4)
计量
  • 文章访问数:  2376
  • HTML全文浏览量:  368
  • PDF下载量:  826
  • 被引次数: 31
出版历程
  • 收稿日期:  2015-04-29
  • 录用日期:  2015-08-31
  • 刊出日期:  2016-04-01

目录

/

返回文章
返回