2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于比例积分调节的严格反馈多智能体系统最优一致性

武文强 王庆领

戴亚平, 杨方方, 赵翰奕, 贾之阳, 广田熏. 慕课授课中的学生听课行为自动分析系统. 自动化学报, 2020, 46(4): 681-694. doi: 10.16383/j.aas.c170416
引用本文: 武文强, 王庆领. 基于比例积分调节的严格反馈多智能体系统最优一致性. 自动化学报, 2025, 51(3): 577−589 doi: 10.16383/j.aas.c240288
DAI Ya-Ping, YANG Fang-Fang, ZHAO Han-Yi, JIA Zhi-Yang, HIROTA Kaoru. Auto Analysis System of Students Behavior in MOOC Teaching. ACTA AUTOMATICA SINICA, 2020, 46(4): 681-694. doi: 10.16383/j.aas.c170416
Citation: Wu Wen-Qiang, Wang Qing-Ling. Optimal consensus for strict-feedback multi-agent systems based on proportional-integral regulation. Acta Automatica Sinica, 2025, 51(3): 577−589 doi: 10.16383/j.aas.c240288

基于比例积分调节的严格反馈多智能体系统最优一致性

doi: 10.16383/j.aas.c240288 cstr: 32138.14.j.aas.c240288
基金项目: 国家自然科学基金(62373102), 江苏省自然科学基金(BK20221455), 安徽省重点研究与开发计划(2022i01020013)资助
详细信息
    作者简介:

    武文强:东南大学自动化学院博士研究生. 主要研究方向为多智能体系统与分布式优化. E-mail: wqwu@seu.edu.cn

    王庆领:东南大学自动化学院教授. 主要研究方向为多智能体系统自适应控制, 分布式协同控制. 本文通信作者. E-mail: csuwql@gmail.com

  • 中图分类号: 10.16383/j.aas.c240288

Optimal Consensus for Strict-feedback Multi-agent Systems Based on Proportional-integral Regulation

Funds: Supported by National Natural Science Foundation of China (62373102), Jiangsu Natural Science Foundation (BK20221455), and Anhui Provincial Key Research and Development Project (2022i01020013)
More Information
    Author Bio:

    WU Wen-Qiang Ph.D. candidate at the School of Automation, Southeast University. His research interest covers multi-agent systems and distributed optimization

    WANG Qing-Ling Professor at the School of Automation, Southeast University. His research interest covers adaptive control of multi-agent systems and distributed cooperative control. Corresponding author of this paper

  • 摘要: 本文研究了严格反馈多智能体系统的最优一致性问题, 旨在局部信息交互的条件下, 使所有智能体收敛至全局代价函数的最优解. 首先, 针对权重非平衡有向图, 提出一种新的分布式比例积分(Proportional-integral, PI)变量, 将最优一致性问题转化为PI调节问题, 使得经典的控制技术能够通过调节PI变量的方式来处理更加复杂的多智能体系统. 然后, 结合所提出的分布式PI变量和预设性能控制, 设计一类基于PI调节的分布式控制算法, 使得带有死区输入非线性和有界扰动的严格反馈多智能体系统实现近似最优一致性. 最后, 通过仿真实验验证了所设计算法的有效性.
  • 在信息爆炸的"互联网+"新时代, 随着网络时代的发展, 人类的注意力开始变短, "碎片化"学习成为人类的主要学习模式, 而在线网络课程由于其"微课"的教学模式, 时间的相对自由性, 成本相对比较低等优点迅速受到广大学者的喜爱[1-4].伴随着普通学生、成年人、工作者越来越多地进行在线网络学习, 许多机构也采用网络课程模式对其员工进行培训, 但是不同于传统的培训, 在线网络学习难以被管控, 机构无法得到员工的培训效果, 因此, 即使意识到这种学习的重要性, 许多企业也不知道如何"培育"它.这是因为在线网络课程目前仍处于完善阶段, 其本身存在一些缺陷, 由于时间的自由和目前的无人监督模式, 学生的学习效率难以得到保障, 学生很可能因为自律性不够或课程的枯燥而出现不专心的情况[5].针对这种情况, 有必要对学习者的学习状态进行分析和评估, 以监督学生的学习状态, 给相关机构提供测评依据, 也反馈给在线授课者, 帮助教育者提高授课质量[6].

    目前在已有的研究成果中很难找到针对MOOC (Massive open online course)授课过程中学生的行为检测, 虽然在其他应用背景下的人体行为检测已经有了很多, 但是针对MOOC授课过程中的学生这一特定目标, 对其行为进行检测对提升MOOC的教育教学还是有不容小觑的意义.为了获取学生的专注度, 首先要做的就是获得学生的行为信息, 考虑到学生登录慕课时, 所使用的电脑、平板和手机等设备一般都带有摄像头, 如果能够利用摄像头来实时记录学生的学习状态, 就可以根据获取到的视频对学生的行为进行分析, 以得到学生的学习专注度.目前国内外的学者在行为识别领域上已经取得了一系列成果, Jaouedi等为了更好地使机器人服务于残疾人, 他们对残疾人与智能机器人交流中的手势、步行速率等信息进行了分析, 之后使用卡尔曼滤波方法对移动的人体进行跟踪, 最后采用"最近邻居法"对所得到的行为信息进行处理, 以给出人体的行为决策[7]; 而Xiao等对人机交互中的头部运动进行了行为分析研究, 他们提出了以数据为基础来识别头部运动模式的方法, 先将人体头部运动按照时间进行分段, 再用线性预测特征参数法来建立运动模型, 之后用高斯混合模型对运动类型进行融合推理, 得出头部运动所代表的特定行为, 例如接受、赞赏、责备、反对等[8]; Tsai等为了检测公共场所人类吸烟饮酒等非法行为, 他们将相机安装在工作场所的某一固定位置, 然后提取三个主要特征:脸与手的接触时间特征、烟雾特征和手持物体特征, 最后根据"决策树"来判断是否有人在公共场所从事了吸烟饮酒等非法行为[9].

    虽然目前对人体行为的检测已经取得了较多成果, 并且可以实现人体的跟踪问题[7-11], 但是利用学生听课过程中的视频来"判定学生在线网络学习中的专注度"这一方面的研究还比较空缺[12].针对慕课这一新的应用环境, 我们分析摄像头获取的学生行为信息, 建立人体的"四维特征信息模型", 根据各个特征的变化范围对每个焦元进行基本概率赋值, 最后采用D-S方法融合时空域中的概率值, 判断出学生的人体信息, 最后给出学生对某一门慕课课程学习效果的初步评价.

    该分析系统可以用图 1来表示.

    图 1  慕课授课过程中学生专注度自动检测与判定系统
    Fig. 1  Automatic detection system on student focus during MOOC teaching

    论文的主要工作组成共分为以下内容:第1节, 提取人体轮廓, 并建立学生"四维特征信息模型"; 第2节, 搭建人体行为框架, 并对其进行基本概率赋值, 之后采用D-S方法对其进行融合, 最后给出学生的行为状态; 第3节, 采用多种状态的视频信息对以上算法进行了实验验证, 并将D-S理论与贝叶斯理论进行对比, 来证明D-S理论融合的有效性; 第4节, 总结和展望.

    慕课授课过程中的运动人体检测任务是将人体从视频序列中分割出来, 因此, 能否准确地提取出人体轮廓就显得尤为重要[13-15].

    本文采用的是背景减除法提取目标人体[16], 由于实验地点相对单一, 我们使用无学生的背景图片作为背景模型, 将视频中当前帧图像与背景图像进行差分运算, 如果像素点灰度值差别很大, 则为目标人体, 如果差值在一定阈值范围内, 则为背景像素点; 得到的差值图像采用最大类间方差法找到合适的二值化阈值; 再对二值化后的图像提取出最大连通域, 消除背景的干扰, 最后我们还使用基于逆合成孔径雷达(Inverse synthetic aperture radar, ISAR)图像目标形状提取的数学形态学方法对检测到的前景目标进行后处理[17], 以平滑连接目标人体的边缘, 使提取出的人体轮廓更加完整.

    图 2  电脑摄像头提取的目标人体图像
    Fig. 2  Human body image obtained by computer camera

    提取人体轮廓后, 还需进一步提取出图像的主要特征信息, 才能进行特征信息融合与听课专注度的决策推理.根据学生在学习时可能出现的行为状态, 例如认真学习时的端坐状态, 有点疲惫时的斜坐状态, 非常困倦时可能会出现趴在桌子上睡觉的状态等, 为了能全面且准确地描述这些人体的行为信息, 我们从人体轮廓中提取了4个行为特征信息, 将其定义为人体"四维特征信息模型", 其具体内容为:

    $$ \left\{ \begin{aligned} &\text{人体$x$轴质心特征:}~X=\frac{M_{10}}{M_{00}}\\ &\text{人体$y$轴质心特征:}~Y=\frac{M_{01}}{M_{00}} \\ &\text{面积特征标记矩阵:}\\ &\qquad STATS=regionprops(L, \ properties)\\ &\text{人体主轴特征:}~\theta=atan2(2b, a-c+sqrt) \end{aligned} \right. $$ (1)

    其中, $regionprops$和$atan2$分别为Matlab中度量图像区域属性和四象限反正切函数.我们通过判断学生人体$x$轴质心特征, 人体$y$轴质心特征和人体主轴特征是否偏离原点位置来判定其是否处于端坐状态, 如果处于端坐状态, 则记录端坐时的面积特征, 并将端坐时的四维特征作为基准, 当学生四维特征信息出现变化时, 再去判断其处于哪种状态.从目标提取中, 我们得到了最大连通域, 然后使用基于空间分布特征的多连通域融合算法来计算四维特征信息中的人体的质心位置, 人体的面积和人体主轴信息[18].

    1) 人体质心特征($X, Y$)

    对于质心, 可以认为得到的二值图像或者灰度图像是一个二维的密度分布函数.对于一个二维连续函数$f(x, y)$, 其零阶矩$M_{00}$和一阶矩$M_{10}$、$M_{01}$分别为

    $$ \begin{split} M_{00}&=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(x, y){\rm d}x{\rm d}y\\ M_{10}&=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}xf(x, y){\rm d}x{\rm d}y\\ M_{01}&=\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}yf(x, y){\rm d}x{\rm d}y\\ \end{split} $$ (2)

    则得到人体的质心为:

    $$ X=\frac{M_{10}}{M_{00}}, \quad Y=\frac{M_{01}}{M_{00}} $$ (3)

    其中, ($X, Y$)为目标人体的质心坐标.

    2) 学生人体主轴方向变化特征$\theta$

    对中心矩进行归一化操作:

    $$ \mu_{pq}=N_{pq}=\frac{M_{pq}}{M_{00}^r}, \quad r=\frac{p+q}{2}+1 $$ (4)

    然后利用:

    $$ f(x)=\begin{cases} a = \dfrac{\mu_{20}}{\mu_{00}}\\[3mm] b = \dfrac{\mu_{11}}{\mu_{00}}\\[3mm] c = \dfrac{\mu_{02}}{\mu_{00}} \end{cases} $$ (5)

    得到

    $$ \begin{cases} sqrt=\sqrt{4b^2-(a-c)^2}\\ \theta=atan2(2b, a-c+sqrt) \end{cases} $$ (6)

    其中, $\theta$是学生人体主轴方向与垂直方向的夹角, 以作为人体主轴变化特征.

    3) 面积特征$S$

    将得到的连通域进行标记, 而标记的方法有很多种, 有的算法可以一次遍历图像完成标记, 有的则需要2次或更多次遍历图像, 这样也就造成了不同的算法效率的差异.

    我们使用$bwlabel$和$regionprops$算子对连通域进行操作. $bwlabel$算子是二值图像中的标签连接组件, 式(7)返回一个标签矩阵, 其中变量$n$表示的是指定的连接方向数量, 而$num$表示的是在图像$BW$中发现的连接对象的数量.

    $$ \label{equ_bwla} [L, num]=bwlabel(BW, n) $$ (7)

    而regionprops算子是一个度量图像区域属性的函数, 式(8)返回的是标签矩阵$L$中每个标记区域的特征值.

    $$ STATS=regionprops(L, properties) $$ (8)

    在得到的标记矩阵STATS中, 不同的数字代表着不同的区域, 面积标记矩阵如式(9)所示, 然后累加最大域中的值就可以得到人体面积特征$S$.

    $$ \begin{bmatrix} 1 & 1 &1 & 1 &1 & 1 &1 \\ 1 & 1 &1 & 1 &1 & 1 &1 \\ 1 & 1 &1 & 1 &1 & 1 &1 \\ 1 & 1 &1 & 1 &1 & 1 &1 \\ 1 & 1 &1 & 1 &1 & 1 &1 \\ 0 & 1 &1 & 1 &1 & 1 &1 \\ 0 & 0 &0 & 0 &0 & 0 &0 \\ 0 & 0 &0 & 0 &0 & 0 &0 \\ 0 & 0 &0 & 0 &0 & 0 &0 \\ 0 & 0 &0 & 0 &0 & 0 &0 \\ 0 & 0 &0 & 0 &0 & 0 &0 \end{bmatrix} $$ (9)

    随着网络时代的到来, 人们生活中信息的形式、数量、复杂度都大大增加, 因此对信息处理的及时性、准确性的要求也越来越高.数据融合是指通过对多个同质或异质传感器获得的数据进行有机结合, 最后给出检测结果.其实信息融合存在于我们生活中的方方面面, 例如人类将各种感觉器官(眼、耳、鼻)所探测到的(图像、声音、气味)信息与先验知识进行综合, 得出对周围的环境综合判断, 以决定接下来的行动[19].本文在信息融合时选用改进的D-S算法来处理得到的信息, 先获取人体四维特征信息, 之后采用"基本概率赋值法"对每个焦元进行概率赋值, 最后对特征信息进行融合, 从而计算出学生人体行为框架中每个状态的概率分配[20].

    根据学生在线网络学习时可能出现的行为状态, 结合专家经验和理论常识, 我们将人体识别框架设定为$\Omega=\{$左顾右盼, 埋头, 端坐, 不确定$\}$ 4种行为状态, 分别用$h_1$, $h_2$, $h_3$和$U$来表示, 3种人体行为如图 3所示.

    图 3  电脑获取的人体图像的三种形态
    Fig. 3  Three forms of human body image acquired by computer

    接下来为每一个证据体进行概率赋值, 基本概率赋值是相关领域专家依据自身经验和已有知识对整个识别框架中不同证据进行不同归纳判断而得到的, 其中含有很强的个人主观性, 所以不同专家对于同一个证据不可能给出完全一样的基本概率分配, 有时差别会很大.

    在本文中我们将人体的$X$轴质心变化, $Y$轴质心变化, 面积变化和角度变化作为4个独立的证据体: $M=\{X, Y, S, \theta\}$, 用$X, Y, S, \theta$分别表示当前时刻目标人体的$X$轴坐标值, $Y$轴坐标值, 面积和主轴角度, 当人体行为出现变化时, 为了定性地给4个证据体赋值, 我们在每个证据体的曲线中分别选择两个阈值, 分别计算4个证据体($X, Y, S, \theta$)每条曲线在阈值外和阈值内所占的百分比, 像图 4所示的那样, 再使用式(10) $\sim$式(14), 就可以得到人体辨识框架中每一部分的基本概率赋值.

    图 4  $X$轴质心坐标变化曲线的两部分
    Fig. 4  Two parts of $X$ axis centroid position curve

    当人体处于端坐状态时, 4个证据体的数值基本保持不变; 当人体左顾右盼时, 人体的质心坐标和方向会不断发生变化; 当人埋头时, 人体的$Y$轴质心坐标会发生变化, 同时人体的面积也会显著减小.结合学生在授课时的行为状态, 本文提出一种新的基本概率赋值方法-四维基本概率赋值法, 该方法不仅充分利用了4种证据体所包含的信息, 也在很大程度上提高了D-S决策的准确率, 同时又避免了分析单一证据所得结果的不完整性和片面性.

    四维基本概率赋值法公式如下所示, 其中用$X_{threshold1}$和$X_{threshold2}$分别表示$X$轴质心变化的上下阈值, $Y, S, \theta$的上下阈值依次类推, $S_{threshold3}$为一个很小的值, 代表学生不在画面中时人体的面积, 为防止光照, 背景等因素的干扰, 这里不设定为0, 而设定为一个很小的值.

    $$ \label{equ_prob1}\left\{ \begin{aligned} &\text{若}\quad X > X_{threshold1} \text{或}\ X < X_{threshold2}, \\ &\quad \text{左顾右盼的次数+1}\\ &\text{否则}, \quad \text{埋头的次数+0.5}, \quad \text{端坐的次数+0.5} \end{aligned} \right. $$ (10)
    $$ \left\{ \begin{aligned} &\text{若}\quad Y > Y_{threshold1} \text {或} \ Y < Y_{threshold2}, \\ &\quad \text{埋头次数+1} \\ &\text{否则}, \quad \text{左顾右盼次数+0.5}, \quad \text{端坐的次数+0.5} \end{aligned} \right. $$ (11)
    $$ \left\{ \begin{aligned} &\text{若}\quad S > S_{threshold1} \text {或} \ S < S_{threshold2}, \\ &\quad \text{埋头次数+1}\\ &\text{否则}, \quad \text{左顾右盼次数+0.5}\quad \text{端坐次数+0.5} \end{aligned} \right. $$ (12)
    $$ \label{equ_prob2} \left\{ \begin{aligned} &\text{若}\quad \theta>\theta_{threshold1} \text {或} \ \theta < \theta_{threshold2}, \\ &\quad \text{左顾右盼次数+0.5}, \quad \text{埋头次数+0.5}\\ &\text{否则}, \quad \text{端坐次数+1} \end{aligned} \right. $$ (13)
    $$ \left\{ \begin{aligned} &\text{若}\ (X > X_{threshold1} \text {或} \ X < X_{threshold2}) \\ & \text{且} ~(Y > Y_{threshold1} \text {或} \ Y < Y_{threshold2})\\ & \text{且} ~(S > S_{threshold1} \text {或} \ S < S_{threshold2})\\ & \text{且} ~(\theta > \theta_{threshold1} \text{或}\ \theta < \theta_{threshold2})\\ & \text{或} ~(S < S_{threshold3}), \\ & \text{不确定次数+1} \\ \end{aligned} \right. $$ (14)

    D-S证据理论是关于证据和可能性推理的理论, 它主要处理证据加权和证据支持度问题, 并且利用可能性推理来实现证据的组合.随着信息融合的发展, 我们融合的对象不再局限于传感器获取的数据和信息, 而是可拓广到各种方法, 专家经验甚至思想等.

    我们将从实验中得到的学生的学习视频一共分为$n$个部分, 针对实验过程中收集到的4个证据体$ \{X, Y, S, \theta\}$, 首先计算当前帧中每个证据体的概率值, 即判断4个证据体的变化是否有超出设定的阈值, 得到每一帧中每个证据体对每种行为框架(端坐、左顾右盼、埋头和不确定)的概率分配值, 在实验中$m(h_{1jk}), m(h_{2jk}), m(h_{3jk}), m(h_{4jk})$分别表示$X$轴质心坐标变化, $Y$轴质心坐标变化, 面积变化以及角度变化4个证据体的值, $j$表示第$j$个人体框架($1\leq j\leq m$), $k$表示第$k$个周期($1\leq k\leq n$).

    然后将每个证据体对每种框架的概率值进行空间域上的融合, 即每个周期中传感器之间的融合.在这里是指融合4个证据体对每种行为框架概率值, 就可以得到在每个周期中4种人体框架的概率值, 如式(15)所示:

    $$ \begin{split} &m(h_{jk})=\\ &\frac{1}{K}\sum\limits_{h_{1jk}\cap \cdots \cap h_{4jk}=h_{jk}}m(h_{1jk})m(h_{2jk})m(h_{3jk})m(h_{4jk}) \end{split} $$ (15)

    其中, $K$是归一化因子.

    $${\small \begin{split} K&=\sum\limits_{h_{1jk}\cap \cdots \cap h_{4jk}\neq \emptyset}m(h_{1jk})m(h_{2jk})m(h_{3jk})m(h_{4jk})=\\ &1-\sum\limits_{h_{1jk}\cap \cdots \cap h_{4jk} =\emptyset}m(h_{1jk})m(h_{2jk})m(h_{3jk})m(h_{4jk}) \end{split}} $$ (16)

    最后将各个时间段内4种框架的概率值进行时间域上的融合, 即进行周期之间的融合, 得到最后的时空融合结果.也就得到了最终的4种坐姿的概率分配$m(k)$, 经过比较大小就可以判断出在这个时间段中人体的坐姿情况, 计算过程如式(17)所示:

    $$ \begin{split} &m(h_j)=m(h_{j1})\oplus m(h_{j2})\oplus \cdots \oplus m(h_{jk})=\\ &\qquad\frac{1}{K}\sum\limits_{h_{j1}\cap h_{j2}\cap \cdots \cap h_{jn}=h_j}m(h_{j1})m(h_{j2})\cdots m(h_{jn}) \end{split} $$ (17)

    同理, $K$是归一化因子.

    在本文中取$m=4, n=3$, 最后得到的融合结果是学生在听课这一段时间中的行为评价结果, 可以用该结果作为学生学习状态评价的一个初步依据.

    智能教室中学生行为分析与推理决策模型的实验流程图如图 5所示.

    图 5  学生行为分析与推理决策流程图
    Fig. 5  Flow chart of student behavior analysis and decision-making

    在实验中, 我们使用笔记本电脑的摄像头对学生的行为进行录像跟踪, 之后对视频进行图像处理得到4个证据体的关键信息, 然后使用D-S证据理论对信息融合后决策.实验中的电脑使用Inter Core i7 4720处理器和8 GB内存, 摄像头参数为:尺寸大小640 $\times$ 480, 采样频率为30 fps, 使用的软件环境为MATLAB 2016a.

    首先我们对三种典型的行为进行了实验, 并且将实验中得到的视频按照上面所说的方法分为三部分, 先在每一部分进行空间域的融合, 得到的结果再进行时间域的融合以获得最终的结果.

    在这个实验中, 我们模拟了学生专心学习的场景, 学生大部分时间处于端坐状态, 我们得到视频中的关键帧如图 6所示.同时得到实验的4条曲线如图 7.

    图 6  端坐状态时关键帧的图像
    Fig. 6  Image of key frame in sit up condition
    图 7  端坐状态特征变化曲线
    Fig. 7  Characteristic curves of "sit up" state

    计算每一部分的基本概率赋值我们可以得到表 1, 其中$m(h_{ijk})$代表第$i$个证据体($X$轴质心特征, $Y$轴质心特征, 面积特征, 角度特征)在第$k$个周期($k=1, 2, 3$)对第$j$个人体识别框架(左顾右盼、埋头、端坐和不确定)的基本概率赋值.将表 1中学生端坐时各个阶段每个证据体对每种人体行为框架的基本概率值进行空间域的融合可以得到表 2, 即得到了三个周期中每种人体行为框架的概率值.

    表 1  端坐时的基本概率赋值
    Table 1  The probability distributions when sit up
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{1j1})$ 0 0.4444 0.4444 0.1112
    $m(h_{1j2})$ 0 0.4528 0.4528 0.0944
    $m(h_{1j3})$ 0 0.4528 0.4528 0.0944
    $m(h_{2j1})$ 0.4444 0 0.4444 0.1112
    $m(h_{2j2})$ 0.4528 0 0.4528 0.0944
    $m(h_{2j3})$ 0.4528 0 0.4528 0.0944
    $m(h_{3j1})$ 0.4444 0 0.4444 0.1112
    $m(h_{3j2})$ 0.4528 0 0.4528 0.0944
    $m(h_{3j3})$ 0.4528 0 0.4528 0.0944
    $m(h_{4j1})$ 0 0 0.8888 0.1112
    $m(h_{4j2})$ 0 0 0.9056 0.0944
    $m(h_{4j3})$ 0 0 0.9056 0.0944
    下载: 导出CSV 
    | 显示表格
    表 2  空间域融合后的结果
    Table 2  The results of fusion in the spatial domain
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{j1})$ 0.0191 0.0036 0.9773 0
    $m(h_{j2})$ 0.0142 0.0023 0.9834 0
    $m(h_{j3})$ 0.0142 0.0023 0.9834 0
    下载: 导出CSV 
    | 显示表格

    之后将表 2中三个周期每个证据体的概率值进行时间域上的融合, 即进行周期之间的融合, 得到$m(h_1)=4.1001\times10^{-6}, m(h_2)=2.1133\times10^{-8}, m(h_3)=0.9999, m(U)=4.7766\times10^{-24}$, 已知$m(h_3)>m(h_1)>m(h_2)>m(U)$, 所以最终的决策结果是$h_3$.即学生在这段时间基本处于端坐状态, 这和我们的认知是符合的.也说明课程相对比较轻松有趣, 学生学习比较认真, 授课者需要继续保持这种授课模式, 相关机构可以认为员工在线培训比较成功.

    为了验证"四维特征信息模型"提取的有效性, 在本次实验中我们还做了三组对比实验.实验1采用$X$轴质心变化和$Y$轴质心变化二维特征来判断学生的专注度, 它作为本实验的$baseline$; 实验2采用$X$轴质心变化, $Y$轴质心变化和面积变化来判断学生在这段时间的学习行为; 实验3采用本文提出的"四维特征信息模型"对学生的行为进行判断.实验结果如表 3所示.

    表 3  多维特征信息融合结果对比
    Table 3  Comparison of multi-dimensional feature information fusion results
    实验方法 实验结果
    $m(h_{1})$ $m(h_{2})$ $m(h_{3})$ $m(U)$
    $X+Y(baseline)$ 0.0042 0.0042 0.9916 0
    $X+Y+S$ 0.0042 0 0.9958 0
    $X+Y+S+\theta$ 0 0 0.9999 0
    下载: 导出CSV 
    | 显示表格

    从实验结果可以看出, 采用"四维特征信息模型"可以有效提高结果的准确率, 减少其他状态的干扰, 使结果更具有信服力.

    在这个实验中, 学生一直在左顾右盼, 我们得到视频中的关键帧如图 8所示.

    图 8  左顾右盼时关键帧的图像
    Fig. 8  Image of key frame in look around condition

    我们同时得到学生人体特征变化的四条曲线如图 9.

    图 9  左顾右盼状态特征变化曲线
    Fig. 9  Characteristic curves of "look around" state

    和端坐时一样, 计算每一部分的基本概率赋值我们可以得到该实验的基本概率赋值如表 4.

    表 4  左顾右盼状态的基本概率赋值
    Table 4  The probability distributions when look around
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{1j1})$ 0 0.4442 0.4442 0.1116
    $m(h_{1j2})$ 0.6271 0.1394 0.1394 0.0942
    $m(h_{1j3})$ 0.9058 0 0 0.0942
    $m(h_{2j1})$ 0.4442 0 0.4442 0.1116
    $m(h_{2j2})$ 0.4529 0 0.4529 0.0942
    $m(h_{2j3})$ 0.0784 0.7490 0.0784 0.0942
    $m(h_{3j1})$ 0.4442 0 0.4442 0.1116
    $m(h_{3j2})$ 0.4529 0 0.4529 0.0942
    $m(h_{3j3})$ 0.4529 0 0.4529 0.0942
    $m(h_{4j1})$ 0.0261 0.0261 0.8361 0.1116
    $m(h_{4j2})$ 0.3135 0.3135 0.2787 0.0942
    $m(h_{4j3})$ 0.4529 0.4529 0 0.0942
    下载: 导出CSV 
    | 显示表格

    同理, 将表 4中学生左顾右盼时的基本概率值进行空间域的融合可以得到表 5.

    表 5  空间域融合后的结果
    Table 5  The results of fusion in the spatial domain
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{j1})$ 0.0249 0.0047 0.9704 0
    $m(h_{j2})$ 0.7743 0.0047 0.2210 0
    $m(h_{j3})$ 0.9228 0.0681 0.0091 0
    下载: 导出CSV 
    | 显示表格

    之后进行时间域上的融合, 得到$m(h_1)=0.9013, m(h_2)=7.7065\times 10^{-5}, m(h_3)= 0.0987, m(U)=4.4837\times 10^{-21}$, 已知$m(h_1)>m(h_3)>m(h_2)>m(U)$, 所以最终的决策结果是$h_1$, 即学生在这段时间经常左右摇晃, 可以认为学生学习不认真, 可能是这节慕课课程没有太大的吸引力, 有点枯燥乏燥, 授课者应注意改善授课质量, 也可能是因为学生学习态度不认真, 培训机构可以提醒相应员工经过后期检查决定该员工是否需要重新学习, 以取得良好的学习效果.

    在这个实验中, 学生处于埋头状态, 我们得到视频中的关键帧如图 10所示.我们得到实验的四条曲线如图 11所示.

    图 10  埋头时关键帧的图像
    Fig. 10  Image of key frame in head drop
    图 11  埋头状态特征变化曲线
    Fig. 11  Characteristic curves of "head drop" state

    计算每一部分的基本概率赋值我们可以得到该实验的基本概率赋值如表 6.

    表 6  埋头时的基本概率赋值
    Table 6  The probability distributions when head drop
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{1j1})$ 0 0.4500 0.4500 0.1000
    $m(h_{1j2})$ 0 0.4500 0.4500 0.1000
    $m(h_{1j3})$ 0 0.4500 0.4500 0.1000
    $m(h_{2j1})$ 0.2308 0.4385 0.2308 0.1000
    $m(h_{2j2})$ 0 0.9000 0 0.1000
    $m(h_{2j3})$ 0 0.9000 0 0.1000
    $m(h_{3j1})$ 0.4269 0.0462 0.4269 0.1000
    $m(h_{3j2})$ 0.2308 0.4385 0.2308 0.1000
    $m(h_{3j3})$ 0 0.9000 0 0.1000
    $m(h_{4j1})$ 0.2308 0.2308 0.4385 0.1000
    $m(h_{4j2})$ 0.0923 0.0923 0.7154 0.1000
    $m(h_{4j3})$ 0 0 0.9000 0.1000
    下载: 导出CSV 
    | 显示表格

    表 6中学生埋头时的基本概率值进行空间域的融合可以得到表 7.

    表 7  空间域融合后的结果
    Table 7  The results of fusion in the spatial domain
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{j1})$ 0.0658 0.2048 0.7294 0
    $m(h_{j2})$ 0.0020 0.8131 0.1848 0
    $m(h_{j3})$ 0 0.9221 0.0778 0
    下载: 导出CSV 
    | 显示表格

    之后进行时间域上的融合, 得到$m(h_1)=3.8405\times10^{-8}, m(h_2)=0.9360, m(h_3)= 0.0640, $$m(U)=7.0128\times 10^{-21}$, 已知$m(h_2)>m(h_3)>$ $m(h_1)>m(U)$, 所以最终的决策结果是$h_2$.即学生在这段时间大部分处于埋头状态, 可以推测学生在这段时间并没有听课, 而是爬在桌子上, 可能学生这段时间比较疲惫, 也可能这节慕课课程太枯燥乏味, 慕课平台应着重审核该课程是否符合慕课上线标准, 如果该学生属于个例, 培训机构应要求该学生重新学习这门课程, 以达到培训的目的.

    在这个实验中, 我们模拟了学生处于正常学习时的状态, 在这段时间里, 学生一共左顾右盼了2次, 埋头了2次, 但基本上是处于端坐的学习状态.实验中的关键帧序列如图 12所示, 我们同样获得曲线图如图 13.

    图 12  复杂状态实验1的关键帧序列
    Fig. 12  Key frame sequence under complex state experiment 1
    图 13  复杂状态1的特征变化曲线
    Fig. 13  Characteristic curves of complex state 1

    计算每一部分的基本概率赋值我们可以得到该实验的基本概率赋值如表 8.

    表 8  证据体的基本概率赋值(复杂状态实验1)
    Table 8  Basic probability distribution of evidence bodies (Complex condition 1)
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{1j1})$ 0.1719 0.3617 0.3617 0.1048
    $m(h_{1j2})$ 0.0859 0.4082 0.4082 0.0976
    $m(h_{1j3})$ 0 0 0.4512 0.0976
    $m(h_{2j1})$ 0.4333 0.0286 0.4333 0.1048
    $m(h_{2j2})$ 0.4405 0.0215 0.4405 0.0976
    $m(h_{2j3})$ 0.4512 0 0.4512 0.0976
    $m(h_{3j1})$ 0.4369 0.0215 0.4369 0.1048
    $m(h_{3j2})$ 0.4515 0 0.4512 0.0976
    $m(h_{3j3})$ 0.4512 0.0430 0.4512 0.0976
    $m(h_{4j1})$ 0.0645 0.0645 0.7663 0.1048
    $m(h_{4j2})$ 0.0573 0.0573 0.7878 0.0976
    $m(h_{4j3})$ 0 0 0.9024 0.0976
    下载: 导出CSV 
    | 显示表格

    表 8中学生各个状态的基本概率值进行空间域上的融合后, 可以得到表 9.

    表 9  空间域融合后的结果(复杂状态实验1)
    Table 9  Results of fusion in the spatial domain (Complex condition 1)
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{j1})$ 0.1003 0.0087 0.8910 0
    $m(h_{j2})$ 0.0567 0.0056 0.9377 0
    $m(h_{j3})$ 0.0151 0.0026 0.9823 0
    下载: 导出CSV 
    | 显示表格

    之后进行时间域上的融合, 得到$m(h_1)=1.0477\times 10^{-4}, m(h_2)=1.5324\times 10^{-7}, m(h_3)= 0.9999, m(U)=1.6917\times 10^{-23}$, 已知$m(h_3)>m(h_1)>m(h_2)>m(U)$, 所以最终的决策结果是$h_3$.本次实验模拟了学生处于真实状态下的学习情况, 学习时间比较长, 里面包括了左顾右盼、埋头、端坐等各种姿态, 最终结论学生处于端坐状态, 即在这段时间内学生虽然有几次走神情况, 但基本上在专心学习, 可以得出学生在这段时间学习比较认真的结论.

    在这个实验中, 我们模拟了学习时的另一种情况, 在这段时间里, 学生长时间的处于埋头的情况, 并且有时身体处于倾斜状态.实验的关键帧序列如图 14所示, 我们同样获得曲线图如图 15.

    图 14  复杂状态实验2的关键帧序列
    Fig. 14  Key frame sequence under complex state Experiment 2
    图 15  复杂状态2的特征变化曲线
    Fig. 15  Characteristic curves of complex state 2 direction

    计算每一部分的基本概率赋值可以得到该实验的基本概率赋值如表 10.将表 10中学生各个状态的基本概率值进行空间域上的融合后, 得到表 11.

    表 10  证据体的基本概率赋值(复杂状态实验2)
    Table 10  Basic probability distribution of evidence bodies (Complex condition 2)
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{1j1})$ 0.3027 0.2951 0.2951 0.1027
    $m(h_{1j2})$ 0 0.4487 0.4487 0.1027
    $m(h_{1j3})$ 0 0.4527 0.4527 0.0946
    $m(h_{2j1})$ 0.4487 0 0.4487 0.1027
    $m(h_{2j2})$ 0.1415 0.6144 0.1455 0.1027
    $m(h_{2j3})$ 0 0.9054 0 0.0946
    $m(h_{3j1})$ 0.4487 0 0.4487 0.1027
    $m(h_{3j2})$ 0.1900 0.5174 0.1900 0.1027
    $m(h_{3j3})$ 0 0.9054 0 0.0946
    $m(h_{4j1})$ 0.3557 0.3557 0.1859 0.1027
    $m(h_{4j2})$ 0.2425 0.2425 0.4123 0.1027
    $m(h_{4j3})$ 0.4123 0.4123 0.0808 0.0946
    下载: 导出CSV 
    | 显示表格
    表 11  空间域融合后的结果(复杂状态实验2)
    Table 11  Results of fusion in the spatial domain (Complex condition 2)
    $h_1$ $h_2$ $h_3$ $U$
    $m(h_{j1})$ 0.6109 0.0162 0.3728 0
    $m(h_{j2})$ 0.0164 0.7998 0.1837 0
    $m(h_{j3})$ 0.0001 0.9973 0.0026 0
    下载: 导出CSV 
    | 显示表格

    再进行时间域上的融合, 得到$m(h_1)=8.3532\times 10^{-5}, m(h_2)=0.9863, m(h_3)= 0.0136, m(U)=1.0782\times 10^{-21}$, 已知$m(h_2)>m(h_3)>m(h_1)>m(U)$, 所以最终的决策结果是$h_2$.本次复杂实验2模拟了学生处于疲劳状态下的学习情况, 里面包括了左顾右盼、埋头、端坐等各种姿态, 最终结论是学生处于埋头状态.即学生在这段时间虽然有学习的时候, 但总体来看, 大部分时间处于埋头状态, 所以认定该学生没有认真学习.

    贝叶斯方法由英国学者贝叶斯(T. Bayes 1701 $\sim$ 1761)提出的贝叶斯公式发展而来.贝叶斯公式在形式上是对条件概率的定义和全概率公式的一个简单的归纳和推理.设$A$为样本空间$\Omega$中的一个事件, $B_1, B_2, \cdots, B_n$ ($n$为有限或无穷)是样本空间$\Omega$中的一个完备事件群, 且有${\rm P}(B_i)>0~(i=1, 2, \cdots, n)$, ${\rm P}(A)>0$, 则事件$A$的全概率公式可写为式(18).

    $$ {\rm P}(A)={\rm P}\left(\sum\limits_{i=1}^nAB_i\right)=\sum\limits_{i=1}^n{\rm P}(A|B_i){\rm P}(B_i) $$ (18)

    在全概率公式的条件下, 按照条件概率, 贝叶斯公式可以表示为式(19)

    $$ {\rm P}(B_i|A)=\frac{{\rm P}(A|B_i){\rm P}(B_i)}{{\rm P}(A)}=\frac{{\rm P}(A|B_i){\rm P}(B_i)}{\sum\limits_{i=1}^n{\rm P}(A|B_i){\rm P}(B_i)} $$ (19)
    3.6.1   对比实验1

    在这个实验中, 我们使用第3.4节, 也就是复杂状态实验1的实验数据.

    先验概率是指缺乏某个事实的情况下描述一个变量.在这里的先验概率是指在不知道视频中学生$X, Y, S, \theta$变化量的情况下, 而根据专家经验估计学生出现左顾右盼、埋头和端坐的概率.通过观察视频中的学生状态并和多位有经验的教师分析讨论, 我们设定: ${\rm P}(h_1^*)=0.2, {\rm P}(h_2^*)=0.1, {\rm P}(h_3^*)=0.7$.

    似然函数是指在已知某些观测所得到的结果时, 对有关事物性质的参数进行估计, 即在给定输出$h$时, 关于参数$M$的似然函数${\rm P}(M|h)$, 它(在数值上)等于已知观察结果$h$前提下给定参数$M$的发生的条件概率.例如抛10次硬币都为正面朝上的概率, 那硬币正反面对称(也就是正反面概率均为0.5的概率)的似然程度是多少.在本文中我们有4个证据体$M~(X$、$Y$、面积$S$、角度$\theta$), 人体框架中有三个状态$h$ (左顾右盼、埋头、端坐), 根据理论常识结合多次实验我们发现, 当左顾右盼($h_1$)时, $X$轴质心和角度一定会发生较大的变化, 所以这里我们赋予${\rm P}(X|h_1)=0.4$和${\rm P}(\theta|h_1)=0.45$较大的概率, 而$Y$轴方向上的质心和学生的面积可能不会太大的变化, 所以我们设定${\rm P}(Y|h_1)=0.1$和${\rm P}(S|h_1)=0.05$.同样的道理, 我们设定:

    $$ \begin{align}&{\rm P}(X|h_2)=0.05, {\rm P}(Y|h_2)=0.55 \\&{\rm P}(S|h_2)=0.35, {\rm P}(\theta|h_2)=0.05\\&{\rm P}(X|h_3)=0.25, {\rm P}(Y|h_3)=0.25 \\&{\rm P}(S|h_3)=0.25, {\rm P}(\theta|h_3)=0.25\end{align} $$

    后验概率是指考虑了一个事实之后的条件概率, 它通过贝叶斯公式, 用先验概率和似然函数计算出来.根据以上的分析, 并根据贝叶斯公式(19), 那么后验概率为:

    $$ \begin{align} &{\rm P}(h_1|X)=\frac{{\rm P}(X|h_1){\rm P}(h_1^*)}{\sum\limits_{i=1}^3{\rm P}(X|h_i){\rm P}(h_i^*)}=0.3077 \\&{\rm P}(h_1|Y)=0.0800, \ {\rm P}(h_1|S)=0.0455\\&{\rm P}(h_1|\theta)=0.3333 \end{align} $$

    同理得到:

    $$ \begin{align}&{\rm P}(h_2|X)=0.0192, \ {\rm P}(h_2|Y)=0.22\\& {\rm P}(h_2|S)=0.1591, \ {\rm P}(h_2|\theta)=0.0185 \\&{\rm P}(h_3|X)=0.6731, \ {\rm P}(h_3|Y)=0.7000\\&{\rm P}(h_3|S)=0.7954, \ {\rm P}(h_3|\theta)=0.6482\end{align} $$

    从复杂状态实验1的实验数据中, 结合式(10) $\sim$ (14), 我们可以得到, 在这段时间内, $X$轴质心变化的帧数为36, $Y$轴质心变化的帧数为7, 面积变化的帧数为3, 角度变化的帧数为35.所以${\rm P}(X)=0.4444, {\rm P}(Y)=0.0864, {\rm P}(S)=0.0370, {\rm P}(a)=0.4321$.

    再根据全概率公式, 本次实验中左顾右盼的概率为:

    $$ \begin{align} {\rm P}(h_1)= &\sum\limits_{j=1}^4{\rm P}(h_1|M_j){\rm P}(M_j)=\\ &\sum\limits_{j=1}^4{\rm P}(h_1|M_{j})\sum\limits_{i=1}^3{\rm P}(M_j|h_i){\rm P}(h_i^*)=\\ &\sum\limits_{j=1}^4\sum\limits_{i=1}^3{\rm P}(h_1|M_j){\rm P}(M_j|h_i){\rm P}(h_i^*)=\\ &0.2894 \end{align} $$

    其中, ${\rm P}(M_j)$表示的是4个证据体($X$轴质心坐标、$Y$轴质心坐标、面积和角度)发生变化的概率.

    同样的方法, 我们可以得到埋头的概率为:

    $$ \begin{split} {\rm P}(h_2)=\sum\limits_{j=1}^4{\rm P}(h_2|M_j){\rm P}(M_j)=0.0415 \end{split} $$

    端坐的概率为:

    $$ \begin{split} {\rm P}(h_3)=\sum\limits_{j=1}^4{\rm P}(h_3|M_j){\rm P}(M_j)=0.6692 \end{split} $$

    根据上面得到的概率值, 我们可以得到这段时间学生处于端坐状态, 可以推测其学习比较认真.

    为了证明不同的先验概率对最后决策结果的影响, 这里加入另一组先验概率下的决策推断.设定${\rm P}(h_1^{*})=0.3, {\rm P}(h_2^{*})=0.1, {\rm P}(h_3^{*})=0.6$.最终得出的${\rm P}(h_1)=0.3805, {\rm P}(h_2)=0.0534, {\rm P}(h_3)=0.5662$.从结果可以看出不同的先验概率, 虽然会影响最终的概率值, 但不会影响最终的决策结果.

    3.6.2   对比实验2

    在这个实验中, 我们使用第3.5节也就是复杂状态实验2的实验数据.根据专家经验估计并通过观察视频中的学生状态并和多位有经验的教师分析讨论, 我们设定先验概率为${\rm P}(h_1^{*})=0.2, {\rm P}(h_2^{*})=0.65, {\rm P}(h_3^{*})=0.15$.由于在抛硬币时, 不管第几次抛, 何时抛, 硬币正反面对称(也就是正反面概率均为0.5的概率)的似然程度是不变的, 所以本次实验的似然函数仍采用对比实验1中的值.

    有了先验概率和似然函数, 根据贝叶斯公式, 那么后验概率为:

    $$ \begin{align} &{\rm P}(h_1|X)=0.5333, {\rm P}(h_1|Y)=0.0482\\ &{\rm P}(h_1|S)=0.0364, {\rm P}(h_1|A)=0.5625\\ &{\rm P}(h_2|X)=0.2167, {\rm P}(h_2|Y)=0.8614 \\ \;\;\\ &{\rm P}(h_2|S)=0.8273, {\rm P}(h_2|A)=0.2031\\ &{\rm P}(h_3|X)=0.2500, {\rm P}(h_3|Y)=0.0904\\ &{\rm P}(h_3|S)=0.1364, {\rm P}(h_3|A)=0.2344 \end{align} $$

    通过实验数据我们得到:

    $$ \begin{split} &{\rm P}(X)=0.0583, {\rm P}(Y)=0.2883\\ &{\rm P}(S)=0.2699, {\rm P}(A)=0.3834 \end{split} $$

    最后根据全概率公式, 得到:

    $$ \begin{split} &{\rm P}(h_1)=0.2705, {\rm P}(h_2)=0.5622\\ &{\rm P}(h_3)=0.1673 \end{split} $$

    表 12中我们比较了使用D-S证据理论和贝叶斯方法得到的结果, 可以发现和使用贝叶斯方法相比, 使用D-S理论可以降低推理过程中的不确定性, 同时使用D-S方法得到的结果也与我们的认知更为相符.

    表 12  D-S推理方法和贝叶斯推理方法的对比
    Table 12  Comparison of D-S inference and the Bayesian inference methods
    对比实验 理论方法 $h_1$ $h_2$ $h_3$ $U$
    对比实验1 D-S理论 0.0001 0 0.9999 0
    贝叶斯方法 0.2894 0.0415 0.6692 -
    对比实验2 D-S理论 0.0001 0.9863 0.0136 0
    贝叶斯方法 0.2705 0.5622 0.1673 -
    下载: 导出CSV 
    | 显示表格

    表 12中的数据我们可以看出, D-S理论方法比贝叶斯方法具有更高的决策支持.在对比实验1中, D-S理论得出的结果相对于贝叶斯理论方法提高了$\frac{0.9999-0.6692}{0.6692}\times100 \%=49.42\, \%$的决策支持; 而在对比实验2中, 相对于贝叶斯方法, D-S理论更是提高了$\frac{0.9863-0.5622}{0.5622}\times100\, \%=75.44\, \%$的决策支持, 贝叶斯方法过多地依赖于先验概率和经验常识, 使用D-S理论可以更好地处理得到的人体信息, 并完成决策推理工作.与贝叶斯方法的对比实验表明, 使用D-S理论可以大幅度降低决策中的不确定性, 同时得到的决策结果也与我们的认知更加符合.

    为了解决在线课程授课过程中, 缺乏对于学生学习情况的跟踪与教学效果评估问题, 本文依据视频信息对学生注意力进行建模, 并提出了一种评判学生听课专心程度的行为自动分析算法.该算法能够有效跟踪学生的学习状态, 提取学生的行为特征参数, 并对这些参数进行D-S融合判决, 以获得学生的听课专注度.经过多次实验的结果表明, 本文采用的方法能够有效评判学生在授课期间的专心程度, 对每一种行为的识别率可以达到$95\, \%$以上.在融合决策中, 与贝叶斯推理方法相比, 采用D-S融合评判的准确度更高.

    本文还存在着分类的种类较为简单, 不能完全概括网络在线授课中学生的学习状态的不足.对此, 可以扩充人体行为的分类方式, 尝试加入模糊隶属度函数, 在多种分类的情况下, 对人体的行为进行分析和判断, 得到更为完备的人体辨识框架.这也是本研究后续的工作方向.

  • 图  1  权重非平衡有向图

    Fig.  1  The weight-unbalanced directed graph

    图  2  不同算法下状态变量$ x_{i1}(t) $的轨迹

    Fig.  2  The trajectories of the state variables $ x_{i1}(t)$ under different algorithms

    图  3  状态变量$x_{i2}(t)$的轨迹

    Fig.  3  The trajectories of the state variables $x_{i2}(t)$

    图  4  状态变量$x_{i3}(t)$的轨迹

    Fig.  4  The trajectories of the state variables $x_{i3}(t)$

    图  5  全局代价函数梯度$\sum_{i = 1}^{5}\nabla f_i(x_{i1}(t))$的轨迹

    Fig.  5  The trajectory of global cost function gradient $\sum_{i = 1}^{5}\nabla f_i(x_{i1}(t))$

    图  6  PI变量$q_{i}(t)$的轨迹

    Fig.  6  The trajectories of the PI variables $q_{i}(t)$

    图  7  变量$\hat{r}_i(t)$的轨迹

    Fig.  7  The trajectories of variables $\hat{r}_i(t)$

  • [1] Dougherty S, Guay M. An extremum-seeking controller for distributed optimization over sensor networks. IEEE Transactions on Automatic Control, 2017, 62(2): 928−933 doi: 10.1109/TAC.2016.2566806
    [2] Chang T H, Nedic A, Scaglione A. Distributed constrained optimization by consensus-based primal-dual perturbation method. IEEE Transactions on Automatic Control, 2014, 59(6): 1524−1538 doi: 10.1109/TAC.2014.2308612
    [3] Jaleel H, Shamma J S. Distributed optimization for robot networks: From real-time convex optimization to game-theoretic self-organization. Proceedings of the IEEE, 2020, 108(11): 1953−1967 doi: 10.1109/JPROC.2020.3028295
    [4] 杨涛, 柴天佑. 分布式协同优化的研究现状与展望. 中国科学: 技术科学, 2020, 50(11): 1414−1425 doi: 10.1360/SST-2020-0040

    Yang Tao, Chai Tian-You. Research status and prospects of distributed collaborative optimization. Scientia Sinica Technologica, 2020, 50(11): 1414−1425 doi: 10.1360/SST-2020-0040
    [5] Yang T, Yi X L, Wu J F, Yuan Y, Wu D, Meng Z Y, et al. A survey of distributed optimization. Annual Reviews in Control, 2019, 47: 278−305 doi: 10.1016/j.arcontrol.2019.05.006
    [6] 杨涛, 徐磊, 易新蕾, 张圣军, 陈蕊娟, 李渝哲. 基于事件触发的分布式优化算法. 自动化学报, 2022, 48(1): 133−143

    Yang Tao, Xu Lei, Yi Xin-Lei, Zhang Sheng-Jun, Chen Rui-Juan, Li Yu-Zhe. Event-triggered distributed optimization algorithms. Acta Automatica Sinica, 2022, 48(1): 133−143
    [7] 朱文博, 王庆领. 基于梯度估计的多智能体系统有限时间分布式优化. 控制理论与应用, 2023, 40(4): 615−623

    Zhu Wen-Bo, Wang Qing-Ling. Gradient estimations based distributed finite-time optimization for multiagent systems. Control Theory & Applications, 2023, 40(4): 615−623
    [8] Nedic A, Ozdaglar A. Distributed subgradient methods for multi-agent optimization. IEEE Transactions on Automatic Control, 2009, 54(1): 48−61 doi: 10.1109/TAC.2008.2009515
    [9] Shi W, Ling Q, Wu G, Yin W. EXTRA: An exact first-order algorithm for decentralized consensus optimization. SIAM Journal on Optimization, 2015a, 25(2): 944−966 doi: 10.1137/14096668X
    [10] Gharesifard B, Cortes J. Distributed continuous-time convex optimization on weight-balanced digraphs. IEEE Transactions on Automatic Control, 2014, 59(3): 781−786 doi: 10.1109/TAC.2013.2278132
    [11] Kia S S, Cortes J, Martinez S. Distributed convex optimization via continuous-time coordination algorithms with discrete-time communication. Automatica, 2015, 55: 254−264 doi: 10.1016/j.automatica.2015.03.001
    [12] Wang X H, Hong Y G, Ji H B. Distributed optimization for a class of nonlinear multiagent systems with disturbance rejection. IEEE Transactions on Cybernetics, 2016, 46(7): 1655−1666 doi: 10.1109/TCYB.2015.2453167
    [13] Wang D, Wang Z, Wen C Y. Distributed optimal consensus control for a class of uncertain nonlinear multiagent networks with disturbance rejection using adaptive technique. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2021, 51(7): 4389−4399 doi: 10.1109/TSMC.2019.2933005
    [14] Liu T F, Qin Z Y, Hong Y G, Jiang Z P. Distributed optimization of nonlinear multiagent systems: A small-gain approach. IEEE Transactions on Automatic Control, 2022, 67(2): 676−691 doi: 10.1109/TAC.2021.3053549
    [15] Tang Y T, Deng Z H, Hong Y G. Optimal output consensus of high-order multiagent systems with embedded technique. IEEE Transactions on Cybernetics, 2019, 49(5): 1768−1779 doi: 10.1109/TCYB.2018.2813431
    [16] Tang Y T, Wang X H. Optimal output consensus for nonlinear multiagent systems with both static and dynamic uncertainties. IEEE Transactions on Automatic Control, 2021, 66(4): 1733−1740 doi: 10.1109/TAC.2020.2996978
    [17] Wang Q L, Wu W Q. A distributed finite-time optimization algorithm for directed networks of continuous-time agents. International Journal of Robust and Nonlinear Control, 2024, 34(6): 4032−4050 doi: 10.1002/rnc.7176
    [18] Zhang J, Liu L, Ji H B. Optimal output consensus of second-order uncertain nonlinear systems on weight-unbalanced directed networks. International Journal of Robust and Nonlinear Control, 2022, 32(8): 4878−4898 doi: 10.1002/rnc.6059
    [19] Gkesoulis A K, Psillakis H E, Lagos A R. Optimal consensus via OCPI regulation for unknown pure-feedback agents with disturbances and state delays. IEEE Transactions on Automatic Control, 2022, 67(8): 4338−4345 doi: 10.1109/TAC.2022.3179218
    [20] 时侠圣, 杨涛, 林志赟, 王雪松. 基于连续时间的二阶多智能体分布式资源分配算法. 自动化学报, 2021, 47(8): 2050−2060

    Shi Xia-Sheng, Yang Tao, Lin Zhi-Yun, Wang Xue-Song. Distributed resource allocation algorithm for second-order multi-agent systems in continuous-time. Acta Automatica Sinica, 2021, 47(8): 2050−2060
    [21] 杨正全, 杨秀伟, 陈增强. 非平衡有向网络下带约束的连续时间分布式优化算法设计. 控制理论与应用, 2023, 40(6): 1053−1060

    Yang Zheng-Quan, Yang Xiu-Wei, Chen Zeng-Qiang. Continuous time with constraints in general directed networks distributed optimization algorithm design. Control Theory & Applications, 2023, 40(6): 1053−1060
    [22] 刘奕葶, 马铭莙, 付俊. 基于有向图的分布式连续时间非光滑耦合约束凸优化分析. 自动化学报, 2024, 50(1): 66−75

    Liu Yi-Ting, Ma Ming-Jun, Fu Jun. Distributed continuous-time non-smooth convex optimization analysis with coupled constraints over directed graphs. Acta Automatica Sinica, 2024, 50(1): 66−75
    [23] Zhu Y N, Yu W W, Wen G H, Ren W. Continuous-time coordination algorithm for distributed convex optimization over weight-unbalanced directed networks. IEEE Transactions on Circuits and Systems II: Express Briefs, 2019, 66(7): 1202−1206
    [24] Li Z H, Ding Z T, Sun J Y, Li Z K. Distributed adaptive convex optimization on directed graphs via continuous-time algorithms. IEEE Transactions on Automatic Control, 2018, 63(5): 1434−1441 doi: 10.1109/TAC.2017.2750103
    [25] Psillakis H E. PI consensus error transformation for adaptive cooperative control of nonlinear multi-agent systems. Journal of the Franklin Institute-Engineering and Applied Mathematics, 2019, 356(18): 11581−11604 doi: 10.1016/j.jfranklin.2019.09.024
    [26] Khalil H K. Nonlinear Systems. New Jersey: Prentice Hall, 2002.
    [27] Theodorakopoulos A, Rovithakis G A. Guaranteeing preselected tracking quality for uncertain strict-feedback systems with deadzone input nonlinearity and disturbances via low-complexity control. Automatica, 2015, 54: 135−145 doi: 10.1016/j.automatica.2015.01.038
    [28] Bechlioulis C P, Rovithakis G A. A low-complexity global approximation-free control scheme with prescribed performance for unknown pure feedback systems. Automatica, 2014, 50(4): 1217−1226 doi: 10.1016/j.automatica.2014.02.020
    [29] 张晋熙, 柴天佑, 王良勇. 时延非线性系统无模型预设性能控制. 自动化学报, 2024, 50(5): 939−948

    Zhang Jin-Xi, Chai Tian-You, Wang Liang-Yong. Model-free prescribed performance control of time-delay nonlinear systems. Acta Automatica Sinica, 2024, 50(5): 939−948
    [30] Na J. Adaptive prescribed performance control of nonlinear systems with unknown dead zone. International Journal of Adaptive Control and Signal Processing, 2013, 27(5): 426−446 doi: 10.1002/acs.2322
  • 加载中
图(7)
计量
  • 文章访问数:  317
  • HTML全文浏览量:  3073
  • PDF下载量:  122
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-05-28
  • 录用日期:  2024-08-31
  • 网络出版日期:  2024-09-23
  • 刊出日期:  2025-03-18

目录

/

返回文章
返回