2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于事件触发二阶多智能体系统的固定时间比例一致性

陈世明 邵赛 姜根兰

邵晓雯, 帅惠, 刘青山. 融合属性特征的行人重识别方法. 自动化学报, 2022, 48(2): 564−571 doi: 10.16383/j.aas.c190763
引用本文: 陈世明, 邵赛, 姜根兰. 基于事件触发二阶多智能体系统的固定时间比例一致性. 自动化学报, 2022, 48(1): 261−270 doi: 10.16383/j.aas.c190128
Shao Xiao-Wen, Shuai Hui, Liu Qing-Shan. Person re-identification based on fused attribute features. Acta Automatica Sinica, 2022, 48(2): 564−571 doi: 10.16383/j.aas.c190763
Citation: Chen Shi-Ming, Shao Sai, Jiang Gen-Lan. Distributed event-triggered fixed-time scaled consensus control for second-order multi-agent systems. Acta Automatica Sinica, 2022, 48(1): 261−270 doi: 10.16383/j.aas.c190128

基于事件触发二阶多智能体系统的固定时间比例一致性

doi: 10.16383/j.aas.c190128
基金项目: 国家自然科学基金(61973118, 11662002),江西省科技厅项目(20182BCB22009, 20171BAB202029, 20165BCB19011)资助
详细信息
    作者简介:

    陈世明:华东交通大学电气与自动化 工程学院教授. 2006 年于华中科技大学获得博士学位. 主要研究方向为复杂网络理论及应用, 多智能体系统协调控制, PSO 优化算法. 本文通信作者. E-mail: shmchen@ecjtu.jx.cn

    邵赛:华东交通大学电气与自动化工程学院硕士研究生. 主要研究方向为多智能体系统协调控制. E-mail: 15797863922@163.com

    姜根兰:华东交通大学电气与自动化工程学院硕士研究生. 主要研究方向为多智能体系统协调控制. E-mail: jiang094921@163.com

Distributed Event-triggered Fixed-time Scaled Consensus Control for Second-order Multi-agent Systems

Funds: Supported by National Natural Science Foundation of China (61973118, 11662002), Project in JiangXi Province Department of Science and Technology (20182BCB22009, 20171BAB202029, 20165BCB19011)
More Information
    Author Bio:

    CHEN Shi-Ming Professor at the School of Electrical and Automation Engineering, East China Jiaotong University. He received his Ph. D. degree from Huazhong University of Science and Technology. His research interest covers complex network theory and application, coordination control of multi-agent systems, and particle swarm optimization algorithm. Corresponding author of this paper

    SHAO Sai Master student at the School of Electrical and Automation Engineering, East China Jiaotong University. His research interest covers coordination control of multi-agent systems

    JIANG Gen-Lan Master student at the School of Electrical and Automation Engineering, East China Jiaotong University. His research interest covers coordination control of multi-agent systems

  • 摘要: 研究了在无向拓扑下, 由多个子群组成的二阶多智能体系统的固定时间比例一致性问题, 采用反推法设计了一种基于事件触发的固定时间非线性比例一致控制策略, 该策略包含分段式事件触发函数: 当智能体在追踪虚拟速度时, 给出了基于速度信息的触发条件; 当智能体速度与虚拟速度达到一致时, 切换至基于位置信息的触发条件, 可有效减少系统能量耗散及控制器更新频次. 通过在位置和速度状态上设置比例参数, 在固定时间内可实现不同子群智能体之间的比例一致. 利用代数图论、线性矩阵不等式以及Lyapunov稳定性理论, 证明在该控制策略下, 二阶多智能体系统能实现固定时间比例一致性, 且不存在Zeno行为. 最后, 仿真实例进一步验证了理论结果的有效性.
  • 行人重识别指跨监控设备下的行人检索问题, 在公共安全、智能监控等领域具有广泛的应用. 具体而言, 给定一张行人图片, 行人重识别用来在其他摄像头拍摄的大型图片库中找出该行人的图片. 由于监控图片的分辨率低, 且不同的图片之间存在光照、姿态、摄像头视角等方面的差异, 行人重识别目前仍是一个很有挑战性的问题.

    早期行人重识别的研究思路通常是先对行人图片提取手工特征, 如颜色直方图、方向梯度直方图(Histogram of oriented gradient, HOG)[1]等, 然后使用相似性度量方法, 如大边界最近邻算法(Large margin nearest neighbor, LMNN)[2]、交叉二次判别分析算法(Cross-view quadratic discriminant analysis, XQDA)[3]等来学习度量矩阵. 为了克服光照、成像条件等因素影响, 采用多特征分析是常用的一种方式[4-6]. 随着深度学习技术的兴起, 深度学习广泛应用于行人重识别任务中. 目前, 基于深度学习的行人重识别方法在性能上大大超过了传统方法[7], 主要有如下两个原因: 1) 手工设计的特征描述能力有限, 而深度学习使用深度卷积神经网络可以自动学习出更复杂的特征; 2) 深度学习可以将特征提取和相似性度量联合在一起, 实现端到端的学习, 从而得到全局最优解.

    目前基于深度学习的行人重识别方法主要分为度量学习和表征学习方法[8]. 度量学习通过设计不同的度量损失来约束特征空间, 使得同一个行人的不同图片在特征空间上距离很近, 而不同行人的距离很远, 如三元组损失(Triplet loss)[9]、四元组损失(Quadruplet loss)[10]和群组相似性学习(Group similarity learning)[11]等方法. 这类方法的关键在于样本对的选取, 由于大量样本对简单易于区分, 随机采样将会导致网络的泛化能力有限, 因而需要挑选出一些难样本对进行训练. Zhu等[12]对困难和简单的负样本设计不同的目标函数来学习距离度量方法, 以充分利用负样本中的信息. 相对于表征学习, 度量学习的训练时间更长, 收敛也更困难. 因此, 表征学习方法得到了更加广泛的研究.

    表征学习方法在训练网络时将行人重识别当作身份分类任务来学习行人特征, 关键问题是如何设计网络以学习到更具有判别力的特征. Sun等[13]根据人体结构的先验知识, 在垂直方向上对特征图均匀分块, 然后提取每个区域的局部特征. 还有一些方法利用额外的语义信息, 例如骨骼关键点、分割结果等, 定位行人的各个部位. Su等[14]借助关键点检测模型对人体区域定位、裁剪、归一化后, 拼接成新的图片作为网络的输入. Sarfraz等[15]将行人14个关键点的位置响应图和原图片一起输入到网络中, 让网络自动地学习对齐. Kalayeh等[16]在LIP (Look into person)[17]数据集上训练人体解析模型来预测4个人体部位和背景, 然后在特征图上提取这些部位的特征.

    由于不同的行人可能具有相似的外观, 而同一个行人在不同的环境下存在很大差异, 只从全局外观的角度无法进行正确匹配. 行人的属性, 例如性别、是否背包、头发长短等, 包含丰富的语义信息, 可以为行人重识别提供关键的判别线索. 早期的研究中, Layne等[18]手工标注了15种语义属性来描述行人, 包括性别、服装种类、是否携带物品等, 并使用支持向量机(Support vector machine, SVM)训练属性分类器, 最后与底层特征融合得到行人图像的最终特征描述. 随着深度学习的广泛应用, Zhu等[19]在一个卷积神经网络中同时预测多个属性, 在PETA (Pedestrian attribute)[20]数据集上的属性识别性能明显优于基于SVM的方法. Schumann等[21]先在PETA数据集上训练属性识别模型, 然后在行人重识别模型中利用属性预测的结果, 使得网络可以学习到与属性互补的特征. 该方法分开训练两个网络, 无法充分利用属性标签和身份标签, 导致行人重识别的性能比较低. Lin等[22]在行人重识别数据集DukeMTMC-reID[23]和Market1501[24]上标注了行人属性, 并提出APR (Attribute-person recognition)模型实现行人重识别和属性识别的多任务学习, 同时将属性预测的结果和全局特征一起用于行人重识别任务. 该方法使用属性的预测结果, 当属性识别错误时, 会给行人重识别引入噪声. Tay等[25]提出了AANet (Attribute attention network), 将行人属性和属性的激活区域图集成到分类网络中来解决行人重识别问题, 得到了比较好的检索结果. 上述方法同等对待所有属性, 忽略了每个属性对每张图片的重要性是不同的.

    针对以上问题, 本文提出了融合属性特征的行人重识别方法, 主要工作如下: 1) 将行人重识别和属性识别集成到分类网络中进行端到端的学习; 2) 为了减小属性识别错误对行人重识别的影响, 从特征的角度利用属性信息; 3) 自适应地生成对应于每个属性的权重, 并将所有属性特征以加权求和的方式结合起来, 与全局特征一起用于行人重识别任务. 在DukeMTMC-reID和Market-1501数据集上的实验结果表明了本文方法的有效性.

    图1为本文的网络结构图, 前半部分为提取图片特征的主干网络, 后半部分分为身份分类、属性识别和属性特征融合三个分支. 身份分类分支对行人的全局特征进行身份的预测; 属性识别分支用来预测行人的各个属性; 属性特征融合分支首先以自适应的方式对属性特征加权求和, 得到融合后的属性特征, 然后对该特征进行身份预测.

    图 1  网络结构示意图
    Fig. 1  Schematic diagram of network structure

    使用ResNet-50作为主干网络提取图片的特征. ResNet-50包含1层卷积层(conv1)和4个残差模块(conv2 ~ conv5), 每个残差模块包含多层卷积层、批量规范化层和线性整流激活函数(Rectified linear units, ReLU). 文献[26]提出多个相关性低甚至相反的任务一起学习时, 在共享参数上会产生相互竞争甚至相反的梯度方向, 从而影响所有任务的学习. 为了减轻任务间的干扰, 在ResNet-50的第4个模块conv4后将网络分成两个分支, 分别学习行人的全局特征和属性特征, 即两个分支中conv5模块的参数不共享. 根据文献[13], 本文去除了两个分支的conv5模块中的下采样操作, 以增加特征图的大小、丰富特征的粒度. 将大小为$ 256 \times $$ 128 $像素的图片输入网络时, 可以从conv5模块输出大小为$ 16 \times 8 $的特征图.

    $ S = \left\{\left(x_{1}, y_{1}, {\boldsymbol a}_{1}\right), \cdots, \left(x_{n}, y_{n}, {\boldsymbol a}_{n}\right)\right\} $为训练数据集, 其中$ n $是图片的张数, $ x_{i} $表示第$ i $张图片, $ y_{i} \in \left\{1, 2, \cdots, N \right\} $表示该图片的身份标签, $ N $是训练集中行人的个数, $ {\boldsymbol a}_{i} = \left[a_{i}^{1}, a_{i}^{2}, \cdots, a_{i}^{M}\right] \in {\bf R}^{M} $表示这张图片的属性标签, $ M $是属性的个数, 对于DukeMTMC-reID和Market-1501数据集, $ M $分别是10和12, $ a_{i}^{j} \in \left\{1, 2, \cdots, C^{j}\right\} $指这张图片的第$ j $个属性的标签, $ C^{j} $表示第$ j $个属性的类别个数. 如图1所示, 对于$ (x, y, {\boldsymbol a}) \in S $, 将图片$ x $输入到网络, 可以分别得到对应于身份分类的特征图$ I \in {\bf R}^{h \times w \times d} $和属性识别的特征图$ A \in {\bf R}^{h \times w \times d} $.

    对于身份特征图$ I \in {\bf R}^{h \times w \times d} $, 先用全局平均池化(Global average pooling, GAP)对$ I $处理得到特征$ {\boldsymbol z} \in {\bf R}^{d}, $随后使用全连接(Fully connected, FC)层、批量规范化层和ReLU激活函数对特征$ {\boldsymbol z} $进行降维, 得到全局特征$ {\boldsymbol g} \in {\bf R}^{v} .$训练时对特征$ {\boldsymbol g} $使用全连接层和Softmax激活函数得到行人身份的分类结果, 最后使用交叉熵损失函数作为目标函数. 为了防止训练时出现过拟合的问题, 对身份标签进行平滑操作(Label smoothing, LS)[27], LS是分类任务中防止过拟合的常用方法. 相应的过程如下:

    $$ \hat{\boldsymbol p}^{({\rm{id}})} = {\rm{softmax}}\left(W^{({\rm{id}})} {\boldsymbol g}+{\boldsymbol b}^{({\rm{id}})}\right) $$ (1)
    $$p_i^{({\rm{id}})} = \left\{ {\begin{array}{*{20}{l}} {1 - \dfrac{{N - 1}}{N}\varepsilon },\;&{i = y}\\ \dfrac{\varepsilon }{N},\;&{i \ne y} \end{array}} \right. \;$$ (2)
    $$ L_{{\rm{id}}} = -\sum\limits_{i = 1}^{N} p_{i}^{({\rm{id}})} {\rm{ln}} \hat{p}_{i}^{({\rm{id}})}\;\;\quad \qquad $$ (3)

    其中, $ N $为训练集中行人的个数, $W^{({\rm{id}})} \in {\bf R}^{N \times v}$${\boldsymbol b}^{({\rm{id}})} \in {\bf R}^{N}$分别是全连接层的权重矩阵和偏差向量, $\hat{\boldsymbol p}^{({\rm{id}})} \in {\bf R}^{N}$为输出的行人身份的预测概率. 式(2)表示对身份标签$ y $进行LS操作, $ \varepsilon $是一个数值较小的超参数, 文中$ \varepsilon = 0.1 $. $L_{{\rm{id}}}$为网络的身份分类损失.

    在属性识别分支中, 与身份分类类似, 先用GAP对属性特征图$ A \in {\bf R}^{h \times w \times d} $处理, 得到特征${\boldsymbol f} \in {\bf R}^{d},$ 然后使用$ M $层全连接层对特征$ {\boldsymbol f} $进行提取, 得到$ M $个属性特征$\{{\boldsymbol h}^{1}, {\boldsymbol h}^{2}, \cdots, {\boldsymbol h}^{M}\}.$ 对于每一个属性特征${\boldsymbol h}^{k} \in {\bf R}^{v},$ 使用全连接层和Softmax激活函数得到对应的属性分类结果, 最后使用交叉熵损失作为目标函数. 相应的过程如下:

    $$ \hat{\boldsymbol p}^{k} = {\rm{softmax}}\left(W^{k} {\boldsymbol h}^{k}+{\boldsymbol b}^{k}\right) $$ (4)
    $$p_j^k = \left\{ {\begin{array}{*{20}{l}} 1,\;&{j = {a^k}}\\ 0,\;&{j \ne {a^k}} \end{array}} \right.\qquad\;\;\;\; $$ (5)
    $$ L_{k} = -\sum\limits_{j = 1}^{C^{k}} p_{j}^{k} {\rm{ln}} \hat{p}_{j}^{k}\;\;\;\; \qquad $$ (6)

    对于第$ k $个属性, $ C^{k} $表示它的类别个数, $ W^{k} \in {\bf R}^{C^{k} \times v} $$ {\boldsymbol b}^{k} \in {\bf R}^{C^{k}} $分别是对应的全连接层的权重矩阵和偏差向量, $ \hat{\boldsymbol p}^{k} \in {\bf R}^{C^{k}} $为该属性的预测结果, $ L_{k} $为第$ k $个属性的分类损失.

    由于属性各个类别的样本比例不平衡, 并且为了降低大量简单样本在训练中所占的权重, 对于每个属性使用加权的焦点损失(Focal loss)函数[28], 更改后的属性损失函数如下:

    $$ L_{k} = -\frac{1}{C^{k}} \sum\limits_{j = 1}^{C^{k}} \frac{1}{w_{j}^{k}}\left(1-\hat{p}_{j}^{k}\right)^{\gamma} p_{j}^{k} {\rm{ln}} \hat{p}_{j}^{k} $$ (7)
    $$ L_{{\rm{att}}} = \sum\limits_{k = 1}^{M} L_{k}\;\qquad\qquad\qquad\qquad\qquad $$ (8)

    其中, $ w_{j}^{k} $是第$ k $个属性的类别$ j $在训练集中所占的比例, $ \gamma>0 $使得训练更关注于易于错分的样本, 文中$\gamma = 2, \;L_{{\rm{att}}}$为总的属性损失.

    如果直接应用属性的预测结果, 当属性预测错误时, 很容易给行人重识别任务引入噪声, 因此从特征的角度对属性加以利用. 属性特征更关注于行人图片的某个区域, 因而可以融合所有属性的特征和全局特征互相补充. 直接想法是将提取到的$ M $个属性特征$ \{{\boldsymbol h}^{1}, {\boldsymbol h}^{2}, \cdots, {\boldsymbol h}^{M}\} $以相加或相连等方式进行融合, 但是对于每张图片, 每个属性的重要性是不同的, 如果简单地对每个属性分配相同的权重, 最终可能会降低属性信息带来的益处. 因此, 对于每张图片, 网络都会自适应地生成每个属性对应的权重, 用来融合属性特征. 具体方法如下: 对于图片$ x $得到的特征${\boldsymbol f} \in {\bf R}^{d} ,$ 首先使用一层全连接层和Sigmoid激活函数得到对应于每个属性特征的权重, 具体表示为

    $$ {\boldsymbol w} = {\rm sigmoid}\left(W^{({\rm{weight}})} {\boldsymbol f}+{\boldsymbol b}^{({\rm{weight}})}\right) $$ (9)

    其中, $W^{({\rm{weight}})} \in {\bf R}^{M \times d}$${\boldsymbol b}^{({\rm{weight}})} \in {\bf R}^{M}$分别表示全连接层的权重矩阵和偏差向量, 得到的属性权重向量${\boldsymbol w} = \left[w_{1}, w_{2}, \cdots, w_{M}\right],$ $w_{i} \in (0,1).$ 然后对每个属性特征以加权求和的方式, 即${\boldsymbol h}_{w} = \sum\nolimits_{k = 1}^{M} w_{k} {\boldsymbol h}^{k},$得到融合后的属性特征${\boldsymbol h}_{w} \in {\bf R}^{v}.$ 随后以额外监督的方式对特征$ {\boldsymbol h}_{w} $进行行人的身份分类, 具体与上述的分类过程相同, 使用全连接层和Softmax激活函数得到分类结果$\hat{\boldsymbol p}^{({\rm{local}})}$, 最后根据身份标签使用带有LS的交叉熵损失函数作为优化目标, 得到损失函数$L_{{\rm{local}}}$. 训练时$L_{{\rm{local}}}$可以监督属性权重和属性特征的生成, $L_{{\rm{local}}}$表示为

    $$ L_{{\rm{local}}} = -\sum\limits_{i = 1}^{N} p_{i}^{({\rm{id}})} {\rm{ln}} \hat{p}_{i}^{({\rm{local}})} $$ (10)

    其中, $p_{i}^{({\rm{id}})}$为式(2)对身份标签进行LS操作得到的结果.

    总的损失函数包括全局特征、属性融合特征的身份分类损失和属性分类损失, 具体表示为

    $$ L = L_{{\rm{id}}}+\alpha L_{{\rm{{\rm{local}}}}}+\beta L_{{\rm{att}}} $$ (11)

    其中, $ \alpha $$ \beta $是平衡三个损失的权重因子. 测试时, 将全局特征$ {\boldsymbol g} $和融合后的属性特征$ {\boldsymbol h}_{w} $相连得到行人总的特征${\boldsymbol e} = \left[{\boldsymbol g}; {\boldsymbol h}_{w}\right] \in {\bf R}^{2v},$ 并使用余弦距离计算特征间的距离, 排序后得到检索结果.

    本文的实验基于行人重识别的主流数据集DukeMTMC-reID和Market-1501进行评测, 并与PCB-RPP (Part-based convolutional baseline and refined part pooling)、PDC (Pose-driven deep convolutional)、ACRN (Attribute-complementary re-id net)等相关方法进行了对比. 使用Pytorch框架搭建整个网络, 图片的大小缩放为$ 256 \times 128 $像素, 仅使用水平随机翻转作为数据增强的方法. 训练时使用Adam优化器更新梯度, 初始学习率设为0.0003, weight_decay为0.0005. batch size设为32, 总共训练60个epoch, 每隔20个epoch, 所有参数的学习率降为之前的0.1倍. 使用ImageNet[29]上的预训练参数对网络初始化, 在前10个epoch中, 使用ImageNet初始化的参数保持不变, 仅更新随机初始化的参数. 降维之后的特征维度为512, 即$ v = 512 $.

    DukeMTMC-reID数据集共有1404个行人, 分为训练集16522张图片包含702个行人, 测试集17661张图片包含另外的702个行人和408个干扰行人, 另外有2228张图片作为待检索的行人图片. Lin等[22]对数据集中的每个行人标注了23个属性, 本文使用了所有的属性, 并把8个上衣颜色的属性作为1个类别数是8的属性, 同样将7个下衣颜色的属性作为1个类别数是7的属性, 最后得到10个属性.

    Market-1501数据集共有1501个行人, 分为训练集12936张图片包含751个行人, 测试集19 732张图片包含750个行人, 另外还有3368张图片作为待检索的行人图片. Lin等[22]对数据集中的每个行人标注了27个属性, 本文使用了所有的属性, 对上衣颜色和下衣颜色采取上述的组合方式, 最后得到12个属性.

    对于行人重识别任务, 使用标准的评估指标: 平均精度均值(Mean average precision, mAP)和累计匹配特性(Cumulative match characteristic, CMC)曲线. 对于属性识别任务, 本文对每个属性使用分类准确率进行评估, 同时计算了所有属性的平均分类准确率.

    表1是本文在DukeMTMC-reID和Market-1501数据集上与当前相关方法的比较. PCB-RPP对特征图均匀分块, 未考虑行人图片没有对齐的情形, 而且没有去除背景的干扰. PDC和PSE (Pose-sensitive embedding)利用额外的姿态估计模型, SPReID (Semantic parsing for re-identification)利用额外的人体解析模型, 来定位行人的各个部位, 这种方法由于不能端到端地学习, 训练好的部件定位模型在行人图片上定位错误时将会引入噪声, 最终影响行人重识别的结果. 表1中的下面3种方法利用属性标签辅助行人重识别, ACRN在属性数据集PETA上训练属性识别模型, APR和AANet-50没有考虑行人重识别和属性识别之间的关系, 直接使用同一个网络提取两个任务的特征. 此外, 它们对所有属性同等对待, 忽略了各个属性对行人描述的重要性是不同的. 在考虑了以上问题后, 本文的方法在DukeMTMC-reID上, mAP和Rank-1值分别达到了74.2%和87.1%, 超过了AANet-50的结果1.6%和0.7%, 在Market-1501上, mAP值超过AANet-50 1.0%, Rank-1值降低0.3%, 可见我们的方法对mAP影响更大. 而且相比于AANet-50使用CAM (Class activation maps)[30]定位属性激活区域, 本文的方法更加简单有效.

    表 1  与相关方法的性能比较(%)
    Table 1  Performance comparison with related methods (%)
    方法 DukeMTMC-reID Market-1501
    mAP Rank-1 mAP Rank-1
    PCB-RPP[13] 69.2 83.3 81.6 93.8
    PDC[14] 63.4 84.4
    PSE[15] 62.0 79.8 69.0 87.7
    SPReID[16] 71.0 84.4 81.3 92.5
    ACRN[21] 52.0 72.6 62.6 83.6
    APR[22] 55.6 73.9 66.9 87.0
    AANet-50[25] 72.6 86.4 82.5 93.9
    本文 74.2 87.1 83.5 93.6
    下载: 导出CSV 
    | 显示表格

    表2是DukeMTMC-reID上使用不同损失函数得到的检索结果, 使用$L_{{\rm{id}}}$相当于只训练身份分类的单支网络, 可以作为基准模型, $L_{{\rm{id}}}+\beta L_{{\rm{att}}}$指身份分类和属性识别的多任务学习网络, $L_{{\rm{id}}}+$$\alpha L_{{\rm{local}}}+ \beta L_{{\rm{att}}}$指在多任务网络的基础上, 加入了对属性特征进行身份监督的任务, 即本文使用的网络. 由表2可以得出以下结论: 基准模型得到了比较好的结果, mAP和Rank-1值分别达到70.5%和84.1%; 多任务网络比基准模型在mAP和Rank-1值上分别提高0.6%和1.7%, 说明加入的属性识别对行人重识别起到了促进的作用, 此时网络不光要正确预测行人的身份, 还需要预测出各个属性, 从而提高了网络的泛化性能; 当利用属性特征时, mAP和Rank-1值分别进一步提高3.1%和1.3%, 说明融合的属性特征可以补充全局特征, 最终形成了更具有判别力的特征. 另外, ${L_{{\rm{id}}}+\alpha L_{{\rm{local}}}+\beta L^*_{{\rm{att}}}}$指身份分类和属性识别双支网络中conv5模块的参数共享时的结果, 相比于不共享时, mAP和Rank-1值分别降低1.2%和1.1%, 说明这两个任务在提取特征的目标上并不完全相同, 参数共享的模型使得两者在训练时相互影响, 导致网络无法收敛至最优解. 本文使用的网络结构减小了属性识别对行人重识别的干扰, 并以自适应的方式利用属性特征, 最终有效提高了行人的检索结果. $L_{{\rm{id}}}\,({\rm{no}} \ {\rm{LS}})$是在基准模型中没有对身份标签采用LS平滑操作的结果, 相比基准模型, mAP和Rank-1值分别降低3.7%和0.8%, 可见LS操作有效提升了模型的性能.

    表 2  使用不同损失函数的性能比较(%)
    Table 2  Performance comparison using different loss functions (%)
    损失函数 mAP Rank-1
    $L_{{\rm{id}}}$ 70.5 84.1
    $L_{{\rm{id}}}+\beta L_{{\rm{att}}}$ 71.1 85.8
    $L_{{\rm{id}}}+\alpha L_{{\rm{local}}}+\beta L_{{\rm{att}}}$ 74.2 87.1
    ${L_{ {\rm{id} } }+\alpha L_{ {\rm{local} } }+\beta L^{*}_{ {\rm{att} } } }$ 73.0 86.0
    $L_{ {\rm{id} } }\,({\rm{no} } \ {\rm{LS} })$ 66.8 83.3
    下载: 导出CSV 
    | 显示表格

    表3是对属性特征使用不同融合方式的性能比较. 将所有属性的特征相加后, 直接引入到第一支网络中与全局特征相连, 对特征$\hat{\boldsymbol g} = [{\boldsymbol g}; \sum\nolimits_{k = 1}^{M} {\boldsymbol h}^{k}]$进行身份分类, 而不进行额外的监督, 该方法记为var1. 在var1的基础上, 对所有属性特征以自适应加权求和的方式进行融合, 而不是直接相加, 即$\hat{\boldsymbol g} = [{\boldsymbol g}; {\boldsymbol h}_{w}] = [{\boldsymbol g}; \sum\nolimits_{k = 1}^{M} w_{k} {\boldsymbol h}^{k}]$, 该方法记为var2. 第3种方法与本文方法类似, 区别是生成权重的方式不同, 从全局的角度生成对应于每个属性的权重, 记为var3, 具体如下: 将第一支网络中的全局特征$ {\boldsymbol z} \in {\bf R}^{d} $作为输入, 使用全连接层和Sigmoid激活函数输出权重$ {\boldsymbol w} $. 由表3可知, var2相比var1, mAP和Rank-1值分别提高0.9%和1.1%, 可见自适应地对每个属性赋予不同的权重是有作用的, 对于每张图片, 网络可以自动调整各个属性的重要性. 我们的结果相比于var2, mAP和Rank-1值分别提高1.7%和1.4%, 说明对融合后的属性特征进行额外的身份分类任务可以进一步提升性能, 主要有两个原因: 1)可以对属性特征和属性权重有更强的监督信息; 2)由于没有加入到第一支网络中, 从而不会干扰全局特征的学习. 我们的方法相比于var3, mAP和Rank-1值分别提高0.1%和0.8%, 说明从属性的角度生成权重, 这种类似于自注意力机制的方法可以得到更好的结果. 另外从直觉上讲, 将属性的特征作为输入, 输出对应于每个属性的权重, 这种方式也更加合理.

    表 3  使用不同特征融合方式的性能比较(%)
    Table 3  Performance comparison using different feature fusion methods (%)
    方法 特征维度 mAP Rank-1
    var1 1024 71.6 84.6
    var2 1024 72.5 85.7
    var3 1024 74.1 86.3
    本文 1024 74.2 87.1
    特征${\boldsymbol g}$ 512 72.4 86.1
    特征${\boldsymbol h}_{w}$ 512 71.8 85.1
    下载: 导出CSV 
    | 显示表格

    表3的最后两行表示在训练完最终模型后, 分别使用全局特征$ {\boldsymbol g} $和属性融合特征$ {\boldsymbol h}_{w} $进行检索的结果. 当只使用$ {\boldsymbol g} $测试时, mAP值为72.4%, Rank-1值为86.1%, 只使用$ {\boldsymbol h}_{w} $测试时, mAP和Rank-1值分别为71.8%和85.1%, 两者均超过了基准模型的结果. 而将$ {\boldsymbol g} $$ {\boldsymbol h}_{w} $相连后测试时, mAP和Rank-1分别达到了74.2%和87.1%, 可见全局特征和属性特征相互补充, 可以对行人进行更全面的描述.

    图2是在DukeMTMC-reID上分别设置不同的$ \alpha $$ \beta $得到的结果, 图2(a)$ \beta = 0.2 $, 图2(b)$ \alpha = 0.5 $. 由图2(a)可知, 对属性融合特征进行过多或者过少的监督, 效果都有所降低, 当$ \alpha $为0.5时, 可以得到最好的结果. 由图2(b)可知, 当$ \beta $取值比较小时, 结果有所提高, 同时为了不影响属性识别的准确率, 将$ \beta $取为0.2. 在所有实验中, 对$ \alpha $$ \beta $均进行如上设置.

    图 2  设置不同的$\alpha$$\beta$的结果
    Fig. 2  Results setting different $\alpha$ and $\beta$

    图3是模型训练完成之后, 使用Grad-CAM (Gradient-weighted class activation mapping)[31]得到的各个属性的可视化结果, 10个属性依次为gender, hat, boots, length of upper-body clothing, backpack, handbag, bag, color of shoes, color of upper-body clothing, color of lower-body clothing. 可视化结果下方的数字表示网络生成的对应于该属性的权重. 上方是DukeMTMC-reID检索库中的一张图片, 下方的图片是由属性融合特征$ {\boldsymbol h}_{w} $检索出的第1张图片, 匹配正确, 即这两张图片属于同一个行人.

    图 3  各个属性的可视化结果及对应的权重值
    Fig. 3  Visualization result and corresponding weight value of each attribute

    由可视化结果可以看出, 每个属性的激活区域基本都是落在行人区域内, 可见利用属性的特征可以减少背景的干扰. 此外, 帽子、靴子、鞋子颜色、上衣颜色、下衣颜色等属性的激活范围基本符合对应的属性区域. 由生成的权重值可知, 对于这两张图片, 帽子、靴子、背包等属性的重要性很大. 这两张图片由于姿态、光线等差异, 在外观上并不相似, 但网络通过自适应地融合属性特征, 关注头部、脚部、书包等区域, 最终可以正确检索出来.

    图4是使用不同特征检索到的图片, 其中匹配错误的样本用粗线条的框表示. 对于每个行人, 后面三行分别是使用全局特征$ {\boldsymbol g} $、属性融合特征$ {\boldsymbol h}_{w} $和总的特征$ {\boldsymbol e} $得到的检索结果. 由第1个行人的结果可知, 全局特征只关注上衣和裤子, 找出的10张图片中只有5张匹配正确, 而融合特征包含对于这个行人很重要的书包信息, 检索出了10张正确的图片. 对于第2个行人, 融合特征通过帽子这个属性, 正确找出了被遮挡的图片. 相比于关注整体外观的全局特征, 融合后的属性特征包含很多细节信息, 这对于区分外观相似的行人是很重要的. 对于第3个行人, 全局特征检索出的多为行人的背面图片, 而融合特征检索出许多侧面图片, 这两个结果中均有错误, 但当这两个特征相连后, 可以找出10张正确的包含各个视角的图片, 说明全局特征和属性特征包含不相同的信息, 可以互相补充促进最后的检索结果.

    图 4  使用不同特征检索到的图片
    Fig. 4  Images retrieved by different features

    表4表5分别表示DukeMTMC-reID和Market-1501上各个属性的识别准确率, Avg指所有属性的平均准确率, B2表示只训练属性识别的单支网络. 由表中结果可知, 属性识别和行人重识别的多任务网络促进了属性识别的过程, 本文方法相比于B2, 平均准确率分别提高了0.32%和0.59%. 此外, 与APR、AANet-50的结果比较也体现了本文方法的竞争力.

    表 4  DukeMTMC-reID上属性识别的准确率(%)
    Table 4  Accuracy of attribute recognition on DukeMTMC-reID (%)
    方法 gender hat boots l.up b.pack h.bag bag c.shoes c.up c.low 平均值
    APR[22] 84.2 87.6 87.5 88.4 75.8 93.4 82.9 89.7 74.2 69.9 83.4
    B2 85.94 89.75 89.92 88.64 84.35 93.61 83.06 90.70 74.62 66.81 84.74
    本文 86.07 90.74 89.72 88.78 84.47 93.28 82.04 91.79 75.53 68.14 85.06
    下载: 导出CSV 
    | 显示表格
    表 5  Market-1501上属性识别的准确率(%)
    Table 5  Accuracy of attribute recognition on Market-1501 (%)
    方法 gender age hair l.slv l.low s.clth b.pack h.bag bag hat c.up c.low 平均值
    APR[22] 88.9 88.6 84.4 93.6 93.7 92.8 84.9 90.4 76.4 97.1 74.0 73.8 86.6
    AANet-50[25] 92.31 88.21 86.58 94.45 94.24 94.83 87.77 89.61 79.72 98.01 77.08 70.81 87.80
    B2 93.05 85.82 88.97 93.56 94.18 94.53 88.80 88.08 79.24 98.28 74.95 68.64 87.34
    本文 93.69 86.16 89.00 94.11 94.80 94.81 89.33 88.68 79.03 98.33 76.52 70.68 87.93
    下载: 导出CSV 
    | 显示表格

    针对行人外观存在类内差异大、类间差异小的问题, 本文提出了一种融合属性特征的行人重识别的深度网络方法. 实验结果表明, 该方法能够通过加入的属性信息丰富行人的特征描述, 提升识别性能. 后续工作将考虑属性之间的依赖关系, 进一步研究如何在行人重识别任务中更好地利用属性标签, 实现行人共有属性的特征匹配.

  • 图  1  拓扑图

    Fig.  1  Topological graph

    图  2  各智能体在控制策略(10)下的状态轨迹

    Fig.  2  Trajectories of agents under controller (10)

    图  3  各智能体在控制策略(10)下的速度状态

    Fig.  3  Velocities of agents under controller (10)

    图  4  追踪虚拟速度的误差

    Fig.  4  Tracking the error of virtual speed

    图  5  智能体1在触发条件(17)下的测量误差及阈值变化趋势

    Fig.  5  The evolution of the error norm and the threshold of agent 1 with trigger function (17)

    图  6  智能体1在触发条件(25)下的测量误差及阈值变化趋势

    Fig.  6  The evolution of the error norm and the threshold of agent 1 with trigger function (25)

    图  7  各智能体在控制策略(10)下的触发间隔及在时间触发控制策略下的触发间隔

    Fig.  7  The triggered interval of each agent undercontrol scheme (10) and the trigger interval underthe time trigger control strategy

    图  8  各智能体的状态误差

    Fig.  8  State errors of agents

    图  9  拓扑图

    Fig.  9  Topological graph

    图  10  各智能体在控制策略(10)下的状态轨迹

    Fig.  10  Trajectories of agents under controller (10)

    图  11  各智能体在控制策略(10)下的速度状态

    Fig.  11  Velocities of agents under controller (10)

    图  12  追踪虚拟速度的误差

    Fig.  12  Tracking the error of virtual speed

  • [1] Thunberg J, Goncalves J, Hu X. Consensus and formation control on SE(3) for switching topologies[J]. Automatica, 2016, 66(5): 63-82.
    [2] Xiao F, Wang L, Chen J, Gao Y P. Finite-time formation control for multi-agent systems[J]. Automatica, 2009, 45(11): 2605-2611. doi: 10.1016/j.automatica.2009.07.012
    [3] Martin S. Multi-agent flocking under topological interactions[J]. Systems & Control Letters, 2014, 69(1): 53-61.
    [4] 陈世明, 化俞新, 祝振敏, 赖强. 邻域交互结构优化的多智能体快速蜂拥控制算法[J]. 自动化学报, 2015, 41(12): 2092-2099.

    CHEN Shi-Ming, HUA Yu-Xin, ZHU Zhen-Min, LAI Qiang. Fast flocking algorithm for multi-agent systems by opti-mizing local interactive topology[J]. Acta Automatica Sinica, 2015, 41(12): 2092-2099.
    [5] Huang N, Duan Z, Zhao Y. Consensus of multi-agent systems via delayed and intermittent communications[J]. IET Control Theory and Applications, 2015, 9(1): 62-73. doi: 10.1049/iet-cta.2014.0729
    [6] Zhao M, Peng C, He W L, Song Y. Event-triggered communication for leader-following consensus of second-order multiagent systems[J]. IEEE Transactions on Cybernetics, 2018, 48(6): 1888-1897. doi: 10.1109/TCYB.2017.2716970
    [7] Li J P, Yang Y N, Hua C C, Guan X P. Fixed-time backstepping control design for high-order strict-feedback non-linear systems via terminal sliding mode[J]. IET Control Theory and Applications, 2017, 11(8): 1184-1193. doi: 10.1049/iet-cta.2016.1143
    [8] Wang H H, Chen B, Lin C, Sun Y M, Wang F. Adaptive flnite-time control for a class of uncertain high-order nonlinear systems based on fuzzy approximation[J]. IET Control Theory and Applications, 2017, 11(5): 677-684. doi: 10.1049/iet-cta.2016.0947
    [9] Paulo T. Event-triggered real-time scheduling of stabilizing control tasks[J]. IEEE Transactions on Automatic Control, 2007, 52(9): 2680-1685.
    [10] Dimos V D, Emilio F, Karl H J. Distributed event-triggered control for multi-agent systems[J]. IEEE Transactions on Automatic Control, 2012, 57(5): 1291-1297. doi: 10.1109/TAC.2011.2174666
    [11] Hu A H, Cao J, Hu M F, Guo L X. Event-triggered consensus of multi-agent systems with noises[J]. Journal of the Franklin Institute, 2015, 352(9): 3489-3503. doi: 10.1016/j.jfranklin.2014.08.005
    [12] Fan Y, Feng G, Wang Y, Song C. Distributed eventtriggered control of multi-agent systems with combinational measurements[J]. Automatica, 2013, 49(2): 671-675. doi: 10.1016/j.automatica.2012.11.010
    [13] Hu A H, Cao J. Consensus of multi-agent systems via intermittent event-triggered control[J]. International Journal of Systems Science, 2017, 48(2): 280-287. doi: 10.1080/00207721.2016.1179817
    [14] Zhu Y K, Guan X P, Luo X Y, Li S B. Finite-time consensus of multi-agent system via nonlinear event-triggered control strategy[J]. IET Control Theory and Applications, 2015, 9(17): 2548-2552. doi: 10.1049/iet-cta.2014.0533
    [15] Yu S H, Wang Y L, Jin L N. Comments on ’Finite-time consensus of multi-agent system via non-linear event-triggered control strategy’[J]. IET Control Theory and Applications, 2017, 11(10): 1658-1661. doi: 10.1049/iet-cta.2016.0955
    [16] Dong Y, Xian J G. Finite-time event-triggered consensus for non-linear multi-agent networks under directed network topology[J]. IET Control Theory and Applications, 2017, 11(15): 2458-2464. doi: 10.1049/iet-cta.2017.0085
    [17] Liu J, Yu Y, Sun J, Sun C Y. Distributed event-triggered fixed-time consensus for leader-follower multiagent systems with nonlinear dynamics and uncertain disturbances[J]. International Journal of Robust and Nonlinear Control, 2018, 28(11): 3543-3559 doi: 10.1002/rnc.4098
    [18] Roy S. Scaled consensus[J]. Automatica, 2015, 51 : 259-262. doi: 10.1016/j.automatica.2014.10.073
    [19] Meng D, Jia Y. Scaled consensus problems on switching networks[J]. IEEE Transactions on Automatic Control, 2016, 61(6): 1664-1669. doi: 10.1109/TAC.2015.2479119
    [20] Yu J, Shi Y. Scaled group consensus in multiagent systems with flrst/second-order continuous dynamics[J]. IEEE Transactions on Cybernetics, 2018, 48(8): 2259-2271. doi: 10.1109/TCYB.2017.2731601
    [21] Meng D, Jia Y. Robust consensus algorithms for multiscale coordination control of multi-vehicle systems with disturbances[J]. IEEE Transactions on Industrial Electronics, 2016, 63(2): 1107-1119. doi: 10.1109/TIE.2015.2478740
    [22] Olfatisaber R, Murray R M. Consensus problems in networks of agents with switching topology and timedelays[J]. IEEE Transactions on Automatic Control 2004, 49(9): 1520-1533. doi: 10.1109/TAC.2004.834113
    [23] Ning B, Jin J, Zheng J C, Man Z H. Finite-time and fixed-time leader-following consensus for multi-agent systems with discontinuous inherent dynamics[J]. International Journal of Control, 2017, 91(6): 1259-1270.
    [24] Zuo Z, Lin T. A new class of flnite-time nonlinear consensus protocols for multi-agent systems[J]. International Journal of Control, 2014, 87(2): 363-370. doi: 10.1080/00207179.2013.834484
    [25] Wei X Y, Yu W W, Wang H, Yao Y Y, Mei F. An observer based fixed-time consensus control for second-order multi-agent systems with disturbances[J]. IEEE Transactions on Circuits and Systems Ⅱ Express Briefs, 2019, 66(2): 247-251. doi: 10.1109/TCSII.2018.2831922
  • 期刊类型引用(14)

    1. 杨自钦,夏长清,刘玉奇,金曦,许驰. 通信时延约束下的多智能体系统动态事件触发编队方法. 控制工程. 2025(01): 126-134 . 百度学术
    2. 陈世明,叶舒康,马旭阳,邹钰彬,刘江. 基于事件触发的不确定多智能体系统自适应一致性. 控制理论与应用. 2025(01): 33-40 . 百度学术
    3. 邓甲 ,王付永 ,刘忠信 ,陈增强 . 动态事件触发机制下二阶多智能体系统完全分布式控制. 控制理论与应用. 2024(01): 11-20 . 百度学术
    4. 高林庆,王超,哈登喆,耿华,侯帅. 领导-跟随混合阶异质多智能体系统的一致性. 河北大学学报(自然科学版). 2024(01): 104-112 . 百度学术
    5. 赵华荣,彭力,吴治海,谢林柏,于洪年. 随机时延下多输入多输出多智能体系统事件触发双向编队. 控制与决策. 2024(04): 1251-1259 . 百度学术
    6. 郭宏达,娄静涛,徐友春,叶鹏,李永乐,陈晋生. 基于MADDPG的多无人车协同事件触发通信. 系统工程与电子技术. 2024(07): 2525-2533 . 百度学术
    7. 宁君,彭周华,李铁山,陈俊龙. 带有输入量化的分布式多无人船舶自适应模糊编队控制. 控制与决策. 2024(08): 2588-2596 . 百度学术
    8. 石井龙,刘志杰,郭皓晨,刘剑. 动态事件触发下的一阶非线性多智能体系统设定时间一致性. 工程科学学报. 2024(09): 1604-1612 . 百度学术
    9. 邓甲,王付永,刘忠信,陈增强. 基于自适应动态时钟通信的二阶多智能体系统完全分布式一致性. 中国科学:信息科学. 2023(01): 97-110 . 百度学术
    10. 李猛,付兴建. 事件触发的时滞二阶多UAV系统一致性控制. 火力与指挥控制. 2023(05): 25-32 . 百度学术
    11. 孙梦薇,任璐,刘剑,孙长银. 切换拓扑下动态事件触发多智能体系统固定时间一致性. 自动化学报. 2023(06): 1295-1305 . 本站查看
    12. 刘青松,习晓苗,柴利. 具有类万有引力的有界置信观点动力学分析与应用. 自动化学报. 2023(09): 1967-1975 . 本站查看
    13. 张云清,冯江涛,范晓宇,谢云飞. 随机多智能体系统的多率协同控制. 计算机测量与控制. 2023(11): 151-158 . 百度学术
    14. 陈侠,周琦轩. 延时和切换拓扑下多智能体系统动态事件触发一致性. 火力与指挥控制. 2022(01): 43-49 . 百度学术

    其他类型引用(32)

  • 加载中
图(12)
计量
  • 文章访问数:  1025
  • HTML全文浏览量:  256
  • PDF下载量:  340
  • 被引次数: 46
出版历程
  • 收稿日期:  2019-03-04
  • 录用日期:  2019-08-15
  • 网络出版日期:  2022-01-14
  • 刊出日期:  2022-01-25

目录

/

返回文章
返回