当期目录
2025年 第51卷 第1期
2025, 51(1): 1-19.
doi: 10.16383/j.aas.c240542
cstr: 32138.14.j.aas.c240542
摘要:
得益于近期具有世界知识的大规模预训练模型的迅速发展, 基于大模型的具身智能在各类任务中取得了良好的效果, 展现出强大的泛化能力与在各领域内广阔的应用前景. 鉴于此, 对基于大模型的具身智能的工作进行了综述, 首先, 介绍大模型在具身智能系统中起到的感知与理解作用; 其次, 对大模型在具身智能中参与的需求级、任务级、规划级和动作级的控制进行了较为全面的总结; 然后, 对不同具身智能系统架构进行介绍, 并总结了目前具身智能模型的数据来源, 包括模拟器、模仿学习以及视频学习; 最后, 对基于大语言模型(Large language model, LLM)的具身智能系统面临的挑战与发展方向进行讨论与总结.
得益于近期具有世界知识的大规模预训练模型的迅速发展, 基于大模型的具身智能在各类任务中取得了良好的效果, 展现出强大的泛化能力与在各领域内广阔的应用前景. 鉴于此, 对基于大模型的具身智能的工作进行了综述, 首先, 介绍大模型在具身智能系统中起到的感知与理解作用; 其次, 对大模型在具身智能中参与的需求级、任务级、规划级和动作级的控制进行了较为全面的总结; 然后, 对不同具身智能系统架构进行介绍, 并总结了目前具身智能模型的数据来源, 包括模拟器、模仿学习以及视频学习; 最后, 对基于大语言模型(Large language model, LLM)的具身智能系统面临的挑战与发展方向进行讨论与总结.
2025, 51(1): 20-42.
doi: 10.16383/j.aas.c230809
cstr: 32138.14.j.aas.c230809
摘要:
电力设施巡检对于加快电网基础设施智能化改造和智能微电网建设, 提高电力系统互补互济和智能调节能力的需求具有重要作用. 近年来, 智能巡检机器人开始在电力巡检中广泛应用, 在提高电力设施巡检效率和准确性、提升安全性、降低成本和促进电力智能化发展等方面发挥关键作用. 本文从电力巡检机器人的智能感知和导航技术出发, 重点介绍目标检测、语义分割、自主导航等共性关键技术的国内外发展现状. 然后以可见光红外双光融合、可见光图像和点云数据融合、声纹和可见光融合为例, 阐述电力场景多模态数据融合方式. 并进一步介绍电力部件精准分割和异物检测、线路点云杆塔倾斜检测、输电线路覆冰多模态检测和电力架空线路缺陷分析及台账异常检测等电力设施多模态机器人相关案例. 最后探讨电力设施多模态精细化机器人巡检关键技术的发展趋势和所面临的挑战.
电力设施巡检对于加快电网基础设施智能化改造和智能微电网建设, 提高电力系统互补互济和智能调节能力的需求具有重要作用. 近年来, 智能巡检机器人开始在电力巡检中广泛应用, 在提高电力设施巡检效率和准确性、提升安全性、降低成本和促进电力智能化发展等方面发挥关键作用. 本文从电力巡检机器人的智能感知和导航技术出发, 重点介绍目标检测、语义分割、自主导航等共性关键技术的国内外发展现状. 然后以可见光红外双光融合、可见光图像和点云数据融合、声纹和可见光融合为例, 阐述电力场景多模态数据融合方式. 并进一步介绍电力部件精准分割和异物检测、线路点云杆塔倾斜检测、输电线路覆冰多模态检测和电力架空线路缺陷分析及台账异常检测等电力设施多模态机器人相关案例. 最后探讨电力设施多模态精细化机器人巡检关键技术的发展趋势和所面临的挑战.
2025, 51(1): 43-71.
doi: 10.16383/j.aas.c240364
cstr: 32138.14.j.aas.c240364
摘要:
具身智能强调大脑、身体及环境三者的相互作用, 旨在基于机器与物理世界的交互, 创建软硬件结合、可自主学习进化的智能体. 当前, 机器学习、机器人学、认知科学等多学科技术的快速发展极大地推动了具身智能的研究与应用. 已有的具身智能文献更多从技术和方法分类的角度入手, 本文以具身智能在研究和应用过程中面临的关键挑战为角度切入, 分析具身智能研究的一般性框架, 围绕具身感知与执行、具身学习与进化两个方面提出具体的研究思路, 并针对其中涉及的关键问题详细梳理相关技术及研究进展. 此外, 以移动机器人、仿生机器人、平行机器人三方面应用为例, 介绍具身智能在感知与理解、控制与决策、交互与学习等方面给实际机器人系统设计带来的启发. 最后, 对具身智能的发展前景进行展望, 探索虚实融合数据智能、基础模型与基础智能、数字孪生与平行智能在其中的重要作用和应用潜力, 希望为相关领域学者和从业人员提供新的启示和思路. 论文相关项目详见https://github.com/BUCT-IUSRC/Survey__EmbodiedAI .
具身智能强调大脑、身体及环境三者的相互作用, 旨在基于机器与物理世界的交互, 创建软硬件结合、可自主学习进化的智能体. 当前, 机器学习、机器人学、认知科学等多学科技术的快速发展极大地推动了具身智能的研究与应用. 已有的具身智能文献更多从技术和方法分类的角度入手, 本文以具身智能在研究和应用过程中面临的关键挑战为角度切入, 分析具身智能研究的一般性框架, 围绕具身感知与执行、具身学习与进化两个方面提出具体的研究思路, 并针对其中涉及的关键问题详细梳理相关技术及研究进展. 此外, 以移动机器人、仿生机器人、平行机器人三方面应用为例, 介绍具身智能在感知与理解、控制与决策、交互与学习等方面给实际机器人系统设计带来的启发. 最后, 对具身智能的发展前景进行展望, 探索虚实融合数据智能、基础模型与基础智能、数字孪生与平行智能在其中的重要作用和应用潜力, 希望为相关领域学者和从业人员提供新的启示和思路. 论文相关项目详见
2025, 51(1): 72-89.
doi: 10.16383/j.aas.c230789
cstr: 32138.14.j.aas.c230789
摘要:
自1982年著名的Hopfield神经网络问世以来, 神经网络的分岔动力学受到了学术界的广泛关注. 首先, 回顾四类经典神经网络的数学模型和它们在各个领域的应用. 接着, 综述近三十年来关于整数阶神经网络(Integer-order neural networks, IONNs)、分数阶神经网络(Fractional-order neural networks, FONNs)、超数域神经网络(Supernumerary-domain neural networks, SDNNs)以及反应扩散神经网络(Reaction-diffusion neural networks, RDNNs)分岔动力学的相关研究成果. 分析诸多组合因素, 包括节点规模、耦合情形、拓扑结构、系统阶次、复值、四元数、八元数、扩散、时滞、随机性、脉冲、忆阻、激活函数等对神经网络分岔动力学的影响, 并展示神经网络在多个领域的广泛应用. 最后, 对神经网络分岔动力学所面临的挑战以及未来的研究方向进行总结和展望.
自1982年著名的Hopfield神经网络问世以来, 神经网络的分岔动力学受到了学术界的广泛关注. 首先, 回顾四类经典神经网络的数学模型和它们在各个领域的应用. 接着, 综述近三十年来关于整数阶神经网络(Integer-order neural networks, IONNs)、分数阶神经网络(Fractional-order neural networks, FONNs)、超数域神经网络(Supernumerary-domain neural networks, SDNNs)以及反应扩散神经网络(Reaction-diffusion neural networks, RDNNs)分岔动力学的相关研究成果. 分析诸多组合因素, 包括节点规模、耦合情形、拓扑结构、系统阶次、复值、四元数、八元数、扩散、时滞、随机性、脉冲、忆阻、激活函数等对神经网络分岔动力学的影响, 并展示神经网络在多个领域的广泛应用. 最后, 对神经网络分岔动力学所面临的挑战以及未来的研究方向进行总结和展望.
2025, 51(1): 90-103.
doi: 10.16383/j.aas.c240469
cstr: 32138.14.j.aas.c240469
摘要:
连续体机器人通常由柔性材料制成, 能够承受大幅度形变, 在各领域具有广阔的应用前景. 然而, 其软体结构和非传统的驱动机制也带来了诸多非线性因素, 使得其状态和运动难以被精确建模. 因此, 为连续体机器人设计了一种无模型控制方案. 该方案一方面通过变参递归神经网络(Varying parameter-recursive neural network, VP-RNN)求解连续体机器人的逆运动学, 以实现高精度运动控制, 另一方面使用递归最小二乘法(Recursive least square, RLS)基于实时数据估计和更新机器人雅可比矩阵伪逆, 以避免机器人的解析建模. 最后, 通过仿真模拟和实物实验验证了所提出控制方案的可行性、精确性和鲁棒性, 并通过一系列对比实验突出了所提出方法的优势. 该方法率先研究基于递归最小二乘法的连续体机器人雅可比矩阵伪逆估计, 对未来的连续体机器人研究具有一定的启示作用.
连续体机器人通常由柔性材料制成, 能够承受大幅度形变, 在各领域具有广阔的应用前景. 然而, 其软体结构和非传统的驱动机制也带来了诸多非线性因素, 使得其状态和运动难以被精确建模. 因此, 为连续体机器人设计了一种无模型控制方案. 该方案一方面通过变参递归神经网络(Varying parameter-recursive neural network, VP-RNN)求解连续体机器人的逆运动学, 以实现高精度运动控制, 另一方面使用递归最小二乘法(Recursive least square, RLS)基于实时数据估计和更新机器人雅可比矩阵伪逆, 以避免机器人的解析建模. 最后, 通过仿真模拟和实物实验验证了所提出控制方案的可行性、精确性和鲁棒性, 并通过一系列对比实验突出了所提出方法的优势. 该方法率先研究基于递归最小二乘法的连续体机器人雅可比矩阵伪逆估计, 对未来的连续体机器人研究具有一定的启示作用.
2025, 51(1): 104-116.
doi: 10.16383/j.aas.c240099
cstr: 32138.14.j.aas.c240099
摘要:
针对三维空间中多航天器协同捕获机动目标问题, 提出一种具有终端角度约束和时间一致性约束的设定时间协同制导律, 将视线(Line-of-sight, LOS)角误差和齐射攻击的收敛时间作为一个可提前设定的参数, 实现对收敛时间进行设置. 构建三维场景航天器−目标运动学模型, 在沿视线方向将同时攻击问题转化为一致性问题, 提出一种分布式协同制导律, 设定时间内使得多个航天器剩余飞行时间相等; 在垂直视线方向利用滑模控制方法对制导律进行设计, 使得每个航天器的视线角在设定时间内达到期望值. 上述制导律中, 设计了一种设定时间扩展状态观测器(Predefined-time extended state observer, PTESO)对未知的目标加速度进行估计. 数值仿真结果验证了方法的有效性.
针对三维空间中多航天器协同捕获机动目标问题, 提出一种具有终端角度约束和时间一致性约束的设定时间协同制导律, 将视线(Line-of-sight, LOS)角误差和齐射攻击的收敛时间作为一个可提前设定的参数, 实现对收敛时间进行设置. 构建三维场景航天器−目标运动学模型, 在沿视线方向将同时攻击问题转化为一致性问题, 提出一种分布式协同制导律, 设定时间内使得多个航天器剩余飞行时间相等; 在垂直视线方向利用滑模控制方法对制导律进行设计, 使得每个航天器的视线角在设定时间内达到期望值. 上述制导律中, 设计了一种设定时间扩展状态观测器(Predefined-time extended state observer, PTESO)对未知的目标加速度进行估计. 数值仿真结果验证了方法的有效性.
2025, 51(1): 117-132.
doi: 10.16383/j.aas.c240230
cstr: 32138.14.j.aas.c240230
摘要:
为了提升具有高维动作空间的复杂连续控制任务的性能和样本效率, 提出一种基于Transformer的状态−动作−奖赏预测表征学习框架(Transformer-based state-action-reward prediction representation learning framework, TSAR). 具体来说, TSAR提出一种基于Transformer的融合状态−动作−奖赏信息的序列预测任务. 该预测任务采用随机掩码技术对序列数据进行预处理, 通过最大化掩码序列的预测状态特征与实际目标状态特征间的互信息, 同时学习状态与动作表征. 为进一步强化状态和动作表征与强化学习(Reinforcement learning, RL)策略的相关性, TSAR引入动作预测学习和奖赏预测学习作为附加的学习约束以指导状态和动作表征学习. TSAR同时将状态表征和动作表征显式地纳入到强化学习策略的优化中, 显著提高了表征对策略学习的促进作用. 实验结果表明, 在DMControl的9个具有挑战性的困难环境中, TSAR的性能和样本效率超越了现有最先进的方法.
为了提升具有高维动作空间的复杂连续控制任务的性能和样本效率, 提出一种基于Transformer的状态−动作−奖赏预测表征学习框架(Transformer-based state-action-reward prediction representation learning framework, TSAR). 具体来说, TSAR提出一种基于Transformer的融合状态−动作−奖赏信息的序列预测任务. 该预测任务采用随机掩码技术对序列数据进行预处理, 通过最大化掩码序列的预测状态特征与实际目标状态特征间的互信息, 同时学习状态与动作表征. 为进一步强化状态和动作表征与强化学习(Reinforcement learning, RL)策略的相关性, TSAR引入动作预测学习和奖赏预测学习作为附加的学习约束以指导状态和动作表征学习. TSAR同时将状态表征和动作表征显式地纳入到强化学习策略的优化中, 显著提高了表征对策略学习的促进作用. 实验结果表明, 在DMControl的9个具有挑战性的困难环境中, TSAR的性能和样本效率超越了现有最先进的方法.
2025, 51(1): 133-143.
doi: 10.16383/j.aas.c230752
cstr: 32138.14.j.aas.c230752
摘要:
针对一类不确定非线性系统, 提出一种保证系统状态满足预设边界性能函数的新型性能驱动控制(Performance-driven control, PDC)方法. 不同于传统预设性能控制(Prescribed performance control, PPC) 方法中对误差与边界性能函数的比值进行非线性变换的思路, 本文基于保证状态量与上下边界的两个误差量均始终非负这一思想, 引入基于Metzler矩阵的正系统分析理论, 并结合切换控制技术, 以最终保证系统状态始终在预设性能函数之内. 系统的稳定性取决于边界性能函数的选取, 而不改变控制器的形式. 给出针对一类不确定非线性系统的控制设计、稳定性分析和方法讨论, 数值仿真例子验证了所提出方法的有效性.
针对一类不确定非线性系统, 提出一种保证系统状态满足预设边界性能函数的新型性能驱动控制(Performance-driven control, PDC)方法. 不同于传统预设性能控制(Prescribed performance control, PPC) 方法中对误差与边界性能函数的比值进行非线性变换的思路, 本文基于保证状态量与上下边界的两个误差量均始终非负这一思想, 引入基于Metzler矩阵的正系统分析理论, 并结合切换控制技术, 以最终保证系统状态始终在预设性能函数之内. 系统的稳定性取决于边界性能函数的选取, 而不改变控制器的形式. 给出针对一类不确定非线性系统的控制设计、稳定性分析和方法讨论, 数值仿真例子验证了所提出方法的有效性.
2025, 51(1): 144-160.
doi: 10.16383/j.aas.c240050
cstr: 32138.14.j.aas.c240050
摘要:
深度学习是解决时间序列分类(Time series classification, TSC)问题的主要途径之一. 然而, 基于深度学习的TSC模型易受到对抗样本攻击, 从而导致模型分类准确率大幅度降低. 为此, 研究了TSC模型的对抗攻击防御问题, 设计了集成对抗训练(Adversarial training, AT)防御方法. 首先, 设计了一种针对TSC模型的集成对抗训练防御框架, 通过多种TSC模型和攻击方式生成对抗样本, 并用于训练目标模型. 其次, 在生成对抗样本的过程中, 设计了基于Shapelets的局部扰动算法, 并结合动量迭代的快速梯度符号法(Momentum iterative fast gradient sign method, MI-FGSM), 实现了有效的白盒攻击. 同时, 使用知识蒸馏(Knowledge distillation, KD)和基于沃瑟斯坦距离的生成对抗网络(Wasserstein generative adversarial network, WGAN)设计了针对替代模型的黑盒对抗攻击方法, 实现了攻击者对目标模型未知时的有效攻击. 在此基础上, 在对抗训练损失函数中添加Kullback-Leibler (KL)散度约束, 进一步提升了模型鲁棒性. 最后, 在多变量时间序列分类数据集UEA上验证了所提方法的有效性.
深度学习是解决时间序列分类(Time series classification, TSC)问题的主要途径之一. 然而, 基于深度学习的TSC模型易受到对抗样本攻击, 从而导致模型分类准确率大幅度降低. 为此, 研究了TSC模型的对抗攻击防御问题, 设计了集成对抗训练(Adversarial training, AT)防御方法. 首先, 设计了一种针对TSC模型的集成对抗训练防御框架, 通过多种TSC模型和攻击方式生成对抗样本, 并用于训练目标模型. 其次, 在生成对抗样本的过程中, 设计了基于Shapelets的局部扰动算法, 并结合动量迭代的快速梯度符号法(Momentum iterative fast gradient sign method, MI-FGSM), 实现了有效的白盒攻击. 同时, 使用知识蒸馏(Knowledge distillation, KD)和基于沃瑟斯坦距离的生成对抗网络(Wasserstein generative adversarial network, WGAN)设计了针对替代模型的黑盒对抗攻击方法, 实现了攻击者对目标模型未知时的有效攻击. 在此基础上, 在对抗训练损失函数中添加Kullback-Leibler (KL)散度约束, 进一步提升了模型鲁棒性. 最后, 在多变量时间序列分类数据集UEA上验证了所提方法的有效性.
2025, 51(1): 161-173.
doi: 10.16383/j.aas.c240151
cstr: 32138.14.j.aas.c240151
摘要:
针对工业过程中故障发生源与故障信息在传播过程中的差异性问题, 提出了一种基于不同故障传播路径差异化(Fault propagation path-aware network, FPPAN)的故障诊断方法. 该方法分别从故障源邻域信息关系和故障信息传播两个角度出发, 设计了基于k近邻筛选(k-nearest-neighbor, k-NN) 和基于剪枝的k跳可达路径选择 (Pruning-based k-hop reachable path selection, k-PHop) 的两种故障源图的构建方式, 构建“故障源图”. 从故障在变量间的差异化表现着手, 将基于特征的分类问题转换为基于结构关系的图匹配问题, 利用该结构化信息优化过程特征, 提升模型故障诊断性能. 最后, 通过田纳西−伊斯曼 (Tennessee-Eastman, TE)过程和某海底盾构掘进施工过程进行仿真验证, 实验结果证明了所提方法的有效性.
针对工业过程中故障发生源与故障信息在传播过程中的差异性问题, 提出了一种基于不同故障传播路径差异化(Fault propagation path-aware network, FPPAN)的故障诊断方法. 该方法分别从故障源邻域信息关系和故障信息传播两个角度出发, 设计了基于k近邻筛选(k-nearest-neighbor, k-NN) 和基于剪枝的k跳可达路径选择 (Pruning-based k-hop reachable path selection, k-PHop) 的两种故障源图的构建方式, 构建“故障源图”. 从故障在变量间的差异化表现着手, 将基于特征的分类问题转换为基于结构关系的图匹配问题, 利用该结构化信息优化过程特征, 提升模型故障诊断性能. 最后, 通过田纳西−伊斯曼 (Tennessee-Eastman, TE)过程和某海底盾构掘进施工过程进行仿真验证, 实验结果证明了所提方法的有效性.
2025, 51(1): 174-185.
doi: 10.16383/j.aas.c240115
cstr: 32138.14.j.aas.c240115
摘要:
针对可能由不确定干扰和网络攻击引起的通信链路故障的航天器编队控制系统, 提出一种基于零和微分博弈的最优容错控制方法. 该方法通过构建描述编队协同控制的性能函数, 将通信链路故障容错控制问题等效转换为零和微分博弈模型. 采用Hamilton-Jacobi-Isaacs (HJI)方程和极小极大原则设计博弈中的优化解, 并利用自适应动态规划算法对其进行在线逼近, 以获得编队的最优容错控制策略, 保证航天器通信链路故障下的在轨稳定性和最优性能. 仿真结果表明了本文设计的分布式最优容错控制律的有效性.
针对可能由不确定干扰和网络攻击引起的通信链路故障的航天器编队控制系统, 提出一种基于零和微分博弈的最优容错控制方法. 该方法通过构建描述编队协同控制的性能函数, 将通信链路故障容错控制问题等效转换为零和微分博弈模型. 采用Hamilton-Jacobi-Isaacs (HJI)方程和极小极大原则设计博弈中的优化解, 并利用自适应动态规划算法对其进行在线逼近, 以获得编队的最优容错控制策略, 保证航天器通信链路故障下的在轨稳定性和最优性能. 仿真结果表明了本文设计的分布式最优容错控制律的有效性.
2025, 51(1): 186-196.
doi: 10.16383/j.aas.c240223
cstr: 32138.14.j.aas.c240223
摘要:
针对介电弹性体驱动器(Dielectric elastomer actuator, DEA)建模与控制的挑战性问题, 提出基于神经网络常微分方程(Ordinary differential equation, ODE)和非线性模型预测控制(Model predictive control, MPC)的DEA动力学建模与跟踪控制方法. 首先, 基于神经网络ODE建立DEA的动力学模型以描述其复杂的动态行为. 然后, 基于所建立的DEA动力学模型, 设计非线性模型预测控制器实现其跟踪控制目标. 最后, 在所搭建的实验平台上进行一系列跟踪控制实验. 在所有实验结果中, DEA的运动均能很好地跟踪目标轨迹, 且相对均方根误差均不超过3.30%, 说明了所提动力学建模与跟踪控制方法的有效性.
针对介电弹性体驱动器(Dielectric elastomer actuator, DEA)建模与控制的挑战性问题, 提出基于神经网络常微分方程(Ordinary differential equation, ODE)和非线性模型预测控制(Model predictive control, MPC)的DEA动力学建模与跟踪控制方法. 首先, 基于神经网络ODE建立DEA的动力学模型以描述其复杂的动态行为. 然后, 基于所建立的DEA动力学模型, 设计非线性模型预测控制器实现其跟踪控制目标. 最后, 在所搭建的实验平台上进行一系列跟踪控制实验. 在所有实验结果中, DEA的运动均能很好地跟踪目标轨迹, 且相对均方根误差均不超过3.30%, 说明了所提动力学建模与跟踪控制方法的有效性.
2025, 51(1): 197-209.
doi: 10.16383/j.aas.c240309
cstr: 32138.14.j.aas.c240309
摘要:
针对离散时间非线性系统, 提出一种基于多李雅普诺夫(Lyapunov)函数的控制器设计方法. 该方法不仅能够保证闭环系统稳定性, 还能够扩大闭环吸引域(Domain of attraction, DOA). 首先, 给出基于多Lyapunov函数下系统渐近稳定的充分条件. 结果表明, 由多个Lyapunov函数的负定不变集构成的并集是一个稳定的控制集合, 其从控制空间到状态空间的投影是闭环DOA的估计. 随后, 使用区间分析算法求解集合的内近似估计, 基于此算法可以求解多Lyapunov函数的负定不变集的近似值和闭环DOA的估计值, 并给出相应控制器的设计方法. 最后, 通过仿真算例验证了本文方法的有效性.
针对离散时间非线性系统, 提出一种基于多李雅普诺夫(Lyapunov)函数的控制器设计方法. 该方法不仅能够保证闭环系统稳定性, 还能够扩大闭环吸引域(Domain of attraction, DOA). 首先, 给出基于多Lyapunov函数下系统渐近稳定的充分条件. 结果表明, 由多个Lyapunov函数的负定不变集构成的并集是一个稳定的控制集合, 其从控制空间到状态空间的投影是闭环DOA的估计. 随后, 使用区间分析算法求解集合的内近似估计, 基于此算法可以求解多Lyapunov函数的负定不变集的近似值和闭环DOA的估计值, 并给出相应控制器的设计方法. 最后, 通过仿真算例验证了本文方法的有效性.
2025, 51(1): 210-220.
doi: 10.16383/j.aas.c240404
cstr: 32138.14.j.aas.c240404
摘要:
研究一类考虑节点隐私保护的分布式优化问题, 目标为保护各智能体的隐私信息不被泄露, 并最小化所有智能体局部成本函数之和. 首先, 针对无向连通图, 提出一种基于椭圆曲线密码机制的分布式凸优化算法. 通过设计底层权重矩阵, 将基于椭圆曲线的ELGamal同态加密和数字签名与分布式次梯度算法相结合, 克服了椭圆曲线密码机制与分布式一致性策略无法结合的难点. 在无第三方或聚合器的场景下, 该算法实现了系统的隐私保护. 理论分析表明, 该算法能够渐近收敛至全局最优解, 并适用于时变通信拓扑的动态环境. 此外, 算法能有效保护智能体的状态和成本函数不受来自诚实但好奇攻击者、外部窃听者和篡改攻击者的威胁. 最后, 通过数值仿真验证了算法的有效性.
研究一类考虑节点隐私保护的分布式优化问题, 目标为保护各智能体的隐私信息不被泄露, 并最小化所有智能体局部成本函数之和. 首先, 针对无向连通图, 提出一种基于椭圆曲线密码机制的分布式凸优化算法. 通过设计底层权重矩阵, 将基于椭圆曲线的ELGamal同态加密和数字签名与分布式次梯度算法相结合, 克服了椭圆曲线密码机制与分布式一致性策略无法结合的难点. 在无第三方或聚合器的场景下, 该算法实现了系统的隐私保护. 理论分析表明, 该算法能够渐近收敛至全局最优解, 并适用于时变通信拓扑的动态环境. 此外, 算法能有效保护智能体的状态和成本函数不受来自诚实但好奇攻击者、外部窃听者和篡改攻击者的威胁. 最后, 通过数值仿真验证了算法的有效性.
2025, 51(1): 221-232.
doi: 10.16383/j.aas.c240089
cstr: 32138.14.j.aas.c240089
摘要:
多智能体网络(Multi-agent network, MAN)协同执行任务时需要个体之间频繁交换并共享信息, 这对网络安全带来了巨大风险. 考虑网络中节点状态隐私保护问题, 提出一种基于隐写术的分布式一致性控制策略. 首先, 建立网络窃听者攻击模型, 提出面向隐私保护的分布式平均一致性控制算法. 理论分析表明, 所提算法不仅有效保护节点初始状态的隐私, 而且可以通过隐写载体信息主动诱导窃听者推测得出错误结论. 其次, 通过引入概率指标, 提出一种用于量化MAN隐私泄露指标的模型, 实现了对网络隐私泄露程度的准确描述. 并基于该模型, 从窃听者视角, 通过权衡对网络隐私泄露的影响与付出代价成本建立一个优化问题, 据此寻找最优效益攻击策略. 最后, 通过数值仿真分析, 对比现有算法验证了所提方法的有效性和优越性.
多智能体网络(Multi-agent network, MAN)协同执行任务时需要个体之间频繁交换并共享信息, 这对网络安全带来了巨大风险. 考虑网络中节点状态隐私保护问题, 提出一种基于隐写术的分布式一致性控制策略. 首先, 建立网络窃听者攻击模型, 提出面向隐私保护的分布式平均一致性控制算法. 理论分析表明, 所提算法不仅有效保护节点初始状态的隐私, 而且可以通过隐写载体信息主动诱导窃听者推测得出错误结论. 其次, 通过引入概率指标, 提出一种用于量化MAN隐私泄露指标的模型, 实现了对网络隐私泄露程度的准确描述. 并基于该模型, 从窃听者视角, 通过权衡对网络隐私泄露的影响与付出代价成本建立一个优化问题, 据此寻找最优效益攻击策略. 最后, 通过数值仿真分析, 对比现有算法验证了所提方法的有效性和优越性.