2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

优先发表

优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
基于红外与可见光视觉的高炉铁口铁水温度场在线检测
潘冬, 许川, 龚芃旭, 蒋朝辉, 桂卫华
, doi: 10.16383/j.aas.c240378 , cstr: 32138.14.j.aas.c240378
摘要:
高炉铁口铁水温度场 (Molten iron temperature field, MITF) 是表征铁水质量、判断炉温状况的重要信息. 然而高炉出铁场动态粉尘的干扰使得铁水温度场的在线准确获取充满挑战. 为此, 首次提出基于红外与可见光视觉的高炉铁口铁水温度场检测方法, 利用可见光图像为红外视觉测温提供先验粉尘干扰情况. 首先, 设计红外与可见光视觉协同的测温系统, 同步获取高炉出铁口铁水流的红外图像和可见光图像, 铁水流红外图像表征铁水原始温度场信息, 可见光图像为量化粉尘透射率提供数据基础. 其次, 构建基于色彩一致性的可见光图像中粉尘透射率估计模型和基于雾线先验的红外图像中粉尘透射率估计模型, 得到红外波段下粉尘透射率. 最后, 结合红外辐射测温原理, 构建基于粉尘透射率的红外测温近似补偿模型, 实现铁水温度场的针对性补偿, 获取误差较小的铁水温度. 工业实验表明, 相比于仅利用红外视觉测量铁水温度场, 所提方法能够显著降低粉尘造成的测温误差, 为高炉调控提供连续可靠的铁水温度数据.
基于自然梯度的非线性变分贝叶斯滤波算法
胡玉梅, 潘泉, 邓豹, 郭振, 陈立峰
, doi: 10.16383/j.aas.c230359 , cstr: 32138.14.j.aas.c230359
摘要:
在统计流形空间中, 从信息几何角度考虑非线性状态后验分布近似的实质是后验分布与相应参数化变分分布之间的Kullback-Leibler散度最小化问题, 同时也可以转化为变分置信下界的最大化问题. 为了提升非线性系统状态估计的精度, 在高斯系统假设条件下结合变分贝叶斯推断和Fisher信息矩阵推导出置信下界的自然梯度, 并通过分析其信息几何意义, 阐述在统计流形空间中置信下界沿其方向不断迭代增大, 实现变分分布与后验分布的 “紧密” 近似; 在此基础上, 以状态估计及其误差协方差作为变分超参数, 结合最优估计理论给出一种基于自然梯度的非线性变分贝叶斯滤波算法; 最后, 通过天基光学传感器量测条件下近地轨道卫星跟踪定轨和纯角度被动传感器量测条件下运动目标跟踪仿真实验验证: 与对比算法相比, 所提算法具有更高的精度.
异构多智能体网络拓扑可辨识性
王立夫, 高聪, 郭戈, 孔芝
, doi: 10.16383/j.aas.c240416 , cstr: 32138.14.j.aas.c240416
摘要:
研究了高维线性时不变动力学系统构成的具有加权有向的多智能体网络拓扑变化可辨识性. 这些网络智能体动力学和内耦合矩阵均具有异构性. 分析了异构内耦合矩阵对网络拓扑可辨识性的影响, 并发现网络拓扑结构的可辨识性与智能体之间的内耦合矩阵相关. 当内耦合矩阵由同构变为异构时, 网络拓扑的可辨识性可能发生变化, 既可能由可辨识变为不可辨识, 也可能由不可辨识变为可辨识. 针对一般网络结构, 提出了一些充分和必要的条件以验证拓扑变化的可辨识性. 此外, 针对有向链状网络、有向星型网络以及有向环状网络等几种典型网络结构, 分别给出了相应的可辨识性条件. 通过实际案例验证了所提条件的合理性和有效性.
追逃博弈问题研究综述
迟嵩禹, 李帅, 王晨, 谢广明
, doi: 10.16383/j.aas.c240396 , cstr: 32138.14.j.aas.c240396
摘要:
作为多智能体对抗博弈问题的重要分支, 追逃博弈(Pursuit-evasion, PE)问题在控制和机器人领域得到了广泛的应用, 受到众多研究者的密切关注. 追逃博弈问题主要聚焦于追逐者和逃跑者双方为实现各自目标而展开的动态博弈: 追逐者试图在最短时间内抓到逃跑者, 逃跑者的目标则是避免被捕获. 本文概述追逃博弈问题的相关研究进展, 从空间环境、信息获取等五个方面介绍追逃博弈问题的各类设定; 简述理论求解、数值求解等四种当下主流的追逃博弈问题求解方法. 通过对现有研究的总结和分析, 给出几点研究建议, 对未来追逃博弈问题的发展具有一定指导意义.
基于Transformer的状态−动作−奖赏预测表征学习
刘民颂, 朱圆恒, 赵冬斌
, doi: 10.16383/j.aas.c240230 , cstr: 32138.14.j.aas.c240230
摘要:
为了提升具有高维动作空间的复杂连续控制任务的性能和样本效率, 提出一种基于Transformer的状态−动作−奖赏预测表征学习框架(Transformer-based state-action-reward prediction representation learning framework, TSAR). 具体来说, TSAR提出一种基于Transformer的融合状态−动作−奖赏信息的序列预测任务. 该预测任务采用随机掩码技术对序列数据进行预处理, 通过最大化掩码序列的预测状态特征与实际目标状态特征间的互信息, 同时学习状态与动作表征. 为进一步强化状态和动作表征与强化学习(Reinforcement learning, RL)策略的相关性, TSAR引入动作预测学习和奖赏预测学习作为附加的学习约束以指导状态和动作表征学习. TSAR同时将状态表征和动作表征显式地纳入到强化学习策略的优化中, 显著提高了表征对策略学习的促进作用. 实验结果表明, 在DMControl的9个具有挑战性的困难环境中, TSAR的性能和样本效率超越了现有最先进的方法.
面向智能网联汽车的车路协同感知技术及发展趋势
张新钰, 卢毅果, 高鑫, 黄雨宁, 刘华平, 李骏
, doi: 10.16383/j.aas.c230575 , cstr: 32138.14.j.aas.c230575
摘要:
随着感知技术的不断发展以及智能交通基础设施的完善, 智能网联汽车应用在自动驾驶领域的地位逐渐提升. 自动驾驶感知从单车智能向车路协同迈进, 近年来涌现了一批新的协同感知技术与方法. 本文旨在全面阐述面向智能网联汽车的车路协同感知技术, 并总结相关可利用数据及该方向的发展趋势. 首先对智能网联汽车的协同感知策略进行划分, 并总结了不同感知策略具备的优势与不足; 其次, 对智能网联汽车协同感知的关键技术进行阐述, 包括车路协同感知过程中的感知技术与通信技术; 然后对车路协同感知方法进行归纳, 总结了近年来解决协同感知中感知融合、感知信息选择与压缩等问题的相关研究; 最后对车路协同感知的大规模数据集进行整理, 并对智能网联汽车协同感知的发展趋势进行分析.
基于椭圆曲线ELGamal的隐私保护分布式优化算法
赵中原, 高旺, 蒋璐瑶, 葛泉波
, doi: 10.16383/j.aas.c240404 , cstr: 32138.14.j.aas.c240404
摘要:
研究一类考虑节点隐私保护的分布式优化问题, 目标为保护各智能体的隐私信息不被泄露, 并最小化所有智能体局部成本函数之和. 首先, 针对无向连通图, 提出一种基于椭圆曲线密码机制的分布式凸优化算法. 通过设计底层权重矩阵, 将基于椭圆曲线的ElGamal同态加密和数字签名与分布式次梯度算法相结合, 克服了椭圆曲线密码机制与分布式一致性策略无法结合的难点. 在无第三方或聚合器的场景下, 该算法实现了系统的隐私保护. 理论分析表明, 该算法能够渐近收敛至全局最优解, 并适用于时变通信拓扑的动态环境. 此外, 算法有效保护智能体的状态和成本函数不受来自诚实但好奇攻击者、外部窃听者和篡改攻击者的威胁. 最后, 通过数值仿真验证了算法的有效性.
异构非线性多智能体系统无模型输出一致性控制
孙一仆, 陈鑫, 贺文朋, 佘锦华, 吴敏
, doi: 10.16383/j.aas.c240459 , cstr: 32138.14.j.aas.c240459
摘要:
针对异构非线性多智能体系统的输出一致性控制难题, 设计了一种基于同胚分布式控制协议的无模型方法. 通过将输出反馈线性化理论与自适应动态规划相结合, 可以在不需要精确系统模型的情况下实现非线性智能体的线性化, 简化分布式控制器的设计复杂性. 具体而言, 通过设计双层分布式控制结构, 在物理空间层通过无模型反馈线性书方法实现未知系统线性化, 在微分同构空间层利用线性控制方法进行分布式共识控制. 通过两个实验验证了所提方法在处理未知异构非线性多智能体系统中的有效性, 将传统的线性分布式控制方法扩展到未知非线性多智能体控制器设计问题.
面向机动目标的设定时间多约束协同制导律
李鹤宇, 王建斌, 张锐, 宋峰
, doi: 10.16383/j.aas.c240099 , cstr: 32138.14.j.aas.c240099
摘要:
针对三维空间中多航天器协同捕获机动目标问题, 提出一种具有终端角度约束和时间一致性约束的设定时间协同制导律, 将视线角误差和齐射攻击的收敛时间作为一个可提前设定的参数, 实现对收敛时间进行设置. 构建三维场景航天器−目标运动学模型, 在沿视线(Line-of-sight, LOS)方向将同时攻击问题转化为一致性问题, 提出一种分布式协同制导律, 设定时间内使得多个航天器剩余飞行时间相等; 在垂直视线方向利用滑模控制方法对制导律进行设计, 使得每个航天器的视线角在设定时间内达到期望值. 上述制导律中, 设计了一种设定时间扩展状态观测器对未知的目标加速度进行估计. 数值仿真结果验证了方法的有效性.
基于零和微分博弈的航天器编队通信链路故障容错控制
任好, 马亚杰, 姜斌, 刘成瑞
, doi: 10.16383/j.aas.c240115 , cstr: 32138.14.j.aas.c240115
摘要:
针对可能由不确定干扰和网络攻击引起的通信链路故障的航天器编队控制系统, 提出一种基于零和微分博弈的最优容错控制方法. 该方法通过构建描述编队协同控制的性能函数, 将通信链路故障容错控制问题等效转换为零和微分博弈模型. 采用Hamilton-Jacobi-Isaacs (HJI)方程和极小极大原则设计博弈中的优化解, 并利用自适应动态规划算法对其进行在线逼近, 以获得编队的最优容错控制策略, 保证航天器通信链路故障下的在轨稳定性和最优性能. 仿真结果表明本文设计的分布式最优容错控制律的有效性.
基于大模型的具身智能系统综述
王文晟, 谭宁, 黄凯, 张雨浓, 郑伟诗, 孙富春
, doi: 10.16383/j.aas.c240542 , cstr: 32138.14.j.aas.c240542
摘要:
得益于近期具有世界知识的大规模预训练模型的迅速发展, 基于大模型的具身智能在各类任务中取得了良好的效果, 展现出了强大的泛化能力与在各领域内广阔的应用前景. 鉴于此, 对基于大模型的具身智能的工作进行了综述, 首先, 介绍了大模型在具身智能系统中起到的感知与理解作用; 其次, 对大模型在具身智能中参与的需求级、任务级、规划级和动作级的控制进行了较为全面的总结; 然后, 对不同具身智能系统架构进行介绍, 并总结了目前具身智能模型的数据来源, 包括模拟器、模仿学习以及视频学习; 最后, 对基于大语言模型(Large language model, LLM)的具身智能系统的面临的挑战与发展方向进行讨论与总结.
基于多李雅普诺夫函数的一般非线性系统渐近镇定
杨可馨, 李永强, 侯忠生, 冯宇
, doi: 10.16383/j.aas.c240309 , cstr: 32138.14.j.aas.c240309
摘要:
针对离散时间非线性系统, 提出一种基于多李雅普诺夫(Lyapunov)函数的控制器设计方法. 该方法不仅能够保证闭环系统稳定性, 还能够扩大闭环吸引域(Domain of attraction, DOA). 首先, 给出基于多Lyapunov函数下系统渐近稳定的充分条件. 结果表明, 由多个Lyapunov函数的负定不变集构成的并集是一个稳定的控制集合, 其从控制空间到状态空间的投影是闭环DOA的估计. 随后, 使用区间分析算法求解集合的内近似估计, 基于此算法可以求解多Lyapunov函数的负定不变集的近似值和闭环DOA的估计值, 并给出相应控制器的设计方法. 最后, 通过仿真算例验证本文方法的有效性.
景象匹配无人机视觉定位
袁媛, 孙柏, 刘赶超
, doi: 10.16383/j.aas.c230778 , cstr: 32138.14.j.aas.c230778
摘要:
无人机因其极高的灵活性, 在临地安防、灾后救援、地质勘测、农业植保等领域发挥着重要作用, 因此受到越来越多的关注. 定位导航作为无人机中的关键技术, 对于无人机能否顺利执行任务至关重要. 当前主要的定位导航算法包括全球卫星定位系统、惯性定位以及景象匹配定位导航等. 其中, 景象匹配定位导航方法利用计算机视觉技术, 对无人机飞行时采集的航空影像进行数字化特征编码. 随后, 通过构建相似性度量与检索模型, 将航空影像特征与预先获取的遥感地图库特征进行相似性度量, 从而完成景象匹配. 最后, 根据无人机航空影像与遥感卫星地图的匹配结果, 获取相应的地理位置信息, 并将其更新为无人机的定位结果. 景象匹配定位导航方法摆脱了定位系统对定位信号的依赖, 实现了无人机飞行定位的自主化. 鉴于此, 以景象匹配算法中的特征提取方式为线索, 分别针对基于模板匹配、基于手工特征以及基于度量学习的景象匹配, 梳理其发展过程, 并总结了景象匹配定位导航方法中的关键问题. 最后, 针对景象匹配算法的发展现状, 总结了无人机景象匹配定位方法中亟待解决的问题.
行人惯性定位新动态: 基于神经网络的方法、性能与展望
李岩, 施忠臣, 侯燕青, 戚煜华, 谢良, 陈伟, 陈洪波, 闫野, 印二威
, doi: 10.16383/j.aas.c240221 , cstr: 32138.14.j.aas.c240221
摘要:
行人惯性定位通过惯性测量单元 (Inertial measurement unit, IMU) 的测量序列来估计行人的位置, 近年来已成为解决室内或卫星信号遮挡环境下行人自主定位的重要手段. 然而, 传统惯性定位方法在双重积分时易受误差源影响导致漂移问题, 一定程度上限制了行人惯性定位在长时间长距离实际运动中的应用. 幸运的是, 基于神经网络(Neural network, NN)学习的方法能够仅从IMU历史数据中学习行人的运动模式并修正惯性测量值在积分时引起的漂移. 为此, 本文对近期基于深度神经网络(Deep neural network, DNN)的行人惯性定位进行全面综述. 首先对传统的惯性定位方法进行了简要介绍; 其次, 按照是否融入领域知识分别介绍了端到端的神经惯性定位方法和融合领域知识的神经惯性定位方法的研究动态; 然后, 概述了行人惯性定位的基准数据集、评价指标, 并分析比较了其中一些代表性方法的优势和不足; 最后, 对该领域需要解决的关键难点问题进行了总结, 并探讨基于DNN的行人惯性定位未来所面临的关键挑战与发展趋势, 以期为后续的研究提供有益参考.
面向RTK定位的整数约束型渐进高斯滤波方法
杨旭升, 李唯诣, 张文安
, doi: 10.16383/j.aas.c240384 , cstr: 32138.14.j.aas.c240384
摘要:
本文研究了卫星信号干扰下 RTK (Real-time kinematic)整周模糊度固定问题, 提出一种基于整数约束型渐进高斯滤波的 RTK 定位方法. 首先, 结合贝叶斯推理与同伦方法优势, 导出一种兼容整数、浮点状态的渐进高斯滤波框架. 其次, 构造从先验分布到后验分布的同伦路径, 以目标浮点状态与模糊度固定的迭代求解来提高信号干扰情形下的整周模糊度固定率. 特别地, 通过渐进地融合卫星双差信息来降低线性化误差, 进而提升对目标状态后验分布的逼近精度. 最后, 通过车载 RTK 实验及后处理分析, 验证了所提方法的有效性和优越性.
多智能体协同研究进展综述: 博弈和控制交叉视角
秦家虎, 马麒超, 李曼, 张聪, 付维明, 刘轻尘, 郑卫新
, doi: 10.16383/j.aas.c240508 , cstr: 32138.14.j.aas.c240508
摘要:
多智能体协同应用广泛, 并被列为新一代人工智能基础理论亟待突破的重要内容之一, 对其开展研究具有鲜明的科学价值和工程意义.随着人工智能技术的进步, 单一控制视角下的多智能体协同已无法满足执行大规模复杂任务的需求, 融合博弈与控制的多智能体协同应运而生.在这一框架下, 多智能体协同具有更高的灵活性、适应性和扩展性, 为多智能体系统的发展带来了更多可能性. 本文首先从协同角度入手, 回顾了多智能体协同控制与估计领域的进展. 接着, 围绕博弈与控制的融合, 介绍了博弈框架的基本概念, 重点讨论了在微分博弈下多智能体协同问题的建模与分析, 并简要总结了如何应用强化学习算法求解博弈均衡. 文章选取多移动机器人导航和电动汽车充电调度这两个典型的多智能体协同场景, 介绍了博弈与控制融合的思想如何用于解决相关领域的难点问题. 最后, 对博弈与控制融合框架下的多智能体协同进行了总结和展望.
神经网络分岔动力学综述
肖敏, 陆云翔, 虞文武, 郑卫新
, doi: 10.16383/j.aas.c230789 , cstr: 32138.14.j.aas.c230789
摘要:
自1982年著名的Hopfield神经网络问世以来, 神经网络的分岔动力学受到了学术界的广泛关注. 首先, 回顾四类经典神经网络的数学模型和它们在各个领域的应用. 接着, 综述近三十年来关于整数阶神经网络、分数阶神经网络、超数域神经网络以及反应扩散神经网络分岔动力学的相关研究成果. 分析诸多组合因素, 包括节点规模、耦合情形、拓扑结构、系统阶次、复值、四元数、八元数、扩散、时滞、随机性、脉冲、忆阻、激活函数等对神经网络分岔动力学的影响, 并展示神经网络在多个领域的广泛应用. 最后, 在人工智能、大数据、深度学习等新技术的冲击下, 对神经网络分岔动力学所面临的挑战以及未来的研究方向进行总结和展望.
AP-IS: 面向多模态数据的智能高效索引选择模型
乔少杰, 刘晨旭, 韩楠, 徐康镭, 蒋宇河, 元昌安, 吴涛, 袁冠
, doi: 10.16383/j.aas.c240196 , cstr: 32138.14.j.aas.c240196
摘要:
现有的索引选择方法存在诸多局限性. 首先, 大多数方法考虑场景较为单一, 不能针对特定数据模态选择合适的索引结构, 进而无法有效应对海量多模态数据; 其次, 现有方法未考虑索引选择时索引构建的代价, 无法有效应对动态的工作负载. 针对上述问题, 提出一种面向多模态数据的智能高效索引选择模型 APE-X DQN (Distributed prioritized experience replay in deep Q-network), 称为 AP-IS (APE-X DQN for index selection). AP-IS 设计了新型索引集编码和 SQL 语句编码方法, 该方法使 AP-IS 在感知多模态数据的同时兼顾索引结构本身的特性, 极大地降低了索引的存储代价. AP-IS 集成新型索引效益评估方法, 在优化强化学习奖励机制的同时, 监控数据库工作负载的执行状态, 保证动态工作负载下 AP-IS 在时间和空间上的优化效果. 在真实多模态数据集上进行大量实验, 验证了 AP-IS 在工作负载的延迟、存储代价和训练效率等方面的性能, 结果均明显优于最新索引选择方法.
基于变分稀疏高斯过程的多机器人协同感知与围捕
曹凯, 陈阳泉, 魏云博, 刘志, 陈超波, 高嵩
, doi: 10.16383/j.aas.c240406 , cstr: 32138.14.j.aas.c240406
摘要:
针对未知环境下的多机器人环境感知和围捕问题, 提出了一种基于变分稀疏高斯过程回归的分布式感知与围捕算法. 考虑到传统高斯过程回归不适合处理大量数据的问题, 在这项工作中, 首先考虑障碍物的影响, 以引入分离超平面的质心维诺划分算法为机器人动态规划任务区域; 其次, 利用多机器人在任务区域中的移动探索获取环境信息, 并通过变分自由能方法来近似模型的后验分布, 完成对未知环境的感知; 最后, 基于粒子群算法为围捕机器人动态分配围捕点, 实现多机器人的全方位均匀围捕. 通过仿真实验证明, 该算法能够适用于单源、多源以及动态源的围捕, 且能够在保证多机器人编队安全性的同时, 实现较高的迭代速度, 最终成功实现均匀围捕.
基于不同故障传播路径差异化的故障诊断方法
谭帅, 王一帆, 姜庆超, 侍洪波, 宋冰
, doi: 10.16383/j.aas.c240151 , cstr: 32138.14.j.aas.c240151
摘要:
针对工业过程中故障发生源与故障信息在传播过程中的差异性问题, 提出了一种基于不同故障传播路径差异化的故障诊断方法. 该方法分别从故障源邻域信息关系和故障信息传播两个角度出发, 设计了基于k近邻筛选和基于剪枝的k跳可达路径选择的两种故障源图的构建方式, 构建“故障源图”. 从故障在变量间的差异化表现着手, 将基于特征的分类问题转换为基于结构关系的图匹配问题, 利用该结构化信息优化过程特征, 提升模型故障诊断性能. 最后, 通过田纳西−伊斯曼过程和某海底盾构掘进施工过程进行仿真验证, 实验结果证明了所提方法的有效性.
基于隐写术的分布式隐私保护一致性控制方法
伍益明, 张润荣, 徐宏, 朱晨睿, 郑宁
, doi: 10.16383/j.aas.c240089 , cstr: 32138.14.j.aas.c240089
摘要:
多智能体网络(Multi-agent network, MAN)协同执行任务中需要个体之间频繁交换并共享信息, 这对网络安全带来了巨大风险. 考虑网络中节点状态隐私保护问题, 提出一种基于隐写术的分布式一致性控制策略. 首先, 建立网络窃听者攻击模型, 提出面向隐私保护的分布式平均一致性控制算法. 理论分析表明, 所提算法不仅有效保护节点初始状态的隐私, 而且可以通过隐写载体信息主动诱导窃听者推测得出错误结论. 其次, 通过引入概率指标, 提出一种用于量化MAN隐私泄露指标模型, 实现了对网络隐私泄露程度的准确描述. 并基于该模型, 从窃听者视角, 通过权衡对网络隐私泄露的影响与付出代价成本建立一个优化问题, 据此寻找最优效益攻击策略. 最后, 通过数值仿真分析, 对比现有算法验证了所提方法的有效性和优越性.
嵌套运动饱和下分布式多移动机器人反振荡安全编队控制
郑志, 江涛, 杨玥, 苏晓杰
, doi: 10.16383/j.aas.c240444 , cstr: 32138.14.j.aas.c240444
摘要:
运动受速度和加速度嵌套饱和约束, 而反应式躲避安全机制下分布式编队互联的移动机器人更易触发该嵌套饱和, 从而引起编队的剧烈振荡, 所以需要研究该情况下多移动机器人平滑安全协同及其振荡自适应抑制方法. 本文以分布式网络中的移动机器人为研究对象, 首先构建基于视线和速度的低触发势能函数, 实现邻近编队机器人近距排斥作用下的避碰保持; 引入驱动机器人绕过障碍物的安全加速度包络, 并复合近距排斥的弱能量、低触发势能, 避免与非合作障碍物的碰撞. 其次, 嵌入复合自适应辅助动态系统, 平滑躲避过程中触发的嵌套运动饱和和安全加速度约束引起的轨迹振荡; 设计复合非线性反馈框架下的分布式编队控制器, 融合混合的躲避和振荡抑制机制, 实现多机器人障碍环境下的安全编队. 最后, 与现有安全编队方法进行对比仿真和实验验证, 结果表明该方法在嵌套运动饱和约束下可显著提升编队的平滑和安全性能.
基于神经网络ODE和非线性MPC的DEA建模与控制
黄鹏, 王亚午, 吴俊东, 苏春翌, 福岛E.文彦
, doi: 10.16383/j.aas.c240223 , cstr: 32138.14.j.aas.c240223
摘要:
针对介电弹性体驱动器(Dielectric elastomer actuator, DEA)建模与控制的挑战性问题, 提出基于神经网络常微分方程(Ordinary differential equation, ODE)和非线性模型预测控制(Model predictive control, MPC)的DEA动力学建模与跟踪控制方法. 首先, 基于神经网络ODE建立DEA的动力学模型以描述其复杂的动态行为. 然后, 基于所建立的DEA动力学模型, 设计非线性模型预测控制器实现其跟踪控制目标. 最后, 在所搭建的实验平台上进行一系列跟踪控制实验. 在所有实验结果中, DEA的运动均能很好地跟踪目标轨迹, 且相对均方根误差均不超过3.30%, 说明了所提动力学建模与跟踪控制方法的有效性.
未知大规模互联系统在线分散式动态事件触发控制
何怡睿, 苏涵光, 张化光, 栾鑫洋
, doi: 10.16383/j.aas.c240262 , cstr: 32138.14.j.aas.c240262
摘要:
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证所提出的动态事件触发控制方法的有效性和实用性.
基于视觉属性的多模态可解释图像分类方法
王辉, 黄宇廷, 夏玉婷, 范自柱, 罗国亮, 杨辉
, doi: 10.16383/j.aas.c240218 , cstr: 32138.14.j.aas.c240218
摘要:
基于深度神经网络(Deep neutral networks, DNN)的分类方法因缺乏可解释性, 导致在金融、医疗、法律等关键领域难以获得完全信任, 极大限制其应用. 现有多数研究主要关注单模态数据的可解释性, 多模态数据的可解释性方面仍存在挑战. 为解决这一问题, 提出一种基于视觉属性的多模态可解释图像分类方法, 该方法将可见光和深度图等不同视觉模态提取的属性融入模型的训练过程, 不仅能通过视觉属性和决策树对已有的神经网络黑盒模型进行解释, 而且能在训练过程中进一步提升模型解释信息的能力. 引入可解释性通常会造成模型精度的降低, 该方法在保持模型具有良好可解释性的同时, 仍具有较高的分类精度, 在NYUDv2、SUN RGB-D和RGB-NIR三个数据集上, 相比于单模态可解释方法, 该模型准确率明显提升, 并达到与多模态不可解释模型相媲美的性能.
基于优势函数输入扰动的多无人艇协同策略优化方法
任璐, 柯亚男, 柳文章, 穆朝絮, 孙长银
, doi: 10.16383/j.aas.c240453 , cstr: 32138.14.j.aas.c240453
摘要:
多无人艇协同导航对于实现高效海上作业至关重要, 而如何在开放未知海域处理多艇之间复杂的协作关系、实现多艇自主协同决策是当前亟待解决的难题. 近年来, 多智能体强化学习 (Multi-agent reinforcement learning, MARL) 在解决复杂的多体决策问题上展现出巨大的潜力, 被广泛应用于多无人艇协同导航任务中. 然而, 这种基于数据驱动的方法通常存在探索效率低、探索与利用难平衡、易陷入局部最优等问题. 因此, 在集中训练和分散执行 (Centralized training and decentralized execution, CTDE) 框架的基础上, 考虑从优势函数输入端注入扰动量来提升优势函数的泛化能力, 提出一种新的基于优势函数输入扰动的多智能体近端策略优化(Noise-advantage multi-agent proximal policy optimization, NA-MAPPO)方法, 从而提升多无人艇协同策略的探索效率. 实验结果表明, 与现有的基准算法相比, 所提方法能够有效提升多无人艇协同导航任务的成功率, 缩短策略的训练时间以及任务的完成时间, 从而提升多无人艇协同探索效率, 避免策略陷入局部最优.
时间序列分类模型的集成对抗训练防御方法
王璐瑶, 曹渊, 刘博涵, 曾恩, 刘坤, 夏元清
, doi: 10.16383/j.aas.c240050 , cstr: 32138.14.j.aas.c240050
摘要:
深度学习是解决时间序列分类(Time series classification, TSC)问题的主要途径之一. 然而, 基于深度学习的TSC模型易受到对抗样本攻击, 从而导致模型分类准确率大幅度降低. 为此, 研究了TSC模型的对抗攻击防御问题, 设计了集成对抗训练(Adversarial training, AT)防御方法. 首先, 设计了一种针对TSC模型的集成对抗训练防御框架, 通过多种TSC模型和攻击方式生成对抗样本, 并用于训练目标模型. 其次, 在生成对抗样本的过程中, 设计了基于Shapelets的局部扰动算法, 并结合动量迭代的快速梯度符号法(Momentum iterative fast gradient sign method, MI-FGSM), 实现了有效的白盒攻击. 同时, 使用知识蒸馏(Knowledge distillation, KD)和基于沃瑟斯坦距离的生成对抗网络(Wasserstein generative adversarial network, WGAN)设计了针对替代模型的黑盒对抗攻击方法, 实现了攻击者对目标模型未知时的有效攻击. 在此基础上, 在对抗训练损失函数中添加Kullback-Leibler (KL)散度约束, 进一步提升了模型鲁棒性. 最后, 在多变量时间序列分类数据集UEA上验证了所提方法的有效性.
执行器饱和的离散时间多智能体系统有限时域一致性控制
王巍, 王珂, 黄自鑫, 王乐君, 穆朝絮
, doi: 10.16383/j.aas.c240446 , cstr: 32138.14.j.aas.c240446
摘要:
针对执行器饱和的离散时间线性多智能体系统有限时域一致性控制问题, 将低增益反馈方法与Q学习相结合, 提出采用后向时间迭代的模型无关控制方法. 首先, 将执行器饱和的有限时域一致性控制问题的求解转变为执行器饱和的单智能体有限时域最优控制问题的求解, 并证明可以通过求解修正的时变黎卡提方程 (Modified time-varying Riccati equation, MTVRE) 以实现有限时域最优控制. 随后, 引入参数化时变Q函数, 并提出基于Q学习的模型无关后向时间迭代算法, 可以更新低增益参数, 同时实现逼近求解修正的时变黎卡提方程. 另外, 证明所提迭代求解算法得到的低增益反馈控制矩阵收敛于修正的时变黎卡提方程的最优解, 也可以实现全局有限时域一致性控制. 最后, 通过仿真实验结果验证该方法的有效性.
基于PI结构的多智能体系统容错一致性控制
郜晨, 何潇, 周东华
, doi: 10.16383/j.aas.c240474 , cstr: 32138.14.j.aas.c240474
摘要:
本文针对无领航者多智能体系统以及领航-跟随多智能体系统执行器故障问题,设计了基于比例-积分结构的容错控制律. 考虑到传统的比例型控制律无法消除加性干扰影响下的稳态误差,本文引入积分环节,在一致性控制律中融入状态的积分项,用于改善多智能体系统一致性过程的稳态性能. 针对领航者输入不为零的情况,设计非线性的一致性控制律,并借助黎卡提方程以及Lyapunov函数,进行多智能体系统在故障情况下的一致性分析和控制律设计. 最后,通过一系列对比仿真,说明了所设计控制律在改善系统稳态性能方面的优势.
基于变参递归网络和递归最小二乘的连续体机器人控制
张润宁, 余鹏, 谭宁
, doi: 10.16383/j.aas.c240469 , cstr: 32138.14.j.aas.c240469
摘要:
连续体机器人通常由柔性材料制成, 能够承受大幅度形变, 在各领域具有广阔的应用前景. 然而, 其软体结构和非传统的驱动机制也带来了诸多非线性因素, 使得其状态和运动难以被精确建模. 因此, 为连续体机器人设计了一种无模型控制方案. 该方案一方面通过变参递归神经网络求解连续体机器人的逆运动学, 以实现高精度运动控制, 另一方面使用递归最小二乘法基于实时数据估计和更新机器人雅可比矩阵伪逆, 以避免机器人的解析建模. 最后, 通过仿真模拟和实物实验验证了所提出控制方案的可行性、精确性和鲁棒性, 并通过一系列对比实验突出了所提出方法的优势. 该方法率先研究基于递归最小二乘法的连续体机器人雅可比矩阵伪逆估计, 对未来的连续体机器人研究具有一定的启示作用.
无人飞行器集群自主控制: 基于联盟形成博弈的任务分配
姜斌, 马亚杰, 薛舒心
, doi: 10.16383/j.aas.c240593 , cstr: 32138.14.j.aas.c240593
摘要:
针对复杂多约束条件下异构无人机集群系统的任务分配问题, 提出一种基于联盟形成博弈的分布式任务预分配和重分配方法. 考虑时效性、同时性等耦合约束条件, 引入准确的能耗模型建立任务分配模型, 利用联盟形成博弈将任务分配问题转化为联盟划分问题, 并设计一种无故障条件下的分布式任务预分配方法, 降低任务分配求解的复杂度, 同时提高最终解的平均质量; 进一步, 针对无人机故障问题, 准确分析健康无人机的运动模型, 合理划分重分配范围, 基于任务预分配结果设计重分配算法. 仿真结果表明了所提分布式任务预分配与重分配方法在不同场景下的实时性和有效性.
基于正系统分析的不确定非线性系统性能驱动控制方法
郭宗易, 韩永麟, 郭建国, 胡冠杰
, doi: 10.16383/j.aas.c230752 , cstr: 32138.14.j.aas.c230752
摘要:
针对一类不确定非线性系统, 提出一种保证系统状态满足预设边界性能函数的新型性能驱动控制(Performance-driven control, PDC)方法. 不同于传统预设性能控制(Prescribed performance control, PPC) 方法中对误差与边界性能函数的比值进行非线性变换的思路, 本文基于保证状态量与上下边界的两个误差量均始终非负这一思想, 引入基于Metzler矩阵的正系统分析理论, 并结合切换控制技术, 以最终保证系统状态始终在预设性能函数之内. 系统的稳定性取决于边界性能函数的选取, 而不改变控制器的形式. 给出针对一类不确定非线性系统的控制设计、稳定性分析和方法讨论, 数值仿真例子验证了所提出方法的有效性.
性能函数引导的无人机集群深度强化学习控制方法
王耀南, 华和安, 张辉, 钟杭, 樊叶心, 梁鸿涛, 常浩, 方勇纯
, doi: 10.16383/j.aas.c240519 , cstr: 32138.14.j.aas.c240519
摘要:
针对无人机集群系统, 提出了一种性能函数引导的深度强化学习控制方法, 同时评估性能函数的示范经验与学习策略的探索动作, 保证了高效可靠的策略更新, 实现了无人机集群系统的高性能控制. 首先, 利用领航-跟随集群框架, 将无人机集群的控制问题转化为领航-跟随框架下的跟踪问题, 进而提出了基于模型的跟踪控制方法, 利用性能函数将集群编队误差约束在给定范围内, 实现了无人机集群的模型驱动控制. 接下来, 为了解决复杂工况下性能函数极易失效难题, 将深度强化学习方法和性能函数驱动方法结合, 提出了性能函数引导的深度强化学习控制方法, 利用性能函数的示范经验辅助训练强化学习网络, 通过同时评估探索与示范动作, 保证学习策略显著优于性能函数驱动控制方法, 有效提高了无人机编队控制精度与鲁棒性. 实验结果表明, 该方法能够显著提升无人机集群的控制精度, 实现了兼顾鲁棒性与飞行精度的高性能集群控制.
基于颜色转移和自适应增益控制的混合水下图像增强
崔峥, 王森, 王娴, 段浩, 杨春曦, 那靖
, doi: 10.16383/j.aas.c240491 , cstr: 32138.14.j.aas.c240491
摘要:
针对水下图像的颜色偏差和低对比度等退化问题, 提出了一种基于颜色转移与自适应增益控制融合的水下图像增强方法. 首先, 根据颜色转移图像和最大衰减图引导的融合策略校正水下图像的颜色偏差. 其次, 利用一阶原始对偶方法对V通道进行滤波以有效地抑制噪声的干扰, 获得结构图像; 并且提出自适应增益控制, 根据图像的高频信息自适应调整增益, 以获得细节图像. 最后, 通过加权融合结构图像与细节图像, 得到高质量的水下图像. 实验结果表明, 针对不同自然和工业环境下的水下图像, 1) 所提方法可以有效地校正颜色失真现象; 2) 显著提高水下图像的对比度并且抑制噪声干扰; 3) 在定量评价指标和高级视觉任务(目标检测、图像分割、关键点检测和水下双目测距)中优于其它主流水下图像增强方法, 为水下目标抓取等工程应用提供了有益的参考.
具身智能研究的关键问题: 自主感知、行动与进化
沈甜雨, 陶子锐, 王亚东, 张庭祯, 刘宇航, 王兴霞, 杨静, 李志伟, 陈龙, 王坤峰, 王飞跃
, doi: 10.16383/j.aas.c240364 , cstr: 32138.14.j.aas.c240364
摘要:
具身智能强调大脑、身体及环境三者的相互作用, 旨在基于机器与物理世界的交互, 创建软硬件结合、可自主学习进化的智能体. 当前, 机器学习、机器人学、认知科学等多学科技术的快速发展极大地推动了具身智能的研究与应用. 已有的具身智能文献更多从技术和方法分类的角度入手, 本文以具身智能在研究和应用过程中面临的关键挑战为角度切入, 分析具身智能研究的一般性框架, 围绕具身感知与执行、具身学习与进化两个方面提出具体的研究思路, 并针对其中涉及的关键问题详细梳理相关技术及研究进展. 此外, 以移动机器人、仿生机器人、平行机器人三方面应用为例, 介绍具身智能在感知与理解、控制与决策、交互与学习等方面给实际机器人系统设计带来的启发. 最后, 对具身智能的发展前景进行展望, 探索虚实融合数据智能、基础模型与基础智能、数字孪生与平行智能在其中的重要作用和应用潜力, 希望为相关领域学者和从业人员提供新的启示和思路. 论文相关项目详见https://github.com/BUCT-IUSRC/Survey__EmbodiedAI.
基于视觉的人体动作质量评价研究综述
沈媛媛, 张燕明, 沈燕飞
, doi: 10.16383/j.aas.c230551 , cstr: 32138.14.j.aas.c230551
摘要:
基于视觉的人体动作质量评价利用计算机视觉相关技术自动分析个体运动完成情况, 并为其提供相应的动作质量评价结果. 这已成为运动科学和人工智能交叉领域的一个热点研究问题, 在竞技体育、运动员选材、健身锻炼、运动康复等领域具有深远的理论研究意义和很强的实用价值. 本文将从数据获取及标注、运动特征表示、运动质量评价3个方面对涉及到的技术进行回顾分析, 对相关方法进行分类, 并比较分析不同方法在AQA-7、JIGSAWS、EPIC-Skills 2018三个数据集上的性能. 最后讨论未来可能的研究方向.
基于多智能体强化学习的博弈综述
李艺春, 刘泽娇, 洪艺天, 王继超, 王健瑞, 李毅, 唐漾
, doi: 10.16383/j.aas.c240478 , cstr: 32138.14.j.aas.c240478
摘要:
多智能体强化学习作为博弈论、控制论和多智能体学习的交叉研究领域, 是多智能体系统研究中的前沿方向, 赋予了智能体在动态多维的复杂环境中通过交互和决策完成多样化任务的能力. 多智能体强化学习正在向应用对象开放化、应用问题具身化、应用场景复杂化的方向发展, 并逐渐成为解决现实世界中博弈决策问题的最有效工具. 本文对基于多智能体强化学习的博弈进行了系统性综述. 首先, 介绍了多智能体强化学习的基本理论, 梳理了多智能体强化学习算法与基线测试环境的发展进程. 其次, 针对合作、对抗以及混合三种多智能体强化学习任务, 从提高智能体合作效率、提升智能体对抗能力的维度来介绍多智能体强化学习的最新进展, 并结合实际应用探讨了混合博弈的前沿研究方向. 最后, 对多智能体强化学习的应用前景和发展趋势进行了总结与展望.
针对信息物理系统远程状态估计的隐蔽虚假数据注入攻击
金增旺, 刘茵, 刁靖东, 王震, 孙长银, 刘志强
, doi: 10.16383/j.aas.c240527 , cstr: 32138.14.j.aas.c240527
摘要:
从攻击者的角度探讨信息物理系统(Cyber-physical system, CPS)中隐蔽虚假数据注入攻击的最优策略. 选取K-L(Kullback-Leibler)散度作为攻击隐蔽性的评价指标, 设计攻击信号使得攻击保持隐蔽的同时能够最大程度地降低CPS远程状态估计的性能. 首先, 利用残差的统计特征计算远程状态估计误差协方差, 将问题转化为二次约束优化问题. 其次, 在攻击隐蔽性的约束下, 运用拉格朗日乘子法及半正定规划推导出最优策略. 最后, 通过仿真实验验证本文提出的方法与现有的方法相比在隐蔽性方面具有显著的优势.
电力设施多模态精细化机器人巡检关键技术及应用
张辉, 杜瑞, 钟杭, 曹意宏, 王耀南
, doi: 10.16383/j.aas.c230809 , cstr: 32138.14.j.aas.c230809
摘要:
电力设施巡检对于加快电网基础设施智能化改造和智能微电网建设, 提高电力系统互补互济和智能调节能力的需求具有重要作用, 近年来, 智能巡检机器人开始在电力巡检中广泛应用. 在提高电力设施巡检效率和准确性、提升安全性、降低成本和促进电力智能化发展等方面发挥关键作用. 本文从电力巡检机器人的智能感知和导航技术出发, 重点介绍目标检测、语义分割、自主导航等共性关键技术的国内外发展现状. 然后以可见光红外双光融合、可见光图像和点云数据融合、声纹和可见光融合为例, 阐述电力场景多模态数据融合方式. 并进一步介绍电力部件精准分割和异物检测、线路点云杆塔倾斜检测、输电线路覆冰多模态检测和电力架空线路缺陷分析及台账异常检测等电力设施多模态机器人相关案例. 最后探讨电力设施多模态精细化机器人巡检关键技术的发展趋势和所面临的挑战.
深度长尾学习研究综述
韩佳艺, 刘建伟, 陈德华, 徐璟东, 代琪, 夏鹏飞
, doi: 10.16383/j.aas.c240077 , cstr: 32138.14.j.aas.c240077
摘要:
深度学习是一门依赖于数据的科学, 传统深度学习方法假定在平衡数据集上训练模型, 然而, 现实世界中大规模数据集通常表现出长尾分布现象, 样本数量众多的少量头部类主导模型训练, 而大量尾部类样本数量过少, 难以得到充分学习. 近年来, 长尾学习掀起学术界的研究热潮, 涌现出大量先进的工作. 本文综合梳理和分析了近年来发表在高水平会议或期刊上的文献, 对长尾学习进行全面的综述. 具体而言, 根据深度学习模型设计流程, 将图像识别领域的长尾学习算法分为丰富样本数量与语义信息的优化样本空间方法, 关注特征提取器、分类器、logits和损失函数这四个基本组成部分的优化模型方法以及通过引入帮助模型训练的辅助任务, 在多个空间共同优化长尾学习模型的辅助任务学习3大类, 并根据提出的分类方法综合对比分析每类长尾学习方法的优缺点. 然后, 进一步将基于样本数量的狭义长尾学习概念推广至多尺度广义长尾学习. 此外, 本文对文本数据、语音数据等其它数据形式下的长尾学习算法进行简要评述. 最后, 讨论了目前长尾学习面临的可解释性较差、数据质量较低等挑战, 并展望了如多模态长尾学习、半监督长尾学习等未来具有潜力的发展方向.
模型参数不确定下多无人艇系统固定时间二分编队跟踪控制
温广辉, 余星火, 黄廷文, 周艳
, doi: 10.16383/j.aas.c240473 , cstr: 32138.14.j.aas.c240473
摘要:
针对模型参数不确定下多无人艇系统的固定时间二分编队跟踪控制问题,通过将命令滤波与复合学习技术融合到反推控制方法中, 提出了一种新型分布式固定时间二分编队跟踪控制协议.首先, 将命令滤波引入到反推控制中, 进而分别设计了虚拟控制协议与真实控制协议.在此基础上, 为估计未知参数设计了参数复合学习律, 利用在线记录的数据和即时数据来产生预测误差, 并利用跟踪误差和预测误差来更新参数估计.结果表明, 在严格弱于持续激励条件的区间激励条件下, 本文提出的控制方案不仅能够保证编队误差的固定时间收敛性也能够保证参数估计误差的固定时间收敛性, 同时解决了多无人艇系统的固定时间二分编队跟踪控制问题. 最后, 通过仿真实验验证了本文提出的控制协议的有效性.
具身智能自主无人系统技术
孙长银, 袁心, 王远大, 柳文章
, doi: 10.16383/j.aas.c240456 , cstr: 32138.14.j.aas.c240456
摘要:
自主无人系统是一类具有自主感知和决策能力的智能系统, 在国防安全、航空航天、高性能机器人等方面有着广泛的应用. 近年来, 基于Transformer架构的各类大模型快速革新, 极大地推动了自主无人系统的发展. 目前, 自主无人系统正迎来一场以“具身智能”为核心的新一代技术革命. 大模型需要借助无人系统的物理实体来实现“具身化”, 无人系统可以利用大模型技术来实现“智能化”. 本文阐述了具身智能自主无人系统的发展现状, 详细探讨了包含大模型驱动的多模态感知、面向具身任务的推理与决策、基于动态交互的机器人学习与控制、三维场景具身模拟器等具身智能领域的关键技术. 最后, 指出了目前具身智能无人系统所面临的挑战, 并展望了未来的研究方向.
基于分层仿生神经网络的多机器人协同区域搜索算法
陈波, 张辉, 江一鸣, 钟杭, 王耀南
, doi: 10.16383/j.aas.c240458 , cstr: 32138.14.j.aas.c240458
摘要:
针对多机器人系统在战场, 灾难现场等复杂未知环境下的区域搜索问题, 提出了一种基于分层仿生神经网络的多机器人协同区域搜索算法. 首先将仿生神经网络(BNN) 和不同分辨率下的区域栅格地图结合, 构建分层仿生神经网络信息模型, 其中包括区域搜索神经网络信息模型(AS-BNN)和区域覆盖神经网络信息模型(AC-BNN). 机器人在任务区域内实时探测到的环境信息将转换为AS-BNN和AC-BNN中神经元的动态活性值. 其次, 在分层仿生神经网络信息模型基础上引入了分布式模型预测控制(DMPC)框架, 并设计了多机器人分层协同决策机制. 当机器人处于正常搜索状态时, 基于AS-BNN信息模型进行搜索路径滚动优化决策. 当机器人陷入局部最优状态时, 则启用AC-BNN信息模型引导机器人快速找到新的未搜索区域. 最后, 在复杂未知环境下进行多机器人区域搜索仿真实验, 并与该领域内的3种算法进行比较. 仿真结果验证了所提算法能够在复杂未知环境下引导多机器人系统高效地完成区域搜索任务.
分布式在线鞍点问题的Bandit反馈优化算法
张文韬, 张保勇, 袁德明, 徐胜元
, doi: 10.16383/j.aas.c240289 , cstr: 32138.14.j.aas.c240289
摘要:
本文研究了多智能体时变网络上基于bandit反馈的分布式在线鞍点问题, 其中每个智能体通过本地计算和局部信息交流去协作最小化全局损失函数. 在bandit反馈下, 包括梯度在内的损失函数信息是不可用的, 每个智能体仅能获得和使用在某决策或其附近产生的函数值. 为此, 结合单点梯度估计方法和预测映射技术, 提出了一种非欧几里得意义上的分布式在线bandit鞍点优化算法. 以动态鞍点遗憾作为性能指标, 对于一般的凸-凹损失函数, 建立了遗憾上界并在某些预设条件下确保了所提算法的次线性收敛. 此外, 考虑到计算优化子程序的精确解在迭代优化中通常较为困难, 本文进一步设计了一种基于近似计算方法的算法变种, 并严格分析了精确度设置对算法遗憾上界的影响. 最后, 通过一个目标跟踪案例对算法的有效性和先进性进行了仿真验证.
异构不确定二阶非线性多智能体系统事件触发状态趋同
李振兴, 庄娇娇, 杨成东, 邱建龙, 曹进德
, doi: 10.16383/j.aas.c240423 , cstr: 32138.14.j.aas.c240423
摘要:
研究异构不确定二阶非线性多智能体系统的事件触发状态趋同控制问题. 首先, 为每个智能体设计参数观测器用以估计不确定参数, 这些观测器可渐近估计不确定参数. 其次, 为每个跟随智能体设计分布式参数观测器渐近估计领导智能体不确定参数, 每个智能体利用邻居智能体触发时刻的采样值估计其邻居智能体的状态. 基于估计的参数和邻居状态, 提出完全不依赖智能体间连续信息传输的事件触发趋同算法. 同时, 证明在所给算法的作用下多智能体系统能够达到状态趋同且不存在芝诺现象. 最后, 给出一个多单摆系统用以验证事件触发趋同算法, 仿真结果表明跟随智能体的位置和速度可以渐近跟踪领导智能体的位置和速度, 并且整个多智能体系统平均每秒触发8.825次, 对比仿真显示, 基于参数和状态观测器的事件触发状态趋同算法可以有效减少事件触发次数.
基于比例积分调节的严格反馈多智能体系统最优一致性
武文强, 王庆领
, doi: 10.16383/j.aas.c240288
摘要:
本文研究了严格反馈多智能体系统的最优一致性问题, 旨在局部信息交互的条件下, 使所有智能体收敛至全局代价函数的最优解. 首先, 针对权重非平衡有向图, 提出了一种新的分布式比例积分(Proportional-integral, PI)变量, 将最优一致性问题转化为PI调节问题, 使得经典的控制技术能够通过调节PI变量的方式来处理更加复杂的多智能体系统. 然后, 结合所提出的分布式PI变量和预设性能控制, 设计了一类基于PI调节的最优一致性算法, 用以解决带有死区输入非线性和有界扰动的严格反馈多智能体系统的最优一致性问题. 最后, 通过仿真实验验证了所设计的最优一致性算法的有效性.
多智能体强化学习控制与决策研究综述
罗彪, 胡天萌, 周育豪, 黄廷文, 阳春华, 桂卫华
, doi: 10.16383/j.aas.c240392
摘要:
强化学习作为一类重要的人工智能方法, 广泛应用于解决复杂的控制与决策问题, 其在众多领域的应用已展示出巨大潜力. 近年来, 强化学习从单智能体决策逐渐扩展到多智能体协作与博弈, 形成多智能体强化学习这一研究热点. 多智能体系统由多个具有自主感知和决策能力的实体组成, 有望解决传统单智能体方法难以应对的大规模复杂问题. 多智能体强化学习不仅需要考虑环境的动态性, 还需应对其他智能体策略的不确定性, 这增加了学习和决策的复杂度. 本文梳理多智能体强化学习在控制与决策领域的研究, 分析其面临的主要问题与挑战, 从控制理论与自主决策两个层次综述现有的研究成果与进展, 并针对未来的研究方向进行了展望. 通过本文的分析, 期望为未来多智能体强化学习的研究提供有价值的参考和启示.
基于自适应原型特征类矫正的小样本学习方法
赵红, 钟杨清, 金杰, 邹林华
, doi: 10.16383/j.aas.c240312
摘要:
针对小样本学习过程上样本数量不足导致的性能下降问题, 基于原型网络的小样本学习方法通过实现查询样本与支持样本原型特征间的距离度量, 从而达到很好的分类性能. 然而, 这种方法直接将支持集样本均值视为类原型, 在一定程度上加剧了对样本数量稀少情况下的敏感性. 针对此问题, 提出了基于自适应原型特征类矫正的小样本学习方法(Few-shot learning based on class rectification via adaptive prototype features, CRAPF), 通过自适应生成原型特征来缓解模型对数据细微变化的过度响应, 并同步实现类边界的精细化调整. 首先, 使用卷积网络构建自适应原型特征生成模块, 该模块采用非线性映射获取更为稳健的原型特征, 有助于减弱异常值对原型构建的影响. 其次, 通过对原型生成过程的优化, 提升了不同类间原型表示的区分度, 进而强化了原型特征对于类别表征的整体效能. 最后, 在3个广泛使用的基准数据集上的实验结果显示, 该方法提升了小样本学习任务的表现. 例如, 在5类5样本设置下, CRAPF在MiniImageNet和CIFAR-FS上的准确率比其他模型至少提高了2.06% 和2.30%.
海上无人系统跨域集群发展现状及其关键技术
闫敬, 关新平
, doi: 10.16383/j.aas.c240334
摘要:
随着无人系统技术的快速发展, 海上无人系统跨域集群凭借其诸多优点已成为当前无人系统领域研究热点. 具体来说, 海上无人系统跨域集群是指空中、水面、水下无人平台, 通过跨域任务规划与信息交互实现高效集群协作, 对提升海洋复杂环境下无人平台应对能力至关重要. 目前, 海上无人系统跨域集群理论体系还不完善, 相关研究正面临诸多亟待解决的难题. 为此, 本文首先梳理了跨域集群相关概念及其发展现状, 分析了其面临的挑战与关键问题; 进而, 从控制理论和通信技术相结合角度出发, 简述了跨域集群任务规划、组网传输、协同控制等关键技术的研究进展; 最后, 结合实际发展情况和未来发展趋势, 对海上无人系统跨域集群未来值得深入研究的研究方向进行了总结与展望.
动态系统的实时安全性评估技术
何潇, 刘泽夷, 胡嵩乔, 刘畅, 周东华
, doi: 10.16383/j.aas.c240096
摘要:
动态系统的实时安全性评估在防止潜在安全事故导致重大损失方面发挥着关键作用. 随着系统功能和复杂性的日益增加, 实时安全性评估技术面临着更大的挑战. 该文阐述了动态系统实时安全性评估的概念定义, 从环境的平稳性及评估模型的构建方式两个维度出发提出了一种分类框架, 给出了相应的问题描述, 较系统地回顾了动态系统实时安全性评估技术的现有进展, 讨论了针对不同实际系统的部署策略, 分析了现有技术的发展趋势, 探讨了实时安全性评估中亟待解决的问题与未来的发展方向.
持续扰动下多耦合非线性系统分布式经济模型预测控制
王定超, 何德峰, 谢永芳
, doi: 10.16383/j.aas.c240295
摘要:
针对持续扰动下的分布式状态耦合非线性系统, 提出一种新的多耦合分布式经济模型预测控制 (Economic model predictive control, EMPC) 策略. 由于耦合非线性系统的经济性能函数的非凸性和非正定性, 首先引入关于经济最优平衡点的正定辅助函数和相应的辅助优化问题. 接着, 利用辅助函数的最优值函数构造原始分布式 EMPC 的一类隐式收缩约束. 然后建立状态耦合分布式 EMPC 的递推可行性和闭环系统关于最优经济平衡点的输入到状态稳定性结论. 最后, 以耦合的四个连续搅拌釜反应器为例, 验证本文所提策略的有效性.
面向可再生能源消纳的火电机组控制结构综合与分析
马士全, 丁进良
, doi: 10.16383/j.aas.c230210
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
基于 PID 自整定功能的自适应双路输出的黑体温度控制
张海弟
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
仿人智能控制理论及应用研究进展
戴小文, 宋建霖, 岳丽全
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
基于生成对抗网络的对抗攻击防御模型
孔锐, 蔡佳纯, 黄钢
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.