优先发表
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
摘要:
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
摘要:
针对无人机(Unmanned aerial vehicle, UAV)集群的运动相态转换问题, 提出一种仿鸟群自推进粒子模型的无人机集群相变控制方法. 首先, 从鸟群运动行为中获得启发, 通过设计速度保持项和势能梯度项构建仿鸟群运动模型, 并设计相变控制项模拟巢穴对鸟群的吸引, 以实现集群在不同相态之间的转换. 然后, 讨论集群在设计的相变控制律作用下的运动相态, 证明无人机集群能够实现两种稳定的运动相态并进行相互转换. 最后, 仿真验证了集群存在的两种稳定运动构型, 所提出相变控制律能够实现两种集群运动相态的互相转换.
针对无人机(Unmanned aerial vehicle, UAV)集群的运动相态转换问题, 提出一种仿鸟群自推进粒子模型的无人机集群相变控制方法. 首先, 从鸟群运动行为中获得启发, 通过设计速度保持项和势能梯度项构建仿鸟群运动模型, 并设计相变控制项模拟巢穴对鸟群的吸引, 以实现集群在不同相态之间的转换. 然后, 讨论集群在设计的相变控制律作用下的运动相态, 证明无人机集群能够实现两种稳定的运动相态并进行相互转换. 最后, 仿真验证了集群存在的两种稳定运动构型, 所提出相变控制律能够实现两种集群运动相态的互相转换.
摘要:
集群协同围捕技术在空天防御领域逐渐扮演愈加关键的角色, 本文基于碰撞平面等效覆盖方法, 在三维空间内基于非线性动态模型提出一种新的高速强机动目标的覆盖策略. 首先基于三维圆锥体可达域提出新的碰撞平面覆盖等效方法, 阐释加速度覆盖和位置覆盖的区别与联系, 并从几何角度分析交会角对完全覆盖的影响; 其次, 考虑实际环境下飞行器过载弱于目标的情况, 基于偏置比例导引设计协同制导律, 能够实现对目标加速度的覆盖, 并基于覆盖率和零控脱靶量提出分段覆盖动态调节与快速收敛策略, 使得多飞行器在前期能够保持高覆盖率, 后期能够降低整体的脱靶量, 实现围捕覆盖的优势; 最后, 结合数值仿真进行了可行性验证.
集群协同围捕技术在空天防御领域逐渐扮演愈加关键的角色, 本文基于碰撞平面等效覆盖方法, 在三维空间内基于非线性动态模型提出一种新的高速强机动目标的覆盖策略. 首先基于三维圆锥体可达域提出新的碰撞平面覆盖等效方法, 阐释加速度覆盖和位置覆盖的区别与联系, 并从几何角度分析交会角对完全覆盖的影响; 其次, 考虑实际环境下飞行器过载弱于目标的情况, 基于偏置比例导引设计协同制导律, 能够实现对目标加速度的覆盖, 并基于覆盖率和零控脱靶量提出分段覆盖动态调节与快速收敛策略, 使得多飞行器在前期能够保持高覆盖率, 后期能够降低整体的脱靶量, 实现围捕覆盖的优势; 最后, 结合数值仿真进行了可行性验证.
摘要:
针对无人机(Unmanned aerial vehicle, UAV)集群系统, 提出一种性能函数引导的深度强化学习控制方法, 同时评估性能函数的示范经验与学习策略的探索动作, 保证高效可靠的策略更新, 实现无人机集群系统的高性能控制. 首先, 利用领航–跟随集群框架, 将无人机集群的控制问题转化为领航–跟随框架下的跟踪问题, 进而提出基于模型的跟踪控制方法, 利用性能函数将集群编队误差约束在给定范围内, 实现无人机集群的模型驱动控制. 接下来, 为解决复杂工况下性能函数极易失效难题, 将深度强化学习方法和性能函数驱动方法结合, 提出性能函数引导的深度强化学习控制方法, 利用性能函数的示范经验辅助训练强化学习网络, 通过同时评估探索与示范动作, 保证学习策略显著优于性能函数驱动控制方法, 有效提高无人机编队控制精度与鲁棒性. 实验结果表明, 该方法能够显著提升无人机集群的控制性能, 实现兼顾鲁棒性与飞行精度的高性能集群控制.
针对无人机(Unmanned aerial vehicle, UAV)集群系统, 提出一种性能函数引导的深度强化学习控制方法, 同时评估性能函数的示范经验与学习策略的探索动作, 保证高效可靠的策略更新, 实现无人机集群系统的高性能控制. 首先, 利用领航–跟随集群框架, 将无人机集群的控制问题转化为领航–跟随框架下的跟踪问题, 进而提出基于模型的跟踪控制方法, 利用性能函数将集群编队误差约束在给定范围内, 实现无人机集群的模型驱动控制. 接下来, 为解决复杂工况下性能函数极易失效难题, 将深度强化学习方法和性能函数驱动方法结合, 提出性能函数引导的深度强化学习控制方法, 利用性能函数的示范经验辅助训练强化学习网络, 通过同时评估探索与示范动作, 保证学习策略显著优于性能函数驱动控制方法, 有效提高无人机编队控制精度与鲁棒性. 实验结果表明, 该方法能够显著提升无人机集群的控制性能, 实现兼顾鲁棒性与飞行精度的高性能集群控制.
摘要:
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (Cross-connection enhanced transformer, CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dise相似系数(Dise similarity coefficient, DSC)值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
受限于局部感受野, 卷积神经网络无法建立足够的长距离依赖关系. 一些方法通过将Transformer部署至卷积网络的某些特定部位来缓解这个问题, 如网络编码器、解码器或跳跃连接层. 但这些方法只能为某些特定特征建立长距离依赖关系, 难以捕获大小、形态多样的腹部器官之间的复杂依赖关系. 针对该问题, 提出一种交叉增强Transformer (Cross-connection enhanced transformer, CE transformer)结构, 并用它作为特征提取单元构建一种新的多层级编−解码分割网络CE TransNet. CE transformer采用双路径设计, 深度融合Transformer与卷积结构, 可同时对长、短距离依赖关系进行建模. 在双路径中, 引入密集交叉连接促进不同粒度信息的交互与融合, 提高模型整体特征捕获能力. 将CE transformer部署于CE TransNet的整个编解码路径中, 可有效捕捉多器官的复杂上下文关系. 实验结果表明, 提出方法在WORD和Synapse腹部CT多器官数据集上的平均Dise相似系数(Dise similarity coefficient, DSC)值分别高达82.42%和81.94%, 显著高于多种当前先进方法.
摘要:
研究基于磁链在线辨识的异步电机超螺旋滑模控制问题. 针对异步电机, 设计一种改进的超螺旋滑模速度控制器 (Improved super-twisting sliding mode speed controller, IMSTSMC), 提升系统的动态响应性能. 为抑制算法中符号函数高频切换所引起的系统抖振问题, 构造一种可变指数切换函数. 进一步地, 考虑到转子磁链受惯性延迟的影响, 设计磁链在线观测器 (Flux online observer, FOO), 可辨识转子磁链幅值, 提升系统的控制精度和参数鲁棒性. 数值仿真和实验结果验证了所提算法的可行性和有效性.
研究基于磁链在线辨识的异步电机超螺旋滑模控制问题. 针对异步电机, 设计一种改进的超螺旋滑模速度控制器 (Improved super-twisting sliding mode speed controller, IMSTSMC), 提升系统的动态响应性能. 为抑制算法中符号函数高频切换所引起的系统抖振问题, 构造一种可变指数切换函数. 进一步地, 考虑到转子磁链受惯性延迟的影响, 设计磁链在线观测器 (Flux online observer, FOO), 可辨识转子磁链幅值, 提升系统的控制精度和参数鲁棒性. 数值仿真和实验结果验证了所提算法的可行性和有效性.
摘要:
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%, 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证模型的可解释性.
复杂多变的现代兵棋模拟中, 精准的战局预测与战场态势解读是提高决策质量的关键. 针对兵棋推演中复杂态势表达困难和模型可解释性不足的挑战, 提出基于异构图神经网络的可解释兵棋预测模型WarGraph, 模型由多关系图建模、时序分析、预测解释三个模块构成. 首先综合复盘数据与先验知识, 将环境与算子之间的多元复杂关系建模为多关系异构图, 从而捕捉作战单元之间以及与环境的复杂交互关系, 实现复杂推演态势的表征; 然后利用Transformer时序分析方法, 动态捕捉整体态势演变, 并通过注意力机制抽取关键决策时刻. 该模型不仅能在复盘推演中精准预测战局胜负, 注意力机制的引入能更好地解释决策中的关键因素. 以“庙算·智胜”实时兵棋对抗平台2021年的108场陆战对局复盘数据作为实验数据集, 结果显示本文提出的模型预测准确率可达90.91%, 相比其他模型提高大约9.09%, 通过对注意力系数的可视化分析, 模型在决策过程中捕捉到关键时刻, 进一步验证模型的可解释性.
摘要:
倾转旋翼无人机动力学特性复杂, 过渡过程中的变速变构型特性导致系统具有较大的模型不确定性, 且容易受到阵风扰动等影响, 对姿态控制律设计提出很高要求. 针对该问题, 本文建立一种扰动观测器结合终端滑模补偿器的模型参考姿态控制方法. 基于齐次系统理论设计固定时间收敛扰动观测器, 实现对倾转旋翼无人机未建模动态和外部扰动的准确估计; 基于一种新型非线性饱和函数设计固定时间收敛终端滑模控制器, 结合低通滤波实现对指令的快速高品质跟踪; 为进一步解决控制奇异性问题, 提出在纵轴附近邻域对控制器的改进策略. 仿真结果表明, 所提方法在应对倾转旋翼无人机模型不确定性和外部扰动方面具有较强的鲁棒性, 相比基于有限时间稳定性理论的模型参考姿态控制方法, 固定时间收敛控制提供了更高的控制精度和更平滑的输出.
倾转旋翼无人机动力学特性复杂, 过渡过程中的变速变构型特性导致系统具有较大的模型不确定性, 且容易受到阵风扰动等影响, 对姿态控制律设计提出很高要求. 针对该问题, 本文建立一种扰动观测器结合终端滑模补偿器的模型参考姿态控制方法. 基于齐次系统理论设计固定时间收敛扰动观测器, 实现对倾转旋翼无人机未建模动态和外部扰动的准确估计; 基于一种新型非线性饱和函数设计固定时间收敛终端滑模控制器, 结合低通滤波实现对指令的快速高品质跟踪; 为进一步解决控制奇异性问题, 提出在纵轴附近邻域对控制器的改进策略. 仿真结果表明, 所提方法在应对倾转旋翼无人机模型不确定性和外部扰动方面具有较强的鲁棒性, 相比基于有限时间稳定性理论的模型参考姿态控制方法, 固定时间收敛控制提供了更高的控制精度和更平滑的输出.
摘要:
针对障碍环境下多无人机编队跟踪问题, 提出一种兼顾编队跟踪性能与安全的控制框架. 在该框架中, 首先利用性能边界可调的预设性能控制方法生成期望控制信号, 使无人机跟踪虚拟领导者的期望轨迹, 跟踪过程中满足瞬态与稳态误差约束. 进一步, 基于控制障碍函数描述无人机的安全状态集合并建立二次规划问题, 利用Karush-Kuhn-Tucker条件得到最小干预安全控制器的闭式解. 最后, 利用安全控制的闭式解构造辅助系统, 实现性能函数的自适应更新. 理论分析表明, 该算法能够在编队跟踪与安全性冲突条件下确保系统安全, 在不发生冲突时实现性能约束下的编队跟踪. 仿真结果验证了提出算法的有效性.
针对障碍环境下多无人机编队跟踪问题, 提出一种兼顾编队跟踪性能与安全的控制框架. 在该框架中, 首先利用性能边界可调的预设性能控制方法生成期望控制信号, 使无人机跟踪虚拟领导者的期望轨迹, 跟踪过程中满足瞬态与稳态误差约束. 进一步, 基于控制障碍函数描述无人机的安全状态集合并建立二次规划问题, 利用Karush-Kuhn-Tucker条件得到最小干预安全控制器的闭式解. 最后, 利用安全控制的闭式解构造辅助系统, 实现性能函数的自适应更新. 理论分析表明, 该算法能够在编队跟踪与安全性冲突条件下确保系统安全, 在不发生冲突时实现性能约束下的编队跟踪. 仿真结果验证了提出算法的有效性.
摘要:
针对复杂多约束条件下异构无人飞行器集群问题, 提出一种基于联盟形成博弈的分布式任务预分配和重分配方法. 考虑时效性、同时性等耦合约束条件, 引入准确的能耗模型建立任务分配模型, 利用联盟形成博弈将任务分配问题转化为联盟划分问题, 并设计一种无故障条件下的分布式任务预分配方法, 降低任务分配求解的复杂度, 同时提高最终解的平均质量; 进一步, 针对无人机故障问题, 准确分析健康无人机的运动模型, 合理划分重分配范围, 基于任务预分配结果设计重分配算法. 仿真结果表明所提分布式任务预分配与重分配方法在不同场景下的实时性和有效性.
针对复杂多约束条件下异构无人飞行器集群问题, 提出一种基于联盟形成博弈的分布式任务预分配和重分配方法. 考虑时效性、同时性等耦合约束条件, 引入准确的能耗模型建立任务分配模型, 利用联盟形成博弈将任务分配问题转化为联盟划分问题, 并设计一种无故障条件下的分布式任务预分配方法, 降低任务分配求解的复杂度, 同时提高最终解的平均质量; 进一步, 针对无人机故障问题, 准确分析健康无人机的运动模型, 合理划分重分配范围, 基于任务预分配结果设计重分配算法. 仿真结果表明所提分布式任务预分配与重分配方法在不同场景下的实时性和有效性.
摘要:
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
摘要:
数据流是一组随时间连续到来的数据序列, 在数据流不断产生过程中, 由于各种因素的影响, 数据分布随时间推移可能以不可预测的方式发生变化, 这种现象称为概念漂移. 在漂移发生后, 当前模型需要及时响应数据流中的实时分布变化, 并有效处理不同类型的概念漂移, 从而避免模型泛化性能下降. 针对这一问题, 提出一种基于主动–被动增量集成的概念漂移适应方法(Concept drift adaptation method based on active-passive incremental ensemble, CDAM-APIE). 该方法首先使用在线增量集成策略构建被动集成模型, 对新样本进行实时预测以动态更新基模型权重, 有利于快速响应数据分布的瞬时变化, 并增强模型适应概念漂移的能力. 在此基础上, 利用增量学习和概念漂移检测技术构建主动基模型, 提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能. 实验结果表明, CDAM-APIE能够对概念漂移做出及时响应, 同时有效提高模型的泛化性能.
数据流是一组随时间连续到来的数据序列, 在数据流不断产生过程中, 由于各种因素的影响, 数据分布随时间推移可能以不可预测的方式发生变化, 这种现象称为概念漂移. 在漂移发生后, 当前模型需要及时响应数据流中的实时分布变化, 并有效处理不同类型的概念漂移, 从而避免模型泛化性能下降. 针对这一问题, 提出一种基于主动–被动增量集成的概念漂移适应方法(Concept drift adaptation method based on active-passive incremental ensemble, CDAM-APIE). 该方法首先使用在线增量集成策略构建被动集成模型, 对新样本进行实时预测以动态更新基模型权重, 有利于快速响应数据分布的瞬时变化, 并增强模型适应概念漂移的能力. 在此基础上, 利用增量学习和概念漂移检测技术构建主动基模型, 提升模型在平稳数据流状态下的鲁棒性和漂移后的泛化性能. 实验结果表明, CDAM-APIE能够对概念漂移做出及时响应, 同时有效提高模型的泛化性能.
摘要:
视频插帧(Video frame interpolation, VFI)技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
视频插帧(Video frame interpolation, VFI)技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
摘要:
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到了有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 本研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出了一种梯度损失函数(Gradient Loss Function, GLF), 并基于此设计了一种新的离线强化学习算法—梯度损失离线强化学习算法 (Gradient Loss for Offline Reinforcement Learning, GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将本研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下 的普适性和有效性.
离线强化学习领域面临的核心挑战在于如何避免分布偏移并限制值函数的过估计问题. 尽管传统的TD3+BC算法通过引入行为克隆正则项, 有效地约束了习得策略, 使其更接近行为策略, 从而在一定程度上得到了有竞争力的性能, 但其策略稳定性在训练过程中仍有待提高. 尤其在现实世界中, 策略验证可能涉及高昂的成本, 因此提高策略稳定性尤为关键. 本研究受到深度学习中“平坦最小值”概念的启发, 旨在探索目标策略损失函数在动作空间中的平坦区域, 以得到稳定策略. 为此, 提出了一种梯度损失函数(Gradient Loss Function, GLF), 并基于此设计了一种新的离线强化学习算法—梯度损失离线强化学习算法 (Gradient Loss for Offline Reinforcement Learning, GLO). 在D4RL基准数据集上的实验结果表明, GLO算法在性能上超越了当前的主流算法. 此外, 还尝试将本研究的方法扩展到在线强化学习领域, 实验结果证明了该方法在在线强化学习环境下 的普适性和有效性.
摘要:
深度学习是一门依赖于数据的科学, 传统深度学习方法假定在平衡数据集上训练模型, 然而, 现实世界中大规模数据集通常表现出长尾分布现象, 样本数量众多的少量头部类主导模型训练, 而大量尾部类样本数量过少, 难以得到充分学习. 近年来, 长尾学习掀起学术界的研究热潮. 本文综合梳理和分析近年来发表在高水平会议或期刊上的文献, 对长尾学习进行全面综述. 具体而言, 根据深度学习模型设计流程, 将图像识别领域的长尾学习算法分为丰富样本数量与语义信息的优化样本空间方法, 关注特征提取器、分类器、logits和损失函数这四个基本组成部分的优化模型方法, 以及通过引入辅助任务来帮助模型训练并在多个空间共同优化长尾学习模型的辅助任务学习3大类, 根据提出的分类方法综合对比分析每类长尾学习方法的优缺点. 然后, 进一步将基于样本数量的狭义长尾学习概念推广至多尺度广义长尾学习. 此外, 对文本数据、语音数据等其他数据形式下的长尾学习算法进行简要评述. 最后, 讨论目前长尾学习面临的可解释性较差、数据质量较低等挑战, 并展望如多模态长尾学习、半监督长尾学习等未来具有潜力的发展方向.
深度学习是一门依赖于数据的科学, 传统深度学习方法假定在平衡数据集上训练模型, 然而, 现实世界中大规模数据集通常表现出长尾分布现象, 样本数量众多的少量头部类主导模型训练, 而大量尾部类样本数量过少, 难以得到充分学习. 近年来, 长尾学习掀起学术界的研究热潮. 本文综合梳理和分析近年来发表在高水平会议或期刊上的文献, 对长尾学习进行全面综述. 具体而言, 根据深度学习模型设计流程, 将图像识别领域的长尾学习算法分为丰富样本数量与语义信息的优化样本空间方法, 关注特征提取器、分类器、logits和损失函数这四个基本组成部分的优化模型方法, 以及通过引入辅助任务来帮助模型训练并在多个空间共同优化长尾学习模型的辅助任务学习3大类, 根据提出的分类方法综合对比分析每类长尾学习方法的优缺点. 然后, 进一步将基于样本数量的狭义长尾学习概念推广至多尺度广义长尾学习. 此外, 对文本数据、语音数据等其他数据形式下的长尾学习算法进行简要评述. 最后, 讨论目前长尾学习面临的可解释性较差、数据质量较低等挑战, 并展望如多模态长尾学习、半监督长尾学习等未来具有潜力的发展方向.
摘要:
城市固废焚烧(Municipal solid waste incineration, MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例-积分-微分(Proportional-integral-derivative, PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(Interval type-2 fuzzy broad learning system, IT2FBLS)拟合Actor-critic网络(Actor-critic network, ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
城市固废焚烧(Municipal solid waste incineration, MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例-积分-微分(Proportional-integral-derivative, PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(Interval type-2 fuzzy broad learning system, IT2FBLS)拟合Actor-critic网络(Actor-critic network, ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
摘要:
大模型技术提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等问题, 阻碍了可信可靠人工智能系统的构建. 检索增强生成方法(Retrieval-augmented generation, RAG)通过外接知识库和查询关联的检索有效提升了大模型的知识和能力水平, 为大模型掌握实时型、行业型及私有型知识提供了有力支撑, 进而加速了大模型技术向多样场景的推广与落地. 本文围绕检索增强生成技术, 阐述了其基本原理、发展现状及典型应用, 并分析了其优势和面临的挑战. 在此基础上, 引入搜索和缓存管理思想, 提出了RAG的拓展框架SAGE (Search-augmented generation and extension), 以建立更加灵活和高效的大模型知识外挂工具链.
大模型技术提升了人们获取和利用知识的效率, 但在实际应用中仍然面临着知识受限、迁移障碍和幻觉等问题, 阻碍了可信可靠人工智能系统的构建. 检索增强生成方法(Retrieval-augmented generation, RAG)通过外接知识库和查询关联的检索有效提升了大模型的知识和能力水平, 为大模型掌握实时型、行业型及私有型知识提供了有力支撑, 进而加速了大模型技术向多样场景的推广与落地. 本文围绕检索增强生成技术, 阐述了其基本原理、发展现状及典型应用, 并分析了其优势和面临的挑战. 在此基础上, 引入搜索和缓存管理思想, 提出了RAG的拓展框架SAGE (Search-augmented generation and extension), 以建立更加灵活和高效的大模型知识外挂工具链.
摘要:
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应 (Domain adaptation, DA)物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异 (Maximum mean discrepancy, MMD)对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
基于机器学习的预测方法通常能够实现较高的拟合精度, 但模型可解释性和泛化性能较差. 在工业过程中, 由于概念漂移现象的存在, 这些方法的稳定性受到影响, 使得在复杂工业环境中精确建模成为一项既困难又具挑战性的任务. 为此, 提出一种基于线性动力算子的域适应 (Domain adaptation, DA)物理信息神经网络方法. 首先通过历史工况数据建立线性动力算子神经网络模型, 捕获多变量时间序列数据的动态特性. 然后通过前向欧拉法对机理模型进行离散化, 构造物理信息正则化项, 促使模型服从机理约束. 最后通过最大均值差异 (Maximum mean discrepancy, MMD)对历史工况和当前工况下隐藏层状态变量进行分布对齐, 构建域适应损失, 降低变工况下数据分布变化对模型的影响. 在多个数据集上的实验表明, 该方法可以有效提高模型预测精度和泛化性能.
摘要:
针对执行器故障的无人机/无人艇(Unmanned aerial/surface vehicle, UAV/USV)异构协同系统编队包容控制问题, 提出一种固定时间预设性能演化控制方法. 为保证基于视觉测量的相对位置信号的连续性和准确性, 设计控制误差收敛的演化路径, 通过固定时间预设性能函数使误差限制在演化路径的邻域内, 并利用转换函数将受约束跟踪问题转换为无约束镇定问题. 采用动态面技术对转换后的误差动力学进行控制, 并利用干扰观测器和自适应技术对干扰和未知执行器故障进行估计. 通过 Lyapunov 函数证明误差动力学闭环系统所有信号都是最终一致有界的, 并进一步证明编队误差是固定时间稳定的, 数值仿真验证了所提方法的有效性.
针对执行器故障的无人机/无人艇(Unmanned aerial/surface vehicle, UAV/USV)异构协同系统编队包容控制问题, 提出一种固定时间预设性能演化控制方法. 为保证基于视觉测量的相对位置信号的连续性和准确性, 设计控制误差收敛的演化路径, 通过固定时间预设性能函数使误差限制在演化路径的邻域内, 并利用转换函数将受约束跟踪问题转换为无约束镇定问题. 采用动态面技术对转换后的误差动力学进行控制, 并利用干扰观测器和自适应技术对干扰和未知执行器故障进行估计. 通过 Lyapunov 函数证明误差动力学闭环系统所有信号都是最终一致有界的, 并进一步证明编队误差是固定时间稳定的, 数值仿真验证了所提方法的有效性.
摘要:
近年来, 随着深度强化学习方法快速发展, 其在无人机自主导航上的应用也受到越来越广泛地关注. 然而, 面对复杂未知的环境, 现存的基于深度强化学习的无人机自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景当中的应用潜力. 为解决上述问题, 提出了多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建了自主感知-规划-控制架构, 赋予无人机在多样复杂环境中自主导航的能力.
近年来, 随着深度强化学习方法快速发展, 其在无人机自主导航上的应用也受到越来越广泛地关注. 然而, 面对复杂未知的环境, 现存的基于深度强化学习的无人机自主导航算法常受限于对全局信息的依赖和特定训练环境的约束, 极大地限制了其在各种场景当中的应用潜力. 为解决上述问题, 提出了多尺度输入用于平衡感受野与状态维度, 以及截断操作来使智能体能够在扩张后的环境中运行. 此外, 构建了自主感知-规划-控制架构, 赋予无人机在多样复杂环境中自主导航的能力.
摘要:
针对复杂海风环境下旋翼无人机(Unmanned aerial vehicles, UAVs)姿态控制不稳定的问题, 提出姿态稳定方法SymTAL-POP (Symmetric temporal adversarial learning-partitioned online prediction). 该方法包括离线学习和在线预测两个部分. 在离线学习阶段, 引入对称式时序域对抗自适应学习算法SymTAL. 结合域对抗学习、对称网络和双向时序网络, SymTAL有效解决海风环境中无人机姿态稳定问题. 利用深度学习优化加速框架和改进的Adam优化器, 提升SymTAL学习能力和计算效率. 在线预测阶段, 设计风场预测模型POP, 实现海风环境实时感知与预测. POP采用变分模态分解(Vibration mode decomposition, VMD)技术处理风速信号, 通过特征选择策略预测不同风况下的风速, 增强无人机环境适应能力. 测试结果表明, SymTAL在学习效率和控制精度方面均优于其他姿态稳定算法, POP在连续风、间歇风和湍流风的多风况条件下的预测精度优于其他模型. 仿真实验表明SymTAL-POP在轨迹跟踪误差上表现突出, 平均值降低23.5%, 均方根误差减少55.2%.
针对复杂海风环境下旋翼无人机(Unmanned aerial vehicles, UAVs)姿态控制不稳定的问题, 提出姿态稳定方法SymTAL-POP (Symmetric temporal adversarial learning-partitioned online prediction). 该方法包括离线学习和在线预测两个部分. 在离线学习阶段, 引入对称式时序域对抗自适应学习算法SymTAL. 结合域对抗学习、对称网络和双向时序网络, SymTAL有效解决海风环境中无人机姿态稳定问题. 利用深度学习优化加速框架和改进的Adam优化器, 提升SymTAL学习能力和计算效率. 在线预测阶段, 设计风场预测模型POP, 实现海风环境实时感知与预测. POP采用变分模态分解(Vibration mode decomposition, VMD)技术处理风速信号, 通过特征选择策略预测不同风况下的风速, 增强无人机环境适应能力. 测试结果表明, SymTAL在学习效率和控制精度方面均优于其他姿态稳定算法, POP在连续风、间歇风和湍流风的多风况条件下的预测精度优于其他模型. 仿真实验表明SymTAL-POP在轨迹跟踪误差上表现突出, 平均值降低23.5%, 均方根误差减少55.2%.
摘要:
基于图像级标签的弱监督语义分割(Weakly supervised semantic segmentation, WSSS)算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图(Class activation maps, CAMs)实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素, 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器(Image-specific classifier, ISC), 以提升对同类像素的识别能力,从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数 (Class center constrained loss function, Lcccl), 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实了该方案的有效性.
基于图像级标签的弱监督语义分割(Weakly supervised semantic segmentation, WSSS)算法因极低的标注成本引起学界广泛关注. 该领域的算法利用分类网络产生的类激活图(Class activation maps, CAMs)实现从图像级标签到像素级标签的转化. 然而类激活图往往只关注于图像中最显著的区域, 致使基于类激活图产生的伪标签与真实标注存在较大差距, 主要包括前景未被有效激活的欠激活问题以及前景间预测混淆的错误激活问题. 欠激活源于数据集类内差异过大, 致使单一分类器不足以准确识别同一类别的所有像素, 错误激活则是数据集类间差异过小, 导致分类器不能有效区分不同类别的像素. 本文考虑到同一类别像素在图像内的差异小于在数据集中的差异, 设计基于类中心的图像特定分类器(Image-specific classifier, ISC), 以提升对同类像素的识别能力,从而改善欠激活, 同时考虑到类中心是类别在特征空间的代表, 设计类中心约束函数 (Class center constrained loss function, Lcccl), 通过扩大类中心间的差距从而间接地疏远不同类别的特征分布, 以缓解错误激活现象. 图像特定分类器可以插入其他弱监督语义分割网络, 替代分类网络的分类器, 以产生更高质量的类激活图. 实验结果表明, 本文所提出的方案在两个基准数据集上均具有良好的表现, 证实了该方案的有效性.
摘要:
介绍一种自主研发的无线可穿戴非侵入式脑电信号采集技术: SignBrain (型号P). SignBrain设备为爪形结构, 设计符合国际10-20导联标准, 具有18个盐水电极, 配合万向活动抱紧部件, 始终保持电极与头皮紧密接触, 弥补了头型较大、发量较多佩戴使用的问题. 设备不用打导电膏实现了“即戴即用”的使用方式, 采集的脑电信号通过低功耗蓝牙实时传输至软件系统, 系统支持在线阻抗检测、Marker同步记录等功能. 同时研发了与设备配套的PC端软件、应用接口以及移动终端 (手机、平板电脑等) 软件, 能在线、离线、远程查看数据. SignBrain技术已在临床医院及相关单位完成了小批量的试用, 通过脑机交互领域中闭眼想象写字实验、高频视觉诱发实验来验证设备的可靠性及稳定性. 关于设备的开发和应用讨论请访问网站: www.SignBrain.cn.
介绍一种自主研发的无线可穿戴非侵入式脑电信号采集技术: SignBrain (型号P). SignBrain设备为爪形结构, 设计符合国际10-20导联标准, 具有18个盐水电极, 配合万向活动抱紧部件, 始终保持电极与头皮紧密接触, 弥补了头型较大、发量较多佩戴使用的问题. 设备不用打导电膏实现了“即戴即用”的使用方式, 采集的脑电信号通过低功耗蓝牙实时传输至软件系统, 系统支持在线阻抗检测、Marker同步记录等功能. 同时研发了与设备配套的PC端软件、应用接口以及移动终端 (手机、平板电脑等) 软件, 能在线、离线、远程查看数据. SignBrain技术已在临床医院及相关单位完成了小批量的试用, 通过脑机交互领域中闭眼想象写字实验、高频视觉诱发实验来验证设备的可靠性及稳定性. 关于设备的开发和应用讨论请访问网站: www.SignBrain.cn.
摘要:
随着计算机视觉(Computer vision, CV)的快速发展, 人们对于提高视觉任务的性能和泛化能力的需求不断增长, 导致模型的复杂度与对各种资源的需求进一步提高. 提示学习(Prompt learning, PL)作为一种能有效地提升模型性能和泛化能力、重用预训练模型和降低计算量的方法, 在一系列下游视觉任务中受到了广泛的关注与研究. 然而, 现有的PL综述缺乏对PL方法全面的分类和讨论, 也缺乏对现有实验结果进行深入的研究以评估现有方法的优缺点. 因此, 本文对PL在CV领域的分类、应用和性能进行全面的概述. 首先, 介绍PL的研究背景和定义, 并简要回顾CV领域中PL研究的最新进展. 其次, 对目前CV领域中的PL方法进行分类, 包括文本提示、视觉提示和视觉−语言联合提示, 对每类PL方法进行详细阐述并探讨其优缺点. 接着, 综述PL在十个常见下游视觉任务中的最新进展. 此外, 提供三个CV应用的实验结果并进行总结和分析, 全面讨论不同PL方法在CV领域的表现. 最后, 基于上述讨论对PL在CV领域面临的挑战和机遇进行分析, 为进一步推动PL在CV领域的发展提供前瞻性的思考.
随着计算机视觉(Computer vision, CV)的快速发展, 人们对于提高视觉任务的性能和泛化能力的需求不断增长, 导致模型的复杂度与对各种资源的需求进一步提高. 提示学习(Prompt learning, PL)作为一种能有效地提升模型性能和泛化能力、重用预训练模型和降低计算量的方法, 在一系列下游视觉任务中受到了广泛的关注与研究. 然而, 现有的PL综述缺乏对PL方法全面的分类和讨论, 也缺乏对现有实验结果进行深入的研究以评估现有方法的优缺点. 因此, 本文对PL在CV领域的分类、应用和性能进行全面的概述. 首先, 介绍PL的研究背景和定义, 并简要回顾CV领域中PL研究的最新进展. 其次, 对目前CV领域中的PL方法进行分类, 包括文本提示、视觉提示和视觉−语言联合提示, 对每类PL方法进行详细阐述并探讨其优缺点. 接着, 综述PL在十个常见下游视觉任务中的最新进展. 此外, 提供三个CV应用的实验结果并进行总结和分析, 全面讨论不同PL方法在CV领域的表现. 最后, 基于上述讨论对PL在CV领域面临的挑战和机遇进行分析, 为进一步推动PL在CV领域的发展提供前瞻性的思考.
摘要:
研究了通信链路故障下一类高阶非匹配非线性多智能体系统(MAS)的领导跟随一致性控制问题. 为了处理非匹配非线性项和通信链路故障, 提出了一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计了一个完全分布式控制器以保证系统的领导-跟随一致性, 并以矩阵不等式的形式给出了确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
研究了通信链路故障下一类高阶非匹配非线性多智能体系统(MAS)的领导跟随一致性控制问题. 为了处理非匹配非线性项和通信链路故障, 提出了一种基于三个在线调节动态参数的补偿器. 然后, 仅使用局部补偿信息, 设计了一个完全分布式控制器以保证系统的领导-跟随一致性, 并以矩阵不等式的形式给出了确定控制增益和补偿器参数的充分条件. 最后通过仿真验证了所提结论的有效性.
摘要:
为应对来袭目标的机动调整对防区防御能力的影响, 针对性设计全新的部署优化模型和求解算法. 首先, 从战术层面出发, 提出一种考虑攻防信息变化的新型武器部署模型, 该模型能够动态调整部署策略以提高防御系统的整体效能; 其次, 设计基于混沌映射机制和K均值聚类与重心法的算法初始化方案, 以应对资源紧缺和充足两种情况, 降低算法陷入局部最优的风险; 然后, 设计基于Metropolis准则的个体最优更新方法和基于Stackelberg博弈模型的全局最优更新方法用以指导种群的进化方向; 最后, 通过提供多规模场景仿真实验, 验证了新模型和所提算法的有效性, 对比实验结果表明新模型能够更准确地反映部署方案之间的差异, 所提算法在求解质量与收敛性方面均有显著提高.
为应对来袭目标的机动调整对防区防御能力的影响, 针对性设计全新的部署优化模型和求解算法. 首先, 从战术层面出发, 提出一种考虑攻防信息变化的新型武器部署模型, 该模型能够动态调整部署策略以提高防御系统的整体效能; 其次, 设计基于混沌映射机制和K均值聚类与重心法的算法初始化方案, 以应对资源紧缺和充足两种情况, 降低算法陷入局部最优的风险; 然后, 设计基于Metropolis准则的个体最优更新方法和基于Stackelberg博弈模型的全局最优更新方法用以指导种群的进化方向; 最后, 通过提供多规模场景仿真实验, 验证了新模型和所提算法的有效性, 对比实验结果表明新模型能够更准确地反映部署方案之间的差异, 所提算法在求解质量与收敛性方面均有显著提高.
摘要:
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
摘要:
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 针对定位系统中恶意攻击的同源性进行了深入分析, 并设计了分布式观测器以实现定位矫正. 针对定位系统中常见的三种攻击, 分别设计了恰当的模拟实现方式, 能够在多次蒙特卡洛实验很好的控制环境变量, 从而得到具有统计意义的实验结果. 本文还建立了不随偏差注入攻击幅值变化的定位偏移同源性的衡量指标, 分析了三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到了限制. 同时提出了一种适配复杂系统的观测器来实现恶意攻击下的定位校正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
全球定位系统由于其较长的传输距离和较弱的加密方式, 易受到恶意攻击的影响. 定位系统中的恶意阻断攻击、恶意欺骗攻击与恶意偏差注入攻击会导致攻击范围内的接收设备产生相似的定位偏移. 针对定位系统中恶意攻击的同源性进行了深入分析, 并设计了分布式观测器以实现定位矫正. 针对定位系统中常见的三种攻击, 分别设计了恰当的模拟实现方式, 能够在多次蒙特卡洛实验很好的控制环境变量, 从而得到具有统计意义的实验结果. 本文还建立了不随偏差注入攻击幅值变化的定位偏移同源性的衡量指标, 分析了三种典型恶意攻击的同源性. 然而, 现有的分布式观测器方法没有考虑系统包含安全输出和存在有界噪声的情况, 这使得观测器的应用受到了限制. 同时提出了一种适配复杂系统的观测器来实现恶意攻击下的定位校正, 并得到了观测器收敛的充分条件. 仿真结果证明了观测器理论的有效性.
摘要:
质量相关故障检测作为数据驱动的多元统计过程监测的重要研究内容, 是保障复杂装备或工业过程安全高效运行的关键技术, 而确定或划分质量相关变量是该方法的核心环节. 现有质量相关故障检测方法通常高度依赖于质量变量, 一旦质量变量不可测, 其有效性便受到严重挑战. 为解决这一挑战, 提出基于质量关联虚拟变量(Quality-related virtual variable, QRV)的质量相关变量划分方法, 基于此建立一种独立成分分析(Independent component analysis, ICA)质量相关故障检测模型, 并开展故障检测应用研究. 首先, 构造一个QRV, 以间接反映系统的质量特性; 其次, 基于该QRV, 利用假设检验将过程变量划分为质量相关和质量无关变量组; 随后, 将该划分结果应用于基于ICA的质量相关故障检测, 利用指数加权移动平均(Exponentially weighted moving average, EWMA)修正统计量, 并构造综合检测指标; 最后, 通过数值仿真和田纳西−伊斯曼过程(Tennessee-Eastman process, TEP)实验验证了所提方法的可行性和有效性.
质量相关故障检测作为数据驱动的多元统计过程监测的重要研究内容, 是保障复杂装备或工业过程安全高效运行的关键技术, 而确定或划分质量相关变量是该方法的核心环节. 现有质量相关故障检测方法通常高度依赖于质量变量, 一旦质量变量不可测, 其有效性便受到严重挑战. 为解决这一挑战, 提出基于质量关联虚拟变量(Quality-related virtual variable, QRV)的质量相关变量划分方法, 基于此建立一种独立成分分析(Independent component analysis, ICA)质量相关故障检测模型, 并开展故障检测应用研究. 首先, 构造一个QRV, 以间接反映系统的质量特性; 其次, 基于该QRV, 利用假设检验将过程变量划分为质量相关和质量无关变量组; 随后, 将该划分结果应用于基于ICA的质量相关故障检测, 利用指数加权移动平均(Exponentially weighted moving average, EWMA)修正统计量, 并构造综合检测指标; 最后, 通过数值仿真和田纳西−伊斯曼过程(Tennessee-Eastman process, TEP)实验验证了所提方法的可行性和有效性.
摘要:
多列车运行态势是列车调度员和司机分别调整运行图和列车驾驶策略的关键信息和重要依据, 表征各列车在未来运行各位置处的速度、加速度、通过时刻等信息. 然而, 由于高铁信号系统的交互信息利用率较低, 列车调度员和司机只能凭经验推演多列车运行态势, 基于此给出的运行图和列车驾驶策略的自动化程度较低, 影响铁路运营效率. 为此, 针对多列车运行态势推演问题, 构建多列车运行态势推演系统架构及模型. 以单列车运行态势的离线推演和在线推演方法为基础, 提出多列车运行态势微观推演方法, 以及基于虚拟编队模式的多列车运行态势宏观实时推演方法. 仿真结果表明, 微观推演方法能在 420 s 内计算多列车超速防护曲线和运行图调整的安全下界. 宏观推演方法针对任意临时限速场景, 都能在 7 s 内为列车调度员和司机分别实时提供列车运行调整方案和辅助驾驶策略, 有效降低铁路人员的工作强度, 提升高铁运营效率和应急处置能力.
多列车运行态势是列车调度员和司机分别调整运行图和列车驾驶策略的关键信息和重要依据, 表征各列车在未来运行各位置处的速度、加速度、通过时刻等信息. 然而, 由于高铁信号系统的交互信息利用率较低, 列车调度员和司机只能凭经验推演多列车运行态势, 基于此给出的运行图和列车驾驶策略的自动化程度较低, 影响铁路运营效率. 为此, 针对多列车运行态势推演问题, 构建多列车运行态势推演系统架构及模型. 以单列车运行态势的离线推演和在线推演方法为基础, 提出多列车运行态势微观推演方法, 以及基于虚拟编队模式的多列车运行态势宏观实时推演方法. 仿真结果表明, 微观推演方法能在 420 s 内计算多列车超速防护曲线和运行图调整的安全下界. 宏观推演方法针对任意临时限速场景, 都能在 7 s 内为列车调度员和司机分别实时提供列车运行调整方案和辅助驾驶策略, 有效降低铁路人员的工作强度, 提升高铁运营效率和应急处置能力.
摘要:
最优控制与人工智能两个领域的融合发展产生了一类以执行-评判设计为主要思想的自适应动态规划(Adaptive dynamic programming, ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得了重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 给最优控制器的设计构成了挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到了广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习、博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为了提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结了数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望了一些未来值得研究的方向.
最优控制与人工智能两个领域的融合发展产生了一类以执行-评判设计为主要思想的自适应动态规划(Adaptive dynamic programming, ADP)方法. 通过集成动态规划理论、强化学习机制、神经网络技术、函数优化算法, ADP在求解大规模复杂非线性系统的决策和调控问题上取得了重要进展. 然而, 实际系统的未知参数和不确定扰动经常导致难以建立精确的数学模型, 给最优控制器的设计构成了挑战. 近年来, 具有强大自学习和自适应能力的数据驱动ADP方法受到了广泛关注, 它能够在不依赖动态模型的情况下, 仅利用系统的输入输出数据为复杂非线性系统设计出稳定、安全、可靠的最优控制器, 符合智能自动化的发展潮流. 通过对数据驱动ADP方法的算法实现、理论特性、相关应用等方面进行梳理, 着重介绍了最新的研究进展, 包括在线Q学习、值迭代Q学习、策略迭代Q学习、加速Q学习、迁移Q学习、跟踪Q学习、安全Q学习、博弈Q学习, 并涵盖数据学习范式、稳定性、收敛性以及最优性的分析. 此外, 为了提高学习效率和控制性能, 设计了一些改进的评判机制和效用函数. 最后, 以污水处理过程为背景, 总结了数据驱动ADP方法在实际工业系统中的应用效果和存在问题, 并展望了一些未来值得研究的方向.
摘要:
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明了系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
考虑甲板运动和舰尾流等扰动影响下的舰载机着舰轨迹跟踪问题, 提出一种基于预定义时间的自适应抗干扰控制策略. 建立着舰轨迹生成、引导、控制和进近动力补偿等子系统, 将轨迹跟踪问题转换为子系统的稳定问题. 针对舰尾流引起的时变扰动和甲板运动对理想着舰点的变化影响, 采用长短记忆神经网络进行甲板运动预估并在引导指令中予以修正, 借助非线性扰动观测器估计未知干扰对模型集总外界扰动进行前馈补偿. 为提升着舰轨迹跟踪与姿态控制的精确性和快速性, 设计基于反步架构的预定义时间控制策略, 通过李雅普诺夫稳定性分析证明了系统能够在设定的时间内收敛. 数字和半实物仿真结果表明, 在甲板运动和舰尾流扰动影响下所设计的控制策略能够满足着舰轨迹的快速准确跟踪, 实现预定义时间稳定.
摘要:
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法如雨后春笋般涌现, 在帧间对齐、信息传播等方面取得了突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理了现有的视频超分辨率重建的公共数据集及相关算法; 接着, 重点综述了基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结了视频超分辨率重建算法面临的挑战及未来的发展趋势.
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法如雨后春笋般涌现, 在帧间对齐、信息传播等方面取得了突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理了现有的视频超分辨率重建的公共数据集及相关算法; 接着, 重点综述了基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结了视频超分辨率重建算法面临的挑战及未来的发展趋势.
, 最新更新时间
, doi: 10.16383/j.aas.c230210
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
, 最新更新时间
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
, 最新更新时间
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
, 最新更新时间
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
摘要:
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.