优先发表
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
摘要:
功能脑网络(FBN)在精神障碍诊断中广泛应用, 但传统构建方法缺乏与下游任务的互动性, 限制了模型性能; 且图神经网络多层堆叠易导致节点特征过度平滑难以提取深层特征. 为此, 提出端到端的自适应聚合功能网络模型, 通过大脑感兴趣区域(ROI)感知汇聚层, 利用自注意力机制动态构建FBN并学习节点特征, 增强了模型与子任务的交互能力. 同时引入节点池化机制筛选显著ROI, 进而推断出对于子任务较为重要的ROI. 该方法应用于注意力缺陷多动障碍(ADHD)的分类实验中, 实验结果表明该方法提高了ADHD的分类准确率, 对实验结果的解释性分析也验证了该方法的有效性.
功能脑网络(FBN)在精神障碍诊断中广泛应用, 但传统构建方法缺乏与下游任务的互动性, 限制了模型性能; 且图神经网络多层堆叠易导致节点特征过度平滑难以提取深层特征. 为此, 提出端到端的自适应聚合功能网络模型, 通过大脑感兴趣区域(ROI)感知汇聚层, 利用自注意力机制动态构建FBN并学习节点特征, 增强了模型与子任务的交互能力. 同时引入节点池化机制筛选显著ROI, 进而推断出对于子任务较为重要的ROI. 该方法应用于注意力缺陷多动障碍(ADHD)的分类实验中, 实验结果表明该方法提高了ADHD的分类准确率, 对实验结果的解释性分析也验证了该方法的有效性.
摘要:
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型; 提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
货运列车在运行中表现出时变行为, 而静态机理模型难以捕捉这些变化, 导致优化结果与列车运行状态不相符. 此外, 不当的驾驶策略可能导致电力设备温度过高. 为此, 提出一种用于评估列车能耗与温度的动态建模方法, 并设计一种大规模自适应多策略多目标竞争群优化器(LA-MOCSO). 具体而言, 首先, 建立“列车−线路−电网”的机理模型, 用于计算多列车运行过程中的功率和网压; 提出一种融合机理模型、数据驱动模型和补偿模型的混合建模方法, 用于捕捉列车和环境的时变特征. 其次, 建立电力设备的温升模型, 并设计基于拉普拉斯变换的快速求解方法. 然后, 构建一个优化牵引供电系统能效与电力设备温度的多目标优化模型; 提出一种LA-MOCSO算法, 用于解决多列车长距离运行的大规模多目标优化问题. 最后, 实验验证了动态建模方法的有效性; 通过与四种经典算法的比较, 验证了所提算法的性能; 结果表明多列车综合优化方法可以降低变电所18.2%的能耗, 确保电力设备处于适宜的温度环境.
摘要:
考虑多移动机器人编队系统存在模型参数不确定、未知扰动和有限通信资源问题, 提出一种固定时间预定性能的事件触发编队控制方法. 首先, 设计新的固定时间干扰观测器以精确估计系统的复合扰动. 其次, 基于干扰观测器、预定性能函数、反步法和固定时间理论, 并考虑通信资源受限问题, 设计时变阈值事件触发的固定时间预定性能编队控制器, 使得编队误差在固定时间内收敛且满足预定性能要求. 所提出的触发机制可减少因控制器和执行器频繁通信造成的网络资源浪费, 且无Zeno行为发生. 最后, 通过对三个移动机器人进行编队仿真, 验证了所提方法的有效性.
考虑多移动机器人编队系统存在模型参数不确定、未知扰动和有限通信资源问题, 提出一种固定时间预定性能的事件触发编队控制方法. 首先, 设计新的固定时间干扰观测器以精确估计系统的复合扰动. 其次, 基于干扰观测器、预定性能函数、反步法和固定时间理论, 并考虑通信资源受限问题, 设计时变阈值事件触发的固定时间预定性能编队控制器, 使得编队误差在固定时间内收敛且满足预定性能要求. 所提出的触发机制可减少因控制器和执行器频繁通信造成的网络资源浪费, 且无Zeno行为发生. 最后, 通过对三个移动机器人进行编队仿真, 验证了所提方法的有效性.
摘要:
马尔科夫跳跃系统镇定过程常伴随通信信道堵塞、状态信息未知、时滞效应不全等问题. 基于此, 提出一种基于动态事件触发观测器的广义记忆异步滑模控制器. 其中动态事件触发观测器结合丢包补偿, 克服了已有文献单一考虑网络环境下频繁数据传输导致的通道堵塞问题. 针对观测时滞状态与控制器异步行为, 在滑模函数中引入时变时滞及其边界条件, 设计基于隐马尔科夫模型的广义记忆异步滑模控制器. 由于高效时滞利用率和多独立控制增益相互补偿, 闭环系统稳定性、收敛速度和超调等静态/动态性能较传统记忆/无记忆滑模控制器稳定提升. 同时, 为进一步耦合广义记忆控制时滞信息, 提出一组指数型反凸组合不等式, 通过预置指数型参数, 在不增加计算复杂度的前提下, 降低广义控制镇定条件保守性, 提升控制增益镇定精度. 最后通过数值算例和柔性机械臂实例验证了所提控制方案的有效性.
马尔科夫跳跃系统镇定过程常伴随通信信道堵塞、状态信息未知、时滞效应不全等问题. 基于此, 提出一种基于动态事件触发观测器的广义记忆异步滑模控制器. 其中动态事件触发观测器结合丢包补偿, 克服了已有文献单一考虑网络环境下频繁数据传输导致的通道堵塞问题. 针对观测时滞状态与控制器异步行为, 在滑模函数中引入时变时滞及其边界条件, 设计基于隐马尔科夫模型的广义记忆异步滑模控制器. 由于高效时滞利用率和多独立控制增益相互补偿, 闭环系统稳定性、收敛速度和超调等静态/动态性能较传统记忆/无记忆滑模控制器稳定提升. 同时, 为进一步耦合广义记忆控制时滞信息, 提出一组指数型反凸组合不等式, 通过预置指数型参数, 在不增加计算复杂度的前提下, 降低广义控制镇定条件保守性, 提升控制增益镇定精度. 最后通过数值算例和柔性机械臂实例验证了所提控制方案的有效性.
摘要:
针对水下采集的图像存在模糊、低对比度和颜色失真等低质量问题, 提出一种基于相对总变差统计线的水下图像快速增强方法. 首先, 采用线性拉伸的方法来校正图像的颜色信息, 消除颜色偏差并恢复图像的自然度. 其次, 基于大气散射模型, 结合图像的纹理信息构建水下图像的相对总变差统计线模型, 利用该模型准确估计图像深度图. 此外, 提出一种基于图像分块细分的水下背景光估计方法, 得到鲁棒的全局背景光估计值. 最后, 在估计的背景光和深度图基础上得到符合人眼感官视觉的水下增强图像. 实验结果表明, 所提方法不仅在主客观图像质量评价上具有明显优势, 而且在计算效率上优于现有的先进方法.
针对水下采集的图像存在模糊、低对比度和颜色失真等低质量问题, 提出一种基于相对总变差统计线的水下图像快速增强方法. 首先, 采用线性拉伸的方法来校正图像的颜色信息, 消除颜色偏差并恢复图像的自然度. 其次, 基于大气散射模型, 结合图像的纹理信息构建水下图像的相对总变差统计线模型, 利用该模型准确估计图像深度图. 此外, 提出一种基于图像分块细分的水下背景光估计方法, 得到鲁棒的全局背景光估计值. 最后, 在估计的背景光和深度图基础上得到符合人眼感官视觉的水下增强图像. 实验结果表明, 所提方法不仅在主客观图像质量评价上具有明显优势, 而且在计算效率上优于现有的先进方法.
摘要:
考虑未知外部输入无线传感器网络的约束分布式状态估计问题, 提出一种新型异步触发分布式滚动时域估计方法. 首先针对传感器网络节点的有限观测能力与资源约束, 设计基于异步事件触发机制的数据交互策略. 同时为抑制异步事件触发可能引入的最坏影响, 构建基于min-max优化的分布式滚动时域状态估计器. 其次, 通过松弛输入矩阵条件, 建立保证估计误差满足输入−状态稳定性的充分条件, 并利用该条件离线确定估计器参数. 进一步, 将状态估计器等价转化为基于线性矩阵不等式的凸规划问题, 减轻估计器在线计算负担. 最后, 通过对比实验验证了本文方法的优越性.
考虑未知外部输入无线传感器网络的约束分布式状态估计问题, 提出一种新型异步触发分布式滚动时域估计方法. 首先针对传感器网络节点的有限观测能力与资源约束, 设计基于异步事件触发机制的数据交互策略. 同时为抑制异步事件触发可能引入的最坏影响, 构建基于min-max优化的分布式滚动时域状态估计器. 其次, 通过松弛输入矩阵条件, 建立保证估计误差满足输入−状态稳定性的充分条件, 并利用该条件离线确定估计器参数. 进一步, 将状态估计器等价转化为基于线性矩阵不等式的凸规划问题, 减轻估计器在线计算负担. 最后, 通过对比实验验证了本文方法的优越性.
摘要:
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善了传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(\begin{document}$\mu=0.05$\end{document} )下, 自适应控制策略通过\begin{document}$0.061\;0 \;\text{m}$\end{document} 的质心高度调整, 在维持\begin{document}$1.428\;4 \text{ m/s}$\end{document} 运动速度的同时, 将足端滑动距离控制在\begin{document}$0.308 \pm 0.005\;0 \text{ cm}$\end{document} , 充分验证了所提控制方法的有效性和实用价值.
针对四足机器人在复杂环境中的高速稳定运动问题, 提出一种融合模型和学习的分层运动控制框架. 首先, 提出基于单次落足点偏差的惩罚机制, 实现对连续滑动状态的有效评估. 其次, 构建基于双曲正切函数的连续接触状态描述, 显著改善了传统离散方法中的相位切换冲击问题. 然后, 设计基于LSTM的地面特性实时估计网络, 实现质心位置的自适应调整. 最后, 提出基于执行层和决策层的分层控制框架, 提高系统的环境适应能力. 在Isaac Gym仿真环境中的实验表明, 该控制方法能够适应不同摩擦系数和运动速度条件. 特别是在极低摩擦环境(
摘要:
航空航天、海洋舰船、轨道交通等领域的重大装备制造在服务于国家重大需求、引领国民经济发展与保障国防安全中占据举足轻重的作用. 传统人工加工一致性差、效率低, 专机加工工作空间受限、柔性不足, 车间加工协同性弱、智能化程度低, 这些都难以满足大型化、多品种的柔性制造需求. 集群机器人协同制造利用生物集群的智能协作机理, 能在大型复杂场景中不断拓展并优化各类作业的执行能力, 克服传统制造模式中的不足, 实现制造过程的高效协同和智能制造. 数字孪生技术作为新兴制造技术, 为集群机器人协同制造系统的构建部署、虚拟调试、智能感知、通信协作、调度规划和协同控制等方面提供技术集成方案和工具链支撑, 能有效提升制造系统的效率, 保障制造过程安全性. 本文详细介绍数字孪生技术的研究背景与意义、国内外研究现状、关键技术及应用和发展趋势, 并以自主研发的一套面向飞机壁板装配的集群机器人数字孪生系统为例进行具体分析. 本文对于了解数字孪生在制造领域的技术方案和工具体系以及数字孪生在重大装备集群机器人协同制造方面的应用研究具有参考价值.
航空航天、海洋舰船、轨道交通等领域的重大装备制造在服务于国家重大需求、引领国民经济发展与保障国防安全中占据举足轻重的作用. 传统人工加工一致性差、效率低, 专机加工工作空间受限、柔性不足, 车间加工协同性弱、智能化程度低, 这些都难以满足大型化、多品种的柔性制造需求. 集群机器人协同制造利用生物集群的智能协作机理, 能在大型复杂场景中不断拓展并优化各类作业的执行能力, 克服传统制造模式中的不足, 实现制造过程的高效协同和智能制造. 数字孪生技术作为新兴制造技术, 为集群机器人协同制造系统的构建部署、虚拟调试、智能感知、通信协作、调度规划和协同控制等方面提供技术集成方案和工具链支撑, 能有效提升制造系统的效率, 保障制造过程安全性. 本文详细介绍数字孪生技术的研究背景与意义、国内外研究现状、关键技术及应用和发展趋势, 并以自主研发的一套面向飞机壁板装配的集群机器人数字孪生系统为例进行具体分析. 本文对于了解数字孪生在制造领域的技术方案和工具体系以及数字孪生在重大装备集群机器人协同制造方面的应用研究具有参考价值.
摘要:
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行−评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保了闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证了所提方法的有效性.
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统, 研究基于强化学习的有限时间最优输出调节问题. 首先, 根据调节器方程可解条件和坐标变换, 将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题. 接着利用径向基神经网络去逼近未知非线性函数, 设计具有内模的高增益神经网络自适应观测器去估计不可测的状态, 引入Nussbaum函数来解决控制方向未知问题. 然后, 设计基于神经网络观测器和Nussbaum函数的新的自适应内模, 提出与内模相关的代价函数, 并且在反步法中运用基于强化学习中的执行−评价网络的近似最优算法, 保证了虚拟控制器为最优, 同时结合动态面技术避免反步法中的“复杂度爆炸”问题. 最后, 通过所设计的最优自适应有限时间输出反馈控制器, 不仅使得提出的价值函数达到最优, 而且还确保了闭环系统的信号半全局实际有限时间稳定, 且跟踪误差在期望的任意精度内. 数值仿真验证了所提方法的有效性.
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
摘要:
工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络, 是实现工业网络系统泛在感知的重要基石. 通过支持边缘计算层和现场设备层之间的交互和物联, 工业视频网络将独立的视觉传感器单元无线连接、边缘处理, 以实现空间分散下的协作监控和精确感知. 它具有感知维度高, 网络动态性强, 感知与传输、计算、存储紧密耦合等突出特性. 如何在计算、网络、存储资源受限环境下实现终端压缩提纯、边缘协作处理、云端敏捷分析, 是这类系统研究的新挑战. 本文首先简述工业视频网络的定义和主要特征; 其次分析工业视频网络智能感知面临的挑战和关键问题; 然后综述基于边缘计算的工业视频网络智能感知关键技术的研究进展; 最后对工业视频网络智能感知的未来研究方向和潜在应用前景进行总结和展望.
工业视频网络是由工业网络系统现场层的视觉感知终端组成的网络, 是实现工业网络系统泛在感知的重要基石. 通过支持边缘计算层和现场设备层之间的交互和物联, 工业视频网络将独立的视觉传感器单元无线连接、边缘处理, 以实现空间分散下的协作监控和精确感知. 它具有感知维度高, 网络动态性强, 感知与传输、计算、存储紧密耦合等突出特性. 如何在计算、网络、存储资源受限环境下实现终端压缩提纯、边缘协作处理、云端敏捷分析, 是这类系统研究的新挑战. 本文首先简述工业视频网络的定义和主要特征; 其次分析工业视频网络智能感知面临的挑战和关键问题; 然后综述基于边缘计算的工业视频网络智能感知关键技术的研究进展; 最后对工业视频网络智能感知的未来研究方向和潜在应用前景进行总结和展望.
摘要:
本文研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题. 该问题中每个智能体的局部目标函数具有复合结构: 其一为梯度信息不可获取的时变损失函数, 其二为具有特定结构的正则化项. 为应对网络带宽的受限, 设计具有控制因子的边缘动态事件触发通信协议, 以降低通信开销. 同时, 针对局部损失函数梯度信息难以获取的挑战, 分别引入单点和两点梯度估计方法, 以支撑损失函数梯度信息的获取. 基于此, 结合近端算子, 分别设计仅要求加权邻接矩阵满足行随机性质的在线分布式复合单点和两点Bandit优化算法, 并使用动态遗憾指标分析两种算法的收敛性. 结果表明, 在合理的假设和参数设定下, 两种算法在期望意义下分别可获得\begin{document}${\cal{O}}({K^\frac{3}{4}}(1+{{\cal{P}}_K}))$\end{document} 和\begin{document}${\cal{O}}({K^\frac{1}{2}}(1+{{\cal{P}}_K}))$\end{document} 的动态遗憾上界, 其中\begin{document}$K$\end{document} 是总迭代次数, \begin{document}${\cal{P}}_K$\end{document} 是路径变差度量. 进一步, 当\begin{document}${\cal{P}}_K$\end{document} 能够被提前估计时, 两种算法分别可获得\begin{document}${\cal{O}}({K^\frac{3}{4}}\sqrt{1+{{\cal{P}}_K}})$\end{document} 和\begin{document}${\cal{O}}({K^\frac{1}{2}}\sqrt{1+{{\cal{P}}_K}})$\end{document} 的期望动态遗憾上界. 最后, 通过对在线分布式岭回归问题的仿真实验, 验证了算法的收敛性以及理论结果的正确性.
本文研究带宽受限的非平衡有向多智能体网络环境下的在线分布式复合Bandit优化问题. 该问题中每个智能体的局部目标函数具有复合结构: 其一为梯度信息不可获取的时变损失函数, 其二为具有特定结构的正则化项. 为应对网络带宽的受限, 设计具有控制因子的边缘动态事件触发通信协议, 以降低通信开销. 同时, 针对局部损失函数梯度信息难以获取的挑战, 分别引入单点和两点梯度估计方法, 以支撑损失函数梯度信息的获取. 基于此, 结合近端算子, 分别设计仅要求加权邻接矩阵满足行随机性质的在线分布式复合单点和两点Bandit优化算法, 并使用动态遗憾指标分析两种算法的收敛性. 结果表明, 在合理的假设和参数设定下, 两种算法在期望意义下分别可获得
摘要:
城市污水处理过程非均匀采样使数据呈现不连续性及稀疏性, 难以实现稳定控制. 为了解决该问题, 文中提出了一种非均匀采样预测控制方法. 首先, 建立了一种城市污水处理过程增广式动态线性化模型, 实现了非均匀采样城市污水处理关键过程变量的准确预测. 其次, 设计了基于控制增益优化策略的预测控制器, 实现了非均匀采样城市污水处理关键过程变量的稳定控制. 最后, 分析了非均匀采样预测控制方法的稳定性. 将所提控制方法应用于城市污水处理过程基准仿真平台, 实验结果显示该方法能够实现城市污水处理过程的稳定控制.
城市污水处理过程非均匀采样使数据呈现不连续性及稀疏性, 难以实现稳定控制. 为了解决该问题, 文中提出了一种非均匀采样预测控制方法. 首先, 建立了一种城市污水处理过程增广式动态线性化模型, 实现了非均匀采样城市污水处理关键过程变量的准确预测. 其次, 设计了基于控制增益优化策略的预测控制器, 实现了非均匀采样城市污水处理关键过程变量的稳定控制. 最后, 分析了非均匀采样预测控制方法的稳定性. 将所提控制方法应用于城市污水处理过程基准仿真平台, 实验结果显示该方法能够实现城市污水处理过程的稳定控制.
摘要:
生物制药在保障国计民生和国家安全方面发挥着至关重要的作用, 加快机器人技术、人工智能与生物医学的深度融合, 对于提升新药研发效率、应对公共卫生危机具有重要意义. 在生化实验室中, 随着新药制备流程日益复杂, 机器人技术在高精度液体处理、样品分析和实验自动化等关键操作中发挥着至关重要的作用. 然而, 现有机器人技术在环境感知、协同工作以及动态适应能力等方面仍存在局限性. 近年来, 深度学习、跨模态感知和大模型等领域的快速发展, 使得机器人在复杂生化实验室场景中的应用前景愈加广阔. 本文从智能生化实验室的具体需求出发, 重点探讨机器人在环境感知、任务与运动规划以及协同控制等关键技术的最新进展. 随后, 列举国内外在智能生化实验室领域的应用案例, 深入分析机器人技术在实验室环境中的实际应用现状. 最后, 总结智能生化实验室的技术发展趋势及面临的挑战, 为未来研究方向提供参考.
生物制药在保障国计民生和国家安全方面发挥着至关重要的作用, 加快机器人技术、人工智能与生物医学的深度融合, 对于提升新药研发效率、应对公共卫生危机具有重要意义. 在生化实验室中, 随着新药制备流程日益复杂, 机器人技术在高精度液体处理、样品分析和实验自动化等关键操作中发挥着至关重要的作用. 然而, 现有机器人技术在环境感知、协同工作以及动态适应能力等方面仍存在局限性. 近年来, 深度学习、跨模态感知和大模型等领域的快速发展, 使得机器人在复杂生化实验室场景中的应用前景愈加广阔. 本文从智能生化实验室的具体需求出发, 重点探讨机器人在环境感知、任务与运动规划以及协同控制等关键技术的最新进展. 随后, 列举国内外在智能生化实验室领域的应用案例, 深入分析机器人技术在实验室环境中的实际应用现状. 最后, 总结智能生化实验室的技术发展趋势及面临的挑战, 为未来研究方向提供参考.
摘要:
在开放交通场景, 智能网联汽车仍然存在安全可信性弱、交互属性不足等关键瓶颈问题. 随着人工智能(AI)的发展和深度学习的突破, AI模型在自动驾驶领域取得了显著成果, 可以应用于自动驾驶中的场景理解和推理. 本文对基于信息融合的智能网联汽车安全交互决策研究进行综述, 首先梳理开放场景交通感知和理解方面的研究, 然后探讨具有社会交互属性的决策规划模型, 最后总结针对AI模型幻觉的安全验证技术, 通过结合三方面研究, 充分利用AI模型的强大能力实现“熟练司机”驾驶技能, 并讨论安全保障技术, 弥补AI模型“偶尔犯错”的不足, 有望解决自动驾驶安全长尾问题, 进一步推动自动驾驶技术的发展.
在开放交通场景, 智能网联汽车仍然存在安全可信性弱、交互属性不足等关键瓶颈问题. 随着人工智能(AI)的发展和深度学习的突破, AI模型在自动驾驶领域取得了显著成果, 可以应用于自动驾驶中的场景理解和推理. 本文对基于信息融合的智能网联汽车安全交互决策研究进行综述, 首先梳理开放场景交通感知和理解方面的研究, 然后探讨具有社会交互属性的决策规划模型, 最后总结针对AI模型幻觉的安全验证技术, 通过结合三方面研究, 充分利用AI模型的强大能力实现“熟练司机”驾驶技能, 并讨论安全保障技术, 弥补AI模型“偶尔犯错”的不足, 有望解决自动驾驶安全长尾问题, 进一步推动自动驾驶技术的发展.
摘要:
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
城市固废焚烧(MSWI)过程中固有的非线性、时变性和不确定性导致领域专家需要凭借经验通过高频率手动干预进行炉膛温度控制. 针对上述问题, 为模拟专家的自适应机制, 提出了基于强化学习的比例−积分−微分(PID)自整定控制策略, 即采用共享机制区间二型模糊宽度学习系统(IT2FBLS)拟合Actor-critic网络(ACN)进行PID参数优化. 首先, 采用共享机制IT2FBLS拟合ACN以克服焚烧过程的不确定性、减少计算消耗和确保紧凑的网络结构; 然后, 利用基于时间差分误差的梯度下降法更新ACN参数以实现快速学习; 最后, 利用李雅普诺夫第二法, 证明Actor-critic算法的收敛性和控制过程的稳定性. 通过MSWI过程的实际运行数据仿真验证了该方法的有效性.
摘要:
几何滤波是一种利用观测数据对流形上几何状态进行最优估计的方法, 对刚体位姿估计具有重要作用和意义. 针对非高斯条件下几何滤波性能下降的问题, 提出一种基于广义最大相关熵准则(Generalized maximum correntropy criterion, GMCC)的几何滤波方法. 首先, 根据流形上几何状态演化关系, 采用流形无迹变换进行状态预测. 其次, 为抑制非高斯噪声引起的不利影响, 将广义最大相关熵准则推广到流形上, 实现对预测状态的修正来提高滤波的鲁棒性. 然后, 针对由GMCC引出的流形非线性优化问题, 设计了流形上的统计线性化方法, 以及采用黎曼流形优化和定点迭代法求解优化问题. 特别地, 设计了一种广义高斯核参数自适应调整策略, 以在线调整广义相关熵的超参数. 最后, 仿真结果表明, 相较于现有方法, 所提方法具有更高的精度和鲁棒性.
几何滤波是一种利用观测数据对流形上几何状态进行最优估计的方法, 对刚体位姿估计具有重要作用和意义. 针对非高斯条件下几何滤波性能下降的问题, 提出一种基于广义最大相关熵准则(Generalized maximum correntropy criterion, GMCC)的几何滤波方法. 首先, 根据流形上几何状态演化关系, 采用流形无迹变换进行状态预测. 其次, 为抑制非高斯噪声引起的不利影响, 将广义最大相关熵准则推广到流形上, 实现对预测状态的修正来提高滤波的鲁棒性. 然后, 针对由GMCC引出的流形非线性优化问题, 设计了流形上的统计线性化方法, 以及采用黎曼流形优化和定点迭代法求解优化问题. 特别地, 设计了一种广义高斯核参数自适应调整策略, 以在线调整广义相关熵的超参数. 最后, 仿真结果表明, 相较于现有方法, 所提方法具有更高的精度和鲁棒性.
摘要:
在小样本目标检测领域, “训练和微调”两阶段表征学习范式因学习策略简单, 应用广泛. 然而, 通过探索性实验发现, 基于该范式的模型容易将新类别实例错误地分类为背景类, 从而降低了对新类的识别能力. 为了解决这一问题, 提出构造一个正则化分类器, 并使用“最小化背景判别性知识的调节器 (Background discriminative knowledge minimizing regulator, BDKMR)”来引导分类器训练. BDKMR通过“最小化背景判别性知识的交叉\begin{document}$l_p $\end{document} 正则项(Background discriminative knowledge minimizing cross-\begin{document}$l_p $\end{document} regularization, BMCR)”显式地减少背景判别性知识对构建新类分类器的干扰, 并利用“权重范数管理器(Weight norm manager, WNM)”调节分类器中各类别的权重范数, 以提高模型对新类别的关注度, 同时降低其对背景类别的偏好. 此外, 考虑到 BDKMR 可能改变特征空间分布, 提出“分类器解耦模块(Decoupled box classifier, DBC)”, 以调控模型微调过程中正则化分类器对特征提取器学习的影响. 多个数据集上的实验结果表明, 所提出的方法能够有效减少模型对新类实例的错误分类, 进而显著提升对新类的检测性能.
在小样本目标检测领域, “训练和微调”两阶段表征学习范式因学习策略简单, 应用广泛. 然而, 通过探索性实验发现, 基于该范式的模型容易将新类别实例错误地分类为背景类, 从而降低了对新类的识别能力. 为了解决这一问题, 提出构造一个正则化分类器, 并使用“最小化背景判别性知识的调节器 (Background discriminative knowledge minimizing regulator, BDKMR)”来引导分类器训练. BDKMR通过“最小化背景判别性知识的交叉
摘要:
城市固废焚烧(MSWI)已成为解决城市环境问题并实现可再生能源循环利用的主流技术, 其对应系统具有参数多、耦合性强、非线性显著等特性, 需采用先进过程控制(APC)技术以确保平稳运行. 本文进行面向MSWI过程神经网络控制(NNC)综述以弥补该领域的缺失和促进深入研究. 首先, 描述典型MSWI过程工艺, 分析其控制问题与控制目标, 明确控制复杂性, 概述NNC及其优势. 其次, 综述面向控制的机理与数据驱动焚烧炉模型. 随后, 简要分析和介绍非NNC控制器设计在MSWI过程的研究现状. 接着, 详细综述面向NNC的浅层和模糊控制器设计, 网络参数、网络结构和事件触发在线更新算法以及稳定性分析的研究现状, 并进行控制性能分析. 然后, 展望未来研究方向. 最后, 给出结论.
城市固废焚烧(MSWI)已成为解决城市环境问题并实现可再生能源循环利用的主流技术, 其对应系统具有参数多、耦合性强、非线性显著等特性, 需采用先进过程控制(APC)技术以确保平稳运行. 本文进行面向MSWI过程神经网络控制(NNC)综述以弥补该领域的缺失和促进深入研究. 首先, 描述典型MSWI过程工艺, 分析其控制问题与控制目标, 明确控制复杂性, 概述NNC及其优势. 其次, 综述面向控制的机理与数据驱动焚烧炉模型. 随后, 简要分析和介绍非NNC控制器设计在MSWI过程的研究现状. 接着, 详细综述面向NNC的浅层和模糊控制器设计, 网络参数、网络结构和事件触发在线更新算法以及稳定性分析的研究现状, 并进行控制性能分析. 然后, 展望未来研究方向. 最后, 给出结论.
摘要:
情感计算作为人机交互领域的一个重要学科分支, 是实现和谐、自然的人机交互体验的关键保障. 如何利用便于获得的生理信号进行准确的情绪识别已成为了其中的热门话题. 广泛使用的情绪模型通常从愉悦维、唤醒维、支配维等多个维度描述情绪, 但现有情绪识别方法大多将不同维度分别考虑, 忽略了维度间的相关性关系, 并且在可解释性方面存在局限. 多标签TSK模糊系统虽然能够弥补以上不足, 但仍面临高维输入下模糊规则构建困难、训练效率低下的问题. 此外, 多模态生理信号具有较大的个体差异性, 严重影响了跨用户情绪识别的准确性. 本文首先提出了规则降维的多标签TSK模糊系统(RDR-MLTSK), 以优化模糊系统结构和训练效率; 进一步提出了多标签模糊域适应算法(MLFDA)实现多源域迁移学习, 提高了RDR-MLTSK的泛化性能. 在DEAP和DECAF两个公开数据集上的实验结果表明, 所提出的方法能有效提高情绪识别的准确率, 与经典和先进的方法相比具有更好的性能.
情感计算作为人机交互领域的一个重要学科分支, 是实现和谐、自然的人机交互体验的关键保障. 如何利用便于获得的生理信号进行准确的情绪识别已成为了其中的热门话题. 广泛使用的情绪模型通常从愉悦维、唤醒维、支配维等多个维度描述情绪, 但现有情绪识别方法大多将不同维度分别考虑, 忽略了维度间的相关性关系, 并且在可解释性方面存在局限. 多标签TSK模糊系统虽然能够弥补以上不足, 但仍面临高维输入下模糊规则构建困难、训练效率低下的问题. 此外, 多模态生理信号具有较大的个体差异性, 严重影响了跨用户情绪识别的准确性. 本文首先提出了规则降维的多标签TSK模糊系统(RDR-MLTSK), 以优化模糊系统结构和训练效率; 进一步提出了多标签模糊域适应算法(MLFDA)实现多源域迁移学习, 提高了RDR-MLTSK的泛化性能. 在DEAP和DECAF两个公开数据集上的实验结果表明, 所提出的方法能有效提高情绪识别的准确率, 与经典和先进的方法相比具有更好的性能.
摘要:
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法大量涌现, 在帧间对齐、信息传播等方面取得突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理现有的视频超分辨率重建的公共数据集及相关算法; 接着, 详细综述基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结视频超分辨率重建算法面临的挑战及未来的发展趋势.
视频超分辨率重建(Video super-resolution, VSR)是底层计算机视觉任务中的一个重要研究方向, 旨在利用低分辨率视频的帧内和帧间信息, 重建具有更多细节和内容一致的高分辨率视频, 有助于提升下游任务性能和改善用户观感体验. 近年来, 基于深度学习的视频超分辨率重建算法大量涌现, 在帧间对齐、信息传播等方面取得突破性的进展. 在简述视频超分辨率重建任务的基础上, 梳理现有的视频超分辨率重建的公共数据集及相关算法; 接着, 详细综述基于深度学习的视频超分辨率重建算法的创新性工作进展情况; 最后, 总结视频超分辨率重建算法面临的挑战及未来的发展趋势.
摘要:
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
聚焦于生物结构与类脑智能的交叉研究方向, 探讨前额叶皮层的结构及其认知功能对人工智能领域Transformer模型的启发. 前额叶皮层在认知控制和决策制定中扮演着关键角色. 首先介绍前额叶皮层的注意力机制、生物编码、多感觉融合等相关生物研究进展, 然后探讨这些生物机制如何启发新型的类脑Transformer架构, 重点提升其在自注意力、位置编码、多模态整合等方面的生物合理性与计算高效性. 最后, 总结前额叶皮层启发的类脑新模型, 在支持多类型神经网络组合、多领域应用、世界模型构建等方面的发展与潜力, 为生物和人工智能两大领域之间交叉融合构建桥梁.
摘要:
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
图像扩增是工业外观检测中常用的数据处理方法, 有助于提升检测模型泛化性, 避免过拟合. 根据扩增结果的不同来源, 将当前工业图像扩增方法分为基于传统变换和基于模型生成两类. 基于传统变换的扩增方法包括基于图像空间和特征空间两类; 根据模型输入条件信息的不同, 基于模型生成的方法分为无条件、低维条件和图像条件三类. 对相关方法的原理、应用效果、优缺点等进行分析, 重点介绍基于生成对抗网络、扩散模型等模型生成的扩增方法. 依据扩增结果的标注类型和方法的技术特点, 对三类基于模型生成方法的相关文献进行分类统计, 通过多维表格阐述各类方法的研究细节, 对其基础模型、评价指标、扩增性能等进行综合分析. 最后, 总结当前工业图像扩增领域存在的挑战, 并对未来发展方向进行展望.
摘要:
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
视频插帧技术是视频处理领域的研究热点问题. 它通过生成中间帧来提高视频的帧率, 从而使视频播放更加流畅, 在老视频修复、电影后期制作和慢动作生成等领域发挥着重要的作用. 随着深度学习技术的迅猛发展, 基于深度学习的视频插帧技术已经成为主流. 本文全面综述现有的基于深度学习的视频插帧工作, 并且深入分析这些方法的优点与不足. 随后, 详细介绍视频插帧领域的常用数据集, 这些数据集为视频插帧相关研究和算法训练提供重要支撑. 最后, 对当前视频插帧研究中仍然存在的挑战进行深入思考, 并且从多个角度展望未来的研究方向, 旨在为该领域后续的发展提供参考.
摘要:
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
针对一类不确定非线性系统, 提出了一种基于高斯过程的在线学习控制方法. 该方法首先通过障碍函数间接设定系统状态的运行区域. 其次, 在该区域内在线采集量测数据, 利用高斯过程回归对系统中未知非线性动态进行学习. 然后通过Lyapunov稳定理论, 证明了所提在线学习控制算法可保证闭环系统所有信号的有界性. 与基于径向基神经网络(Radial basis function neural networks, RBFNNs) 的自适应控制方案相比, 所提控制算法无需精确给出系统状态的运行区域及预先分配径向基函数中心值. 最后, 通过数值仿真与Franka Emika Panda 协作机械臂关节控制实验, 验证了控制算法的有效性与先进性.
, 最新更新时间
, doi: 10.16383/j.aas.c230210
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电, 辅助消纳可再生能源的能力, 对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助可再生能源的消纳能力, 本文根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力; 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈; 非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标. 根据以上分析分别给出了进一步的研究内容.
, 最新更新时间
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
, 最新更新时间
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
, 最新更新时间
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
摘要:
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.
针对一类系统动态未知且受互联项影响的非线性互联大规模系统, 提出一种新的在线分散式动态事件触发控制(Dynamic event-triggered control, DETC)方案. 首先, 构建基于神经网络的辨识器来重构互联系统的未知内部动态. 其次, 使用自适应评判网络在事件触发机制下学习近似最优控制策略. 在所设计的动态事件触发控制机制下, 各子系统独立地设计自己的控制策略, 且各控制策略的更新是异步进行的. 也就是说, 各个分散式事件触发条件和控制器仅依赖于各自子系统的局部状态信息, 而无需频繁获取相邻子系统的信息, 从而规避通过通信网络在子系统间传递状态信息的需求. 然后, 借助李雅普诺夫稳定性定理, 从理论上证明所提出的闭环控制系统状态和评判网络权值估计误差都是最终一致有界的. 最后, 通过一个数值仿真示例和一个实际工程示例验证了所提出的动态事件触发控制方法的有效性和实用性.