2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
显示方式:
目录
目录
2025, 51(10).  
[封面浏览] [PDF 5782KB](2)
序言
智能化时代的复杂系统控制与决策—黄琳院士90华诞专刊序言
段志生, 邹云, 董海荣, 李忠奎, 杨莹, 王金枝
2025, 51(10): 2131-2134.   doi: 10.16383/j.aas.c202510 cstr: 32138.14.j.aas.c202510
[摘要](19) [HTML全文](4) [PDF 703KB](6)
综述
智能赋能航班化航天运输系统发展与思考
包为民
2025, 51(10): 2135-2146.   doi: 10.16383/j.aas.c250176 cstr: 32138.14.j.aas.c250176
[摘要](59) [HTML全文](33) [PDF 10358KB](5)
摘要:
发展航班化航天运输系统已成为提升航天运输能力的重要途径, 智能技术将为航班化航天运输系统建设发挥重要赋能作用. 通过梳理航天运输系统的发展现状与趋势, 分析智能化时代下的航班化航天运输形态, 形成智能赋能航天运载器、智能赋能运营管理体系、智能赋能研发保障生态三方面智能应用需求, 结合国内外研究进展提出对航班化航天运输系统智能赋能路径方法的发展思考, 最后总结并展望智能赋能航班化航天运输系统的发展方向.
飞机总装的现场级工业网络系统: 架构、关键技术及应用
关新平, 温晓婧, 金天恺, 王淑玲, 陈彩莲
2025, 51(10): 2147-2162.   doi: 10.16383/j.aas.c250157 cstr: 32138.14.j.aas.c250157
[摘要](206) [HTML全文](220) [PDF 15782KB](12)
摘要:
面对复杂系统装配对高精度、高时效协同的迫切需求, 飞机总装制造亟需构建具备感知−传输−控制一体化能力的现场级工业网络系统. 为此, 本文率先建立现场级网络控制系统容量模型, 提出双向融合−协同管控的工业互联网新型架构. 围绕感知、传输、计算与控制的全链条任务闭环, 系统构建多维时效性综合评价指标体系, 深入探索多域异构资源的联合调度与协同优化机制. 最后, 面向飞机总装过程中活动面动态测量与多工序协同优化, 设计并实现高保真数字孪生验证平台, 有效支撑了理论模型、控制策略与实际部署之间的闭环映射.
基于强化学习的流程工业智能决策研究与展望
黄慕轶, 朱佳雯, 戴鑫, 杜文莉, 钱锋
2025, 51(10): 2163-2177.   doi: 10.16383/j.aas.c250272 cstr: 32138.14.j.aas.c250272
[摘要](260) [HTML全文](254) [PDF 1217KB](23)
摘要:
流程工业是现代制造体系的重要组成部分, 其生产过程的优化决策直接关系到企业的经济效益与资源利用效率. 随着生产规模扩大与系统复杂性提升, 传统依赖机理建模或启发式规则的优化方法在应对高维耦合、非线性及不确定性等工业特性时逐渐显现出局限性. 强化学习因其无需依赖过程模型, 具备高效决策、自适应调整和应对不确定性的能力, 有望解决上述问题, 成为流程工业智能决策研究的重要方向. 然而, 流程工业中强化学习的落地应用仍面临诸多挑战, 如状态−动作空间维度庞大、结构多样, 过程约束复杂, 工况非平稳性强. 本文系统梳理强化学习在流程工业中的应用现状与关键技术, 重点讨论其在复杂决策空间、约束处理、大规模系统及不确定性环境中的算法演进与应用探索, 最后展望未来的发展趋势与潜在研究方向, 为复杂工业系统的智能优化提供理论基础与方法支撑.
控制系统隐私保护研究综述
王继民, 张纪峰, 陈嘉龙
2025, 51(10): 2178-2200.   doi: 10.16383/j.aas.c250082 cstr: 32138.14.j.aas.c250082
[摘要](653) [HTML全文](341) [PDF 1296KB](46)
摘要:
控制系统隐私保护是随着数字化、信息化和智能化的发展而诞生的新兴方向, 具有广泛的实际需求与应用价值, 是现代控制理论在新时代的重要发展. 鉴于此, 本综述从研究背景与意义、国内外现状、未来研究方向及总结与展望四个方面, 对该方向进行系统梳理. 控制系统隐私问题无处不在, 隐私保护对控制系统至关重要. 由于该方向具有交叉性、不确定性、实时性和应用性等特点, 其研究具有挑战性. 在国内外研究现状部分, 详细介绍基于系统结构的方法、基于确定性变换的方法和基于随机混淆或扰动的方法, 并着重阐述同态加密、安全多方计算、差分隐私等常见技术的理论基础及在控制系统中的应用. 针对面临的诸多挑战性问题, 总结未来重点研究方向, 尤其是隐私、控制与通信的一体化设计, 以及隐私保护与系统性能之间的权衡. 最后, 对该方向进行总结与展望, 旨在为相关研究人员提供参考, 进一步推动国家安全战略的实施.
精细抗干扰控制——从干扰不变性到适应可变性
谢一嘉, 李文硕, 朱玉凯, 崔洋洋, 郭雷
2025, 51(10): 2201-2210.   doi: 10.16383/j.aas.c250211 cstr: 32138.14.j.aas.c250211
[摘要](236) [HTML全文](118) [PDF 920KB](13)
摘要:
抗干扰是控制科学和智能科学的基本主题之一. 长期以来, 干扰不变性被视为抗干扰控制方法的一个设计准则. 然而, 干扰不变性设计带来的控制代价易被忽视, 且往往不满足执行机构和信息拓扑等系统软硬件限制. 本文在干扰不变性准则的基础上, 提出干扰适应可变性准则和设计思想. 主要实现途径包括: 干扰深耦合建模、干扰可抗/可用度量化、复合抗干扰控制、干扰主动和精细利用、基于抗扰能力量化的系统重构优化等. 在此基础上, 进一步提出系统进化设计、进化智能和智能系统工程的思想, 从“任务目标−干扰因素−系统资源”一体化的角度提高动态适配性, 实现闭环系统的行为进化和形态进化. 干扰适应可变性准则突破了传统干扰不变性准则的藩篱, 实现了从“抗干扰”到“识干扰”、“用干扰”的干扰精细控制理论跨越, 为精细抗干扰控制理论和智能系统工程实践提供了新的理论支撑、研究视角和技术途径.
集群协同任务规划的形式逻辑方法: 综述与展望
李忠奎, 王俊杰, 张云奕, 张硕, 国萌, 孙志勇
2025, 51(10): 2211-2231.   doi: 10.16383/j.aas.c250223 cstr: 32138.14.j.aas.c250223
[摘要](173) [HTML全文](116) [PDF 2206KB](19)
摘要:
由无人车、无人机等构成的无人集群系统在军民领域有着广泛应用. 任务规划作为集群的决策中枢, 面临时序冲突协调、大规模异构协同以及动态环境适应等多重挑战. 传统的混合整数优化方法在表达灵活性和实时求解方面存在明显不足, 而基于机器学习的规划方法则在可解释性与扩展性上存在固有局限. 近年来, 以线性时序逻辑和信号时序逻辑为代表的形式逻辑方法, 凭借任务描述准确完备、逻辑推理严谨和可解释性强等优势, 已成为集群任务建模与规划的重要手段. 本文系统回顾了基于形式逻辑的集群任务规划研究进展, 围绕基本语法语义、规划架构范式以及大规模和动态不确定环境下的适应机制等方面展开全面分析. 同时, 探讨大语言模型在自然语言任务理解、形式化任务建模及任务规划中的应用潜力. 最后, 展望非完备环境下的持续规划、集群任务与运动的联合规划以及形式逻辑与大语言模型融合的闭环规划等未来研究方向.
论文与报告
软件定义智能控制系统
柴天佑, 郑锐, 贾瑶, 黄新宇, 郑秀萍, 李智
2025, 51(10): 2232-2244.   doi: 10.16383/j.aas.c250274 cstr: 32138.14.j.aas.c250274
[摘要](113) [HTML全文](64) [PDF 4112KB](11)
摘要:
针对可编程逻辑控制器(PLC)和虚拟PLC的PID难以优化整定的难题, 将建模、控制、优化和深度学习与强化学习相结合, 提出无模型PID在线自优化整定算法. 将工业云及边缘计算、软件定义实时及可靠保障机制的双通道通信架构与所提出的PID整定算法相结合, 提出云端协同的软件定义智能控制系统. 云为基于云服务器的智能控制软件开发平台;端为基于工业服务器的智能控制软件. 智能控制软件包括虚拟PLC PID、PID预优化整定和控制过程数字孪生以及在线自优化整定、自适应切换机制. 采用研制的软件定义智能控制系统研究实验平台, 进行所提出的控制系统与国外先进PLC和工业PC的无模型整定软件PID控制系统的仿真与物理对比实验. 实验结果表明本文的软件定义智能控制系统可进行控制器参数自优化整定, 控制性能显著优于国外无模型整定软件的PID控制系统.
基于无模型策略梯度强化学习的未知随机系统最优控制
杜城龙, 韩洁, 李繁飙, 桂卫华
2025, 51(10): 2245-2255.   doi: 10.16383/j.aas.c250156 cstr: 32138.14.j.aas.c250156
[摘要](132) [HTML全文](114) [PDF 1259KB](11)
摘要:
针对一类未知动力学马尔科夫随机系统的最优控制问题, 提出两种无模型策略梯度强化学习算法. 首先, 针对模型信息部分未知的马尔科夫随机系统, 基于系统采样数据和耦合李雅普诺夫方程推导出无模型策略梯度的解析形式, 并提出一种部分无模型策略梯度强化学习最优控制算法, 实现对预设性能指标的直接最小化. 由于求解耦合李雅普诺夫方程和计算策略梯度的必要数据均可从系统采样数据同一轨迹提取, 而无需再额外收集采样数据, 降低了算法的采样复杂度. 进一步地, 为完全解除对马尔科夫随机系统模型信息的依赖, 通过随机摄动反馈增益估计策略梯度, 并提出一种完全无模型策略梯度强化学习算法, 实现了马尔科夫随机系统动力学完全未知情况下的最优控制. 最后, 通过仿真结果证明了本文所提两种无模型策略梯度强化学习最优控制算法的高效性与优越性.
大回归模型的自适应学习
戴瑞芬, 王芳, 郭雷
2025, 51(10): 2256-2268.   doi: 10.16383/j.aas.c250286 cstr: 32138.14.j.aas.c250286
[摘要](131) [HTML全文](95) [PDF 1205KB](13)
摘要:
随着信息技术的快速发展, 特别是计算能力和数据收集能力的持续提升, 利用大参数模型对复杂场景进行建模已成为显著的发展趋势. 然而, 关于一般反馈输入下此类模型的学习问题, 在控制系统领域却鲜有研究. 鉴于此, 针对饱和观测下的大回归模型, 设计一种在线扩展型自适应学习算法. 该算法可随着新数据的增加自动更新算法维数和计算结果, 在无需存储历史数据的前提下, 实现学习结果的动态调整与输出的实时预测. 具体而言, 在一般的非持续激励数据条件下证明了所提出算法的收敛性, 该结果可以适用于一般反馈控制系统. 此外, 在无需任何数据激励条件的情况下, 证明了所提出算法的预测“遗憾”具有良好的收敛性. 最后, 基于真实的故意伤害罪判决数据开展司法量刑预测实验, 检验了所提出算法的计算效率和预测精度.
基于MARL-MHSA架构的水下仿生机器人协同围捕策略: 数据驱动建模与分布式策略优化
冯育凯, 吴正兴, 谭民
2025, 51(10): 2269-2282.   doi: 10.16383/j.aas.c250086 cstr: 32138.14.j.aas.c250086
[摘要](309) [HTML全文](134) [PDF 4759KB](19)
摘要:
针对水下仿生机器人集群的围捕−逃逸问题, 提出一种融合多头自注意力机制的多智能体强化学习策略训练框架. 该框架构建一种基于多头自注意力机制的中心化决策网络, 在提升策略训练效率的同时, 保留分布式决策架构, 有效增强个体的自主决策能力与群体间的协同性能. 此外, 针对策略由仿真环境向真实场景迁移过程中动力学建模不精确、感知−动作存在偏差等挑战, 构建一种由真实场景机器鱼运动数据驱动的仿真环境, 有效提升了策略的可迁移性与部署的可靠性. 通过仿真与真实场景实验验证了所提方法在水下仿生机器人协同围捕任务中的有效性. 相较于多智能体近端策略优化算法, 该方法可使平均围捕成功率提升24.3%、平均围捕步长减少30.9%, 显著提升了水下仿生机器人集群的协同围捕效率. 该研究为多智能体强化学习在水下仿生机器人集群任务中的应用提供了新的思路和技术支持.
含动力学奖励的航天器编队深度强化学习控制
金伟成, 陈提, 胡海岩
2025, 51(10): 2283-2292.   doi: 10.16383/j.aas.c250202 cstr: 32138.14.j.aas.c250202
[摘要](108) [HTML全文](79) [PDF 2018KB](11)
摘要:
提出一种航天器编队的深度强化学习控制方法. 该方法通过引入动力学奖励, 考虑轨迹的动力学可行性并优化燃料消耗量. 在训练环境中, 引入\begin{document}$J_{2}$\end{document}摄动相对动力学模型, 基于近端策略优化算法, 将航天器的局部观测信息作为策略网络和评价网络的输入. 策略网络输出航天器的期望位置和速度, 结合动力学模型限制策略任意动作之间的转换控制, 使输出轨迹考虑动力学可行性. 评价网络基于局部观测信息估计由动力学模型限制的优势函数, 从而辅助策略网络更新参数. 进一步地, 以燃料消耗量的负数作为动力学奖励, 结合避撞和任务相关奖励后, 训练得到的策略网络在完成航天器编队任务的同时优化了燃料消耗.
带有输入时滞的非线性系统基于学习的输出反馈控制
刘思彤, 高伟男, 姜钟平
2025, 51(10): 2293-2301.   doi: 10.16383/j.aas.c250101 cstr: 32138.14.j.aas.c250101
[摘要](51) [HTML全文](49) [PDF 2629KB](1)
摘要:
针对具有输入时滞的非线性系统直接自适应最优控制问题, 提出一种新的数据驱动输出反馈控制方法. 该方法通过融合Q学习与值迭代和策略迭代, 在学习过程中无需依赖系统动力学知识. 在系统满足一致可观性的条件下, 提出一种基于输出数据和带有时滞的输入数据的系统状态重构方法, 基于值迭代和策略迭代来学习自适应最优控制策略. 最后, 将该方法应用于范德波尔振荡器这一经典非线性系统的控制, 并通过仿真结果充分验证了该方法的有效性.
基于条件扩散模型的卫星遥测数据缺失值插补方法
庞昭辰, 刘明, 张立宪, 曹喜滨, 段广仁
2025, 51(10): 2302-2312.   doi: 10.16383/j.aas.c250244 cstr: 32138.14.j.aas.c250244
[摘要](171) [HTML全文](122) [PDF 2567KB](5)
摘要:
卫星遥测时间序列数据在遥感监测、导航定位等领域具有重要应用价值, 同时也能有效监控卫星的健康状态. 然而, 这些数据常常因传感器故障、数据传输错误等复杂因素出现缺失, 严重影响数据的完整性和可用性, 甚至可能导致决策失误. 对此, 提出基于多变量条件扩散模型的卫星时间序列补全方法, 旨在提高卫星遥测数据缺失值插补的准确性. 首先, 通过引入条件扩散方法, 将观测到的卫星数据作为条件输入, 通过建模缺失值的后验分布来生成数据, 并在生成过程中对该残缺样本进行初步的线性插补, 从而提高模型的稳定性. 其次, 设计由时间注意力层和门控激活单元组成的残差模块作为主干预测网络, 对多维遥测数据中的时间依赖关系进行充分捕捉, 实现对缺失数据的精准重构. 最后, 在某通信卫星的动量轮遥测数据集以及公开的时间序列数据集上进行广泛实验. 实验结果表明, 所提方法在不同缺失率下均表现出良好的性能和泛化能力, 与现有方法相比, 展现出更高的准确性和稳定性.
旋转导向钻井工具系统实时测量的智能粒子滤波方法
盛立, 刘一凡, 高明, 周东华
2025, 51(10): 2313-2323.   doi: 10.16383/j.aas.c250136 cstr: 32138.14.j.aas.c250136
[摘要](66) [HTML全文](58) [PDF 3485KB](8)
摘要:
针对旋转导向钻井工具系统中工具面角的实时测量问题, 提出一种基于深度学习的智能粒子滤波算法. 首先, 针对粒子滤波中的粒子短缺与退化问题, 建立条件生成对抗网络(CGAN)引导的粒子选择机制. 在该机制中, 生成器网络通过对抗训练优化采样分布, 生成高质量粒子集; 判别器则评估生成粒子在真实后验分布中的概率值, 指导粒子权重计算. 其次, 针对井下复杂工况中存在的噪声协方差矩阵未知且时变问题, 设计基于深度残差网络(ResNet)的协方差矩阵估计器. 该模块与CGAN引导的粒子滤波以端到端的方式集成, 形成闭环优化系统. ResNet模块得益于粒子滤波算法中的模型信息, 并为粒子滤波提供协方差矩阵的估计. 最后, 在旋转导向钻井工具平台上进行实验. 结果表明所提算法能够有效解决工具面角的实时测量问题, 与已有算法相比具有更高的精度.
一类移动机械臂系统的鲁棒H 跟踪控制
孙倩, 郑琳铄, 张学文, 贾英民
2025, 51(10): 2324-2336.   doi: 10.16383/j.aas.c250151 cstr: 32138.14.j.aas.c250151
[摘要](112) [HTML全文](118) [PDF 2817KB](7)
摘要:
针对存在参数不确定性、外部扰动和输入饱和约束的移动机械臂跟踪控制问题, 提出一种基于自适应动态规划的鲁棒\begin{document}$H_{\infty} $\end{document}控制方案. 首先, 通过设计神经网络辨识器, 对跟踪误差动力学中的不确定性进行在线估计. 然后, 考虑外部扰动、目标运动扰动和辨识误差, 将鲁棒\begin{document}$H_{\infty} $\end{document}控制转化为零和博弈问题进行求解, 并在值函数中引入广义非二次泛函来处理输入饱和约束. 进一步, 构建评价网络逼近最优值函数, 获得近似最优控制律及最坏情况下的总扰动估计, 实现闭环系统跟踪误差和评价网络权值估计误差的一致最终有界. 仿真结果验证了所提方案的有效性.
面向电力系统快速频率响应的数据与模型驱动预测控制
吴卓睿, 张萌, 管晓宏
2025, 51(10): 2337-2346.   doi: 10.16383/j.aas.c250261 cstr: 32138.14.j.aas.c250261
[摘要](175) [HTML全文](116) [PDF 1584KB](15)
摘要:
维持频率稳定是电力系统控制的一个重要目标. 然而, 高渗透率新能源可能导致频繁的功率波动, 对系统频率调节造成不利影响. 为解决这一问题, 通常需要快速调节变流器资源的功率输出, 响应系统频率波动以实现快速频率控制. 针对电力系统快速频率控制, 提出一种数据与模型驱动的预测控制方法. 首先, 设计数据驱动的扰动观测器以估计负荷变化与新能源波动等系统扰动. 为优化控制性能, 利用基于神经网络设计的参考调节器为模型预测控制器提供虚拟参考. 通过学习长预测时域模型预测控制器, 参考调节器能够提升短预测时域控制器性能, 因而降低了所需的计算时间. 最终, 仿真对比结果表明所提方法能够有效提高频率控制性能.
网络攻击下多智能体系统攻击检测设计与分布式弹性控制
张文雨, 徐勇, 孙健, 陈杰
2025, 51(10): 2347-2358.   doi: 10.16383/j.aas.c250253 cstr: 32138.14.j.aas.c250253
[摘要](109) [HTML全文](54) [PDF 2155KB](14)
摘要:
提出一种集攻击检测与防御控制于一体的策略来研究执行器攻击下多智能体系统的弹性跟踪控制问题. 在攻击检测方面, 设计一种基于状态机的动态特征函数建模检测方案. 该方案提出采用线性函数观测器对执行器信号进行估计, 并依据实际信号与估计值之间的误差特性构建攻击检测准则, 以此实现对执行器攻击的有效检测. 在防御策略设计上, 为降低执行器攻击对系统跟踪共识性能的影响, 构建一种基于虚拟网络增强的协同控制系统. 该系统通过与领导者及各跟随者建立连接, 在执行器攻击信息未知的情况下, 确保系统能够实现弹性跟踪控制. 具体而言, 当检测到攻击发生时, 各跟随者的防御控制策略将切换至虚拟层提供的控制信号; 若未检测到攻击, 则维持各跟随者原有的实际控制信号. 与现有研究成果相比, 所设计的控制器无需预先获取恶意节点数量及攻击者位置等先验信息, 具有更强的实用性和适应性. 最后, 通过一个数值算例对所提出的理论算法进行验证, 结果表明该算法能够有效应对执行器攻击, 实现多智能体系统的弹性跟踪控制.
多智能体系统协同互估计与控制一体化框架
段志生, 吕跃祖, 段培虎, 杨莹, 王金枝, 温广辉
2025, 51(10): 2359-2370.   doi: 10.16383/j.aas.c250290 cstr: 32138.14.j.aas.c250290
[摘要](395) [HTML全文](191) [PDF 1992KB](35)
摘要:
尽管多智能体系统协同控制已有广泛研究, 现有分布式控制算法在个体传感器受损情况下仍存在性能下降问题. 提出一种协同互估计与控制一体化设计新框架, 通过充分利用个体传感器对其他智能体的测量信息, 提升多智能体系统协同控制的弹性能力. 首先, 对整个多智能体系统构建分布式传感网络模型. 其次, 基于既定的协同控制任务, 建立个体对整体控制输入的预测估计; 进一步设计全局整体测量输出的分布式一致性追踪估计器. 然后, 利用整体控制输入预测和整体测量输出追踪, 设计局部观测器实现整体状态估计. 此外, 将所提的一体化设计框架应用于线性多智能体系统协同一致性控制问题, 提出反馈增益的联合设计方法, 从理论上验证了所提框架的有效性. 仿真结果进一步表明, 该框架能够适用于多智能体系统部分传感器受损情形下的协同控制任务. 最后, 探讨协同互估计与控制一体化框架的未来研究方向.
本刊经同行评议拟录用的文章,目前在编校阶段,尚未确定卷期及页码,已有DOI。
显示方式:
高超声速飞行器基于Tube的鲁棒模型预测跟踪控制
姚秀明, 邢文龙, 韩一睿
当前状态:  doi: 10.16383/j.aas.c250279  cstr: 32138.14.j.aas.c250279
[摘要](0) [HTML全文](0)
摘要:
针对高超声速飞行器(Hypersonic flight vehicle, HFV)在未知环境干扰与执行器故障下的跟踪控制问题, 提出一种基于Tube的复合鲁棒模型预测控制方法. 首先, 基于非线性动态逆方法将高超声速飞行器纵向运动模型输入/输出线性化, 并实现了高度与速度控制回路的解耦. 随后, 结合Tube不变集理论推导鲁棒收紧约束, 并显式集成HFV的控制输入及其增量约束, 设计一种复合鲁棒模型预测控制策略. 此外, 还研究了所提方法的递归可行性, 同时基于Lyapunov稳定性理论严格证明控制策略的闭环稳定性. 最后, 仿真实验验证了所提方法的有效性.
混合动力电推进系统能量管理与分层优化控制策略研究
李建奇, 孙健, 杨涛, 曹斌芳, 唐一文, 鲁建权
当前状态:  doi: 10.16383/j.aas.c250174  cstr: 32138.14.j.aas.c250174
[摘要](12) [HTML全文](9)
摘要:
为了提高混合动力飞行器经济性并改善动力系统的动态性能, 提出一种混合动力分层控制的能量管理策略. 首先, 在顶层提出基于改进等效燃油消耗最小化的能量管理策略, 根据发电机组的燃油消耗特性、储能电池组的荷电状态以及等效惩罚因子动态调整发电机组的最优工作曲线, 从而获得最佳的燃油经济性. 在底层提出一种基于电流反馈的改进下垂控制策略, 负责管理电池组的充放电状态和维持直流母线电压的动态平衡, 同时实现飞行器的经济性与动态响应的协同控制, 达到对混合电推进飞行器能量的动态优化管理的目的. 最后, 通过基于RT-LAB的混合动力系统硬件在环实验平台验证该能量管理策略的有效性.
合作−竞争广义不确定异构多智能体系统的二分输出一致
张捷, 姚瑶, 王健安, 丁大伟, 李晓磊, 李志强
当前状态:  doi: 10.16383/j.aas.c240750  cstr: 32138.14.j.aas.c240750
[摘要](11) [HTML全文](4)
摘要:
针对符号有向图下合作−竞争广义不确定异构多智能体系统的二分输出一致问题, 基于协同鲁棒输出调节原理提出新型分布式控制算法, 使得具有竞争关系和不同动态的两组智能体能够分别跟踪幅值相等、符号相反的外系统输出.首先, 为了实现对不确定系统参数的动态补偿, 引入基于外系统观测器的动态内模补偿器, 进而设计分布式状态反馈控制协议. 区别于传统协同输出调节问题, 通过将二分一致性问题转化为增广闭环广义系统的稳定性问题, 证明了在不依赖广义调节方程精确解的情况下, 提出的控制器能够实现小范围参数摄动下的二分输出跟踪. 其次, 在状态不可获知条件下, 通过重构动态内模补偿器, 设计了分布式二分输出反馈控制协议. 最后, 通过仿真算例证明了所提出的分布式协同控制算法的有效性.
面向源网荷的智能化数据协同推断技术研究综述
张辉, 颜星雨, 毛建旭, 别克扎提·巴合提, 杜瑞, 王耀南
当前状态:  doi: 10.16383/j.aas.c250203  cstr: 10.16383/j.aas.c250203
[摘要](37) [HTML全文](31)
摘要:
随着可再生能源并网比例的持续提升, 风电、光伏等新能源发电形式对电力系统的稳定性与调度智能化提出更高要求. 源网荷储一体化背景下, 如何高效利用多源异构电力数据实现精准预测与协同分析, 已成为关键问题. 近年来, 深度学习、大数据、大模型等技术推动智能化推断技术取得飞跃式进展. 本文首先结合深度学习技术, 对时间序列数据协同推断共性技术研究现状进行阐述, 重点分析趋势−季节性分解、频域建模、外生变量融合等关键方法, 分析基于不同架构的时间序列模型的研究现状. 其次针对源网荷智能化关键技术进行阐述, 进一步梳理源网荷储系统中智能预测、状态评估与负荷调度等典型场景中的关键技术路径, 并对其具体应用场景进行分析. 最后, 结合日益复杂的电力系统背景, 对数据协同推断技术的发展方向进行展望.
多星接管目标的分布式近似最优姿态跟踪控制
王孟磊, 吴宝林, 耿云海
当前状态:  doi: 10.16383/j.aas.c240765  cstr: 32138.14.j.aas.c240765
[摘要](46) [HTML全文](40)
摘要:
在多服务星对失效航天器进行姿态接管控制的在轨服务任务中, 考虑惯量矩阵未知和执行机构饱和的情况, 基于自适应动态规划(ADP)方法提出一种分布式姿态跟踪接管控制策略. 首先, 通过对姿态系统的建模分析, 设计一种含有力矩饱和约束和期望力矩补偿的值函数, 在ADP框架下, 用一组基函数逼近最优值函数, 并得到分布式近似最优姿态跟踪控制策略; 然后, 为避免使用角加速度信息, 分别构建关于惯量参数和权重参数的滤波形式的线性回归模型, 根据并行学习方法、参数一致性算法和离线策略轨迹, 设计惯量参数自适应辨识律和权重更新律; 接着使用李雅普诺夫方法证明姿态跟踪误差、惯量矩阵辨识误差和权重参数估计误差的一致最终有界; 最后, 仿真结果验证了分布式跟踪控制方法在力矩饱和约束下对姿态跟踪和惯量矩阵辨识的有效性.
“结构−内容”框架下融合时空特征的技术预测模型
袭希, 许伟, 刘传斌, 刘玮倩, 苏忻洁
当前状态:  doi: 10.16383/j.aas.c250094  cstr: 32138.14.j.aas.c250094
[摘要](84) [HTML全文](61)
摘要:
科学技术发展是一种动态非线性的复杂演进过程.为了提升技术发展的精准预测, 本文基于大语言模型(Large Language Model, LLM)、图卷积神经网络(Graph Convolutional Networks, GCN)、双向长短期记忆神经网络(Bi-directional Long Short-Term Memory, BiLSTM)以及鲁棒随机配置网络(Robust Stochastic Configuration Networks, RSCN), 提出了一种全新的"结构−内容"时空技术预测模型(Spatiotemporal Technological Forecasting Model with LLM as Representation, STTeFL 模型).首先, 通过结合图卷积神经网络和双向长短期记忆神经网络, 分别捕捉技术网络中的空间依赖关系和时间演化规律, 从而突破了传统预测模型在动态性和结构表征上的局限性, 克服了传统技术预测模型的“伪动态”和“静态”限制; 其次, 引入大语言模型对技术网络中的节点特征和边特征进行双重语义表征, 将预测框架从单一的结构维度扩展至“结构−内容”双维度分析, 显著增强了模型对技术发展信息的理解能力和表征深度. 最后, 通过集成RSCN, 模型能够有效应对极端不均衡数据分布的挑战, 进一步提升了预测的鲁棒性和准确性.本文提出的预测框架在多个指标上均优于当前多种技术预测方法, 为推动技术预测建模和评估未来技术发展轨迹提供了有力的支持.
基于随机森林学习残差的重载卡车模型预测控制器设计
赵康, 李小凡, 薛建儒
当前状态:  doi: 10.16383/j.aas.c250207  cstr: 32138.14.j.aas.c250207
[摘要](51) [HTML全文](41)
摘要:
近年来, 模型预测控制(MPC)在自动驾驶领域大量应用, 但依然面临车辆动力学非线性建模、实时滚动优化等困难. 基于数据驱动建立车辆动力学模型的MPC通过收集系统的输入输出数据, 直接学习动力学模型, 但依然需要额外处理环节解决实时滚动优化问题. 为此, 提出一种基于随机森林学习车辆动力学模型的方法. 先将车辆动力学模型分解为标称模型和残差模型, 然后利用两层随机森林学习残差模型. 上层用于切换不同线性模型, 下层拟合叶子节点的线性模型. 由于标称模型和残差模型均为线性模型, 滚动优化可直接使用二次规划求解器实时求解. 同时, 基于随机森林的残差模型使用多帧历史状态作为特征输入, 学习得到的残差模型保留动力学系统动态响应的延迟特性, 因此可有效消解延迟影响. 仿真测试和实车实验结果表明, 提出的MPC的跟踪精度和实时性均优于标称MPC和基于高斯过程的MPC, 并对车辆执行机构延迟具有优良的适应性.
面向可信自动驾驶策略优化: 一种对抗鲁棒强化学习方法
何祥坤, 赵洋, 房建武, 程洪, 吕辰
当前状态:  doi: 10.16383/j.aas.c250193  cstr: 32138.14.j.aas.c250193
[摘要](99) [HTML全文](98)
摘要:
虽然强化学习近年来取得显著成功, 但策略鲁棒性仍然是其在安全攸关的自动驾驶领域部署的关键瓶颈之一. 一个根本性挑战在于, 许多现实世界中的自动驾驶任务面临难以预测的环境变化和不可避免的感知噪声, 这些不确定性因素可能导致系统执行次优的决策与控制, 甚至引发灾难性后果. 针对上述多源不确定性问题, 提出一种对抗鲁棒强化学习方法, 实现可信端到端控制策略优化. 首先, 构建一个可在线学习的对手模型, 用于同时逼近最坏情况下环境动态扰动与状态观测扰动. 其次, 基于零和博弈建模自动驾驶智能体与环境动态扰动之间的对抗性. 再次, 针对所模拟的多源不确定性, 提出鲁棒约束演员-评论家算法, 在连续动作空间下实现策略累计奖赏最大化的同时, 有效约束环境动态扰动与状态观测扰动对所学端到端控制策略的影响. 最后, 所提出的方案在不同的场景、交通流及扰动条件下进行评估, 并与三种代表性的方法进行对比分析, 验证了该方法在复杂工况和对抗环境中的有效性与鲁棒性.
面向可再生能源消纳的火电机组控制结构综合与分析
马士全, 丁进良
当前状态:  doi: 10.16383/j.aas.c230210
[摘要](478) [HTML全文](677)
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电辅助消纳可再生能源的能力对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助消纳能力, 根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 详细阐述了基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力, 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈和非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标等. 根据以上分析分别给出了下一步的研究方向.
工业垂域具身智控大模型构建新范式探索
陈致蓬, 韩杰, 阳春华, 桂卫华
当前状态:  doi: 10.16383/j.aas.c250247  cstr: 32138.14.j.aas.c250247
[摘要](345) [HTML全文](305)
摘要:
大模型工业垂域化是通用智能迈向专业化应用的必然趋势, 更是驱动工业智能化转型的核心引擎. 然而, 大模型在工业领域应用, 面临难以洞察工业时序数据内涵、难以嵌入工业物理化学规律、难以确保模型输出可信度、难以解决复杂工业问题等挑战. 针对上述瓶颈, 提出工业垂域具身智控大模型构建范式: 创新性引入时序数据元模型化方法, 将工业时序数据转换为代码语义, 提升大模型对时序数据的理解与推理能力; 借助元模型构建工业规律知识图谱, 并将其嵌入大模型生成过程, 以确定性科学原理抑制生成随机性; 构建数字孪生与实物伴生的双轨验证平台, 通过虚实具身反馈机制, 实时强化学习, 优化模型输出可信度; 设计融合知识图谱规则评分与虚实验证专家评分的混合奖励函数, 结合自适应学习与长度正则化策略, 克服大模型解决复杂问题时“趋易畏难”倾向; 最终形成一个集垂域适配、具身控制、可信验证、具身反馈于一体的四层闭环架构. 应用于有色冶金领域, 构建了首个有色冶金具身智控大模型, 实验验证了该范式的有效性, 为大模型从实验室走向工业现场, 架起了从技术到落地的桥梁.
3D空间先验驱动的相机轨迹可控视频扩散生成模型
朱泓舟, 杨雪, 赵敏, 李崇轩, 朱军
当前状态:  doi: 10.16383/j.aas.c250124  cstr: 32138.14.j.aas.c250124
[摘要](88) [HTML全文](84)
摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
基于样本过滤-标签聚合极端树集成的电力信息物理系统虚假数据注入攻击定位检测
席磊, 李宗泽, 王文卓, 白芳岩, 董璐
当前状态:  doi: 10.16383/j.aas.c250275  cstr: 32138.14.j.aas.c250275
[摘要](37) [HTML全文](35)
摘要:
虚假数据注入攻击行为严重威胁电力信息物理系统的安稳运行. 然而, 针对虚假数据注入攻击的现有检测未充分考虑海量量测数据的不平衡性和网络拓扑的关联性, 导致检测方法广泛存在定位性能差的问题, 提出一种基于样本过滤-标签聚合极端树集成的电网虚假数据注入攻击定位检测方法. 所提方法在基于深度学习的卷积神经网络中引入交叉验证思想, 用于过滤海量量测数据中代表性弱、重复率高的不平衡样本; 通过利用标签聚合将关联的网络拓扑融入到极端树中, 并在与各节点状态对应的所有极端树上进行集成, 继而加权输出得到各节点状态的最终检测概率, 以实现对受攻击位置的精确定位. 在IEEE-14、IEEE-57系统上进行大量仿真, 验证了所提方法的有效性, 且与多种已有定位检测方法进行充分对比, 验证其在准确率、精度、召回率、F1值和AUC值上具备更优性.
基于语义概念关联的参考多目标跟踪方法
林家丞, 陈嘉俊, 李智勇, 王耀南
当前状态:  doi: 10.16383/j.aas.c250118  cstr: 32138.14.j.aas.c250118
[摘要](84) [HTML全文](100)
摘要:
参考目标跟踪(Referring multi-object tracking, RMOT)是一项利用语言与视觉模态数据进行目标定位与跟踪的任务, 旨在根据语言提示在视频帧中精准识别并持续跟踪指定目标. 尽管现有RMOT方法在该领域取得了一定进展, 但针对语言表述概念粒度的建模仍较为有限, 导致模型在处理复杂语言描述时存在语义解析不足的问题. 为此, 提出基于语义概念关联的参考多目标跟踪方法SCATrack), 通过引入共享语义概念(Sharing semantic concept, SSC)和语义概念辅助生成(Semantic concept generation, SCG)模块, 以提升模型对语言表述的深层理解能力, 从而增强跟踪任务的持续性与鲁棒性. 具体而言, SSC模块对语言表述进行语义概念划分, 使模型能够有效区分相同语义的不同表达方式, 以及不同语义间的相似表达方式, 从而提升多粒度输入条件下的目标辨别能力. SCG模块则采用特征遮蔽与生成机制, 引导模型学习多粒度语言概念的表征信息, 增强其对复杂语言描述的鲁棒性和辨别能力. 在两个广泛使用的基准数据集上的实验结果表明, 所提出的SCATrack显著提升RMOT任务的跟踪性能, 验证了方法的有效性与优越性.
基于深度语义扩散的深度图修复: 缺陷数据集与模型
闫涛, 李彤, 张江峰, 钱宇华, 陈路, 吴鹏
当前状态:  doi: 10.16383/j.aas.c250024  cstr: 32138.14.j.aas.c250024
[摘要](169) [HTML全文](96)
摘要:
深度修复旨在解决三维重建过程中深度图的缺失、噪声和遮挡问题. 然而, 由于深度图来源的多样性和异质性, 现有的深度修复方法难以对复杂场景结构及未知类型深度缺陷实现有效修复. 针对上述问题, 不同于现有方法单纯从提升算法鲁棒性的角度进行研究, 从深度缺陷数据集构建的逆向视角出发, 构造一种真实缺陷采样仿真数据集RDSS, 并在此基础上提出一种基于深度语义扩散的深度图修复模型DR-Net. RDSS数据集通过对真实缺陷的采集与建模, 结合同质化形变拓展和异质化交叉组合, 能够对多种复杂场景中的深度缺陷进行形式化仿真, 有效提升深度缺陷的多样性和场景的覆盖性. 设计的深度图修复网络DR-Net基于U型网络结构, 利用反向透射模块实现高分辨率细节保持的同时, 通过深度语义扩散模块传播图像中的深度语义信息, 进而有效提升修复性能. 为验证RDSS数据集的有效性及DR-Net模型的鲁棒性, 从数据集的可用性和网络模型的有效性两个方面进行分析. 实验结果表明: 以RDSS数据集为基准训练数据集, 可实现在其他数据集中深度图的有效修复. 此外, 与最先进的模型设计类修复方法SDFilter和数据驱动类修复方法G2相比, DR-Net模型在RDSS、NYU Depth V2和KITTI三类数据集上的均方根误差指标分别平均下降24.85%和29.54%, 验证了DR-Net模型的有效性和先进性.
一类带有输入时滞和乘性噪声线性系统的随机最优控制
王宏霞, 刘祥谦
当前状态:  doi: 10.16383/j.aas.c240809  cstr: 32138.14.j.aas.c240809
[摘要](152) [HTML全文](59)
摘要:
研究存在未知系统动力学和输入时滞的乘性噪声系统线性二次最优控制问题. 当系统动力学完全已知时, 可以通过离线求解Riccati-ZXL方程获得最优反馈策略. 而当系统动力学不完全已知时, 离线求解Riccati-ZXL方程不再可行. 为此, 拟设计一种值迭代(value iteration, VI)算法来求解Riccati-ZXL方程, 该算法仅依赖可量测的状态和输入信息, 而不要求完全的系统动力学. 与策略迭代(policy iteration, PI)算法不同, 该算法消除了对初始策略稳定性的要求, 具有更强的适应性. 最后, 通过一个例子验证了所提算法的有效性.
独立慢特征分析建模方法及其在动态故障检测中的应用
张晨, 孔祥玉, 胡昌华
当前状态:  doi: 10.16383/j.aas.c250134  cstr: 32138.14.j.aas.c250134
[摘要](139) [HTML全文](104)
摘要:
故障检测与诊断技术是保证复杂装备或工业过程正常运行的技术支撑和有效手段, 独立成分分析(Independent component analysis, ICA)作为一种典型的多元统计过程监测(Multivariate statistical process monitoring, MSPM)方法, 可充分挖掘数据的高阶统计信息. 传统ICA方法在预处理阶段采用主成分分析(Principle component analysis, PCA)进行白化和降维, 但PCA的静态性质导致ICA在动态过程监测中的效果不太理想. 为解决这一问题, 提出一种独立慢特征分析(Independent-slow feature analysis, ISFA)建模方法. ISFA以原始观测矩阵和白化矩阵为自变量构造双目标优化函数, 基于牛顿迭代法求解目标函数, 使用网格搜索优化权重系数, 利用指数加权移动平均(Exponentially weighted moving average, EWMA)修正统计量并构建综合检测指标; 最后, 利用数值仿真和电动伺服机构实验验证所提方法的有效性.
一种基于单比特通信压缩的大模型训练方法研究
陈楚岩, 刘烨谞, 贾维宸, 何雨桐, 袁坤, 王立威
当前状态:  doi: 10.16383/j.aas.c250087  cstr: 32138.14.j.aas.c250087
[摘要](484) [HTML全文](190)
摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
大语言模型的工具使用综述
郑逸宁, 余镇, 李不凡, 杨捷, 殷林琪, 印张悦, 袁枫烨, 魏海洋, 陆嘉昊, 方世成, 陈爽, 邱锡鹏
当前状态:  doi: 10.16383/j.aas.c240793  cstr: 32138.14.j.aas.c240793
[摘要](662) [HTML全文](432) [PDF 1339KB](133)
摘要:
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
面向大模型时代的持续学习方法论演变
王全子昂, 王仁振, 孟德宇, 徐宗本
当前状态:  doi: 10.16383/j.aas.c240805  cstr: 32138.14.j.aas.c240805
[摘要](1340) [HTML全文](575) [PDF 2727KB](220)
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
基于 PID 自整定功能的自适应双路输出的黑体温度控制
张海弟
当前状态:  doi: 10.16383/j.aas.c190277
[摘要](1103) [HTML全文](598)
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
仿人智能控制理论及应用研究进展
戴小文, 宋建霖, 岳丽全
当前状态:  doi: 10.16383/j.aas.c200007
[摘要](2359) [HTML全文](966)
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
基于生成对抗网络的对抗攻击防御模型
孔锐, 蔡佳纯, 黄钢
当前状态:  doi: 10.16383/j.aas.2020.c200033
[摘要](3148) [HTML全文](2101)
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.