• 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
显示方式:
目录
2026, 52(3).  
[封面浏览] [PDF 5741KB](3)
综述
星群内外态势认知与安全控制的体系架构及理论方法
李文博, 刘鹏, 刘萍, 刘成瑞, 刘文静, 马亚杰, 薛文超, 党庆庆
2026, 52(3): 363-380.   doi: 10.16383/j.aas.c250326 cstr: 32138.14.j.aas.c250326
[摘要](234) [HTML全文](237) [PDF 2922KB](14)
摘要:
围绕下一代空间基础设施体系建设的重大战略需求, 针对复杂任务下卫星集群的态势认知与安全控制技术展开探讨. 首先, 分析国内外卫星集群的发展现状与面临挑战, 指出当前研究在理论体系完备性、感知信息全面性、评估可信度、决策合理性及执行精准性等方面存在不足. 其次, 重点阐述星群OODA体系架构, 分别探讨感知、评估、决策与执行各环节的关键技术与研究进展. 最后, 对星群态势认知与安全控制技术的未来发展进行展望, 提出需构建能力量化表征模型, 发展多源信息交互与融合的态势全面感知、内外因素耦合影响下的可信评估以及动态场景下的快速合理决策和多目标跨尺度任务的精准执行, 以提升星群自主安全运行能力, 为下一代空间基础设施建设提供理论和技术基础.
视觉强化学习方法研究综述
王荣荣, 程玉虎, 王雪松
2026, 52(3): 381-410.   doi: 10.16383/j.aas.c250422 cstr: 32138.14.j.aas.c250422
[摘要](641) [HTML全文](628) [PDF 3622KB](27)
摘要:
视觉作为强化学习智能体感知环境的主要途径, 能够提供丰富的细节信息, 从而支持智能体实现更复杂、精准的决策. 然而, 视觉数据的高维特性易导致信息冗余与样本效率低下, 成为强化学习应用中的关键挑战. 如何在有限交互数据中高效提取关键视觉表征, 提升智能体决策能力, 已成为当前研究热点. 为此, 系统梳理视觉强化学习方法, 依据核心思想与实现机制, 将其归纳为五类: 图像增强型、模型增强型、任务辅助型、知识迁移型以及离线视觉强化学习, 深入分析各类方法的研究进展及代表性工作的优势与局限. 同时, 综述DMControl、DMControl-GB、DCS和RL-ViGen四大主流基准平台, 总结视觉强化学习在机器人控制、自动驾驶以及多模态大模型等典型场景中的应用实践. 最后, 结合当前研究瓶颈, 探讨未来发展趋势与潜在研究方向, 以期为该领域提供清晰的技术脉络与研究参考.
论文与报告
基于PIML的微观人群移动建模仿真与干预决策框架
郭润康, 朱正秋, 艾川, 叶佩军, 秦龙, 尹全军, 王飞跃
2026, 52(3): 411-429.   doi: 10.16383/j.aas.c250312 cstr: 32138.14.j.aas.c250312
[摘要](267) [HTML全文](353) [PDF 4895KB](8)
摘要:
人群移动是影响城市公共安全及应急管理的重要因素, 如何对其进行高精度的建模仿真和有效干预是亟待解决的问题. 为此, 提出一种物理信息机器学习驱动的微观人群移动建模仿真与干预决策框架. 基于平行智能思想, 该框架构建“数据感知−融合建模−动态仿真−智能干预”四层闭环结构, 形成从建模仿真到策略生成、执行及反馈修正的完整链路. 针对人群的移动仿真与引导决策问题, 分别提出基于物理信息时空图卷积网络的导航势能场模型和物理信息多智能体深度确定性策略梯度算法, 有效解决了传统方法中模型准确性较差、仿真与干预孤立以及决策依赖人工经验的问题. 最后, 基于真实数据集开展仿真实验验证了所提框架的有效性.
融合形态特征的基于GRU的介入机器人导丝轨迹预测建模
张任飞, 董林杰, 王兴松, 田梦倩, 苏浩波
2026, 52(3): 430-440.   doi: 10.16383/j.aas.c250506 cstr: 32138.14.j.aas.c250506
[摘要](132) [HTML全文](122) [PDF 12481KB](3)
摘要:
针对介入导航场景中的导丝轨迹重建问题, 提出一种保持因果性的序列估计方法. 不同于通用循环基线模型, 所提方法将序列级常量特征 (包括导丝刚度、进入角度和有效摩擦描述符) 按时间步广播, 与动态几何量(中心线坐标、直径等)拼接, 经两层特征编码后由单向门控循环单元解码器逐时输出二维坐标. 为处理变长序列, 本文采用时间步长分类的训练策略, 并结合掩码损失函数, 以抑制填充引入的无效梯度, 在不改变网络结构的前提下提升训练与推理效率. 基于覆盖多类导丝与多进入角度的仿体实验平台, 所提方法在保持因果性的同时, 实现0.40 ~ 0.54 mm的位置误差范围(平均误差为0.46 mm); 相较于未采用时间步分类策略的基线模型, 收敛epoch降低42%, 训练时间降低52%, 单次推理时延降低51%. 结果表明, 该方法可为导丝轨迹估计与术中导航提供可部署的算法基础.
自动驾驶系统逻辑场景全覆盖测试用例生成方法
闵海涛, 张志强, 范天昕, 张培兴, 张诚, 曲歌
2026, 52(3): 441-450.   doi: 10.16383/j.aas.c250347 cstr: 32138.14.j.aas.c250347
[摘要](203) [HTML全文](144) [PDF 3931KB](6)
摘要:
基于场景的测试方法是验证自动驾驶系统安全性的主流手段, 然而逻辑场景使用参数空间的形式对场景进行描述, 当被测系统性能存在差异时, 第三方检测机构难以使用同样的测试用例在保证测试公平性的同时兼顾测试覆盖率. 为此, 提出一种基于测试用例代表性的自动驾驶系统逻辑场景全覆盖测试用例生成方法. 首先建立自动驾驶系统全覆盖测试用例生成框架; 其次提出综合分析自然驾驶概率分布及危险情况的测试用例代表性量化评价方法; 最后开发一种基于热度驱动层次贪心算法和遗传算法的差异化样本组合空间全覆盖问题优化求解方法, 获取测试用例参数组合, 实现逻辑场景参数空间全覆盖. 使用前车切入场景对提出的方法进行验证. 结果表明, 提出的方法在逻辑场景参数空间覆盖率(100%)、测试边界拟合误差(0.08)方面均显著优于当前主流的蒙特卡洛方法(覆盖率84.3%、拟合误差0.19)与组合测试方法(覆盖率86.5%、拟合误差0.14), 可有效帮助检测机构建设公平、高效的测试场景生成框架.
基于行为预测和策略融合的轨道博弈决策方法
王英杰, 袁利, 黄煌, 耿远卓
2026, 52(3): 451-462.   doi: 10.16383/j.aas.c250268 cstr: 32138.14.j.aas.c250268
[摘要](201) [HTML全文](245) [PDF 3752KB](4)
摘要:
轨道追逃博弈中逃逸策略的高度未知性与行为多样性, 给追踪策略的泛化能力带来严峻挑战. 深度强化学习虽可提升追踪星的博弈效能, 但当逃逸策略偏离训练分布时, 策略网络易产生次优甚至失效的决策. 为此, 提出一种基于行为预测和策略融合的轨道博弈决策方法. 在训练阶段, 首先采用“预测制导 + 人工势场法”构建多样化逃逸策略集. 随后在传统演员−评论家训练框架的基础上, 通过引入预测网络构建预测器−演员−评论家算法, 针对每类逃逸策略分别训练以获得对应的追踪子策略. 其中预测网络用于估计逃逸星动作, 并通过预测结果与真实动作的相似性衡量子策略与未知逃逸策略的匹配度. 在执行阶段, 策略融合器以逃逸星历史动作与各追踪子策略的预测结果为输入, 动态计算匹配度并选择最优子策略进行博弈决策. 实验结果表明, 预测网络能有效评估追踪子策略对未知逃逸策略的适应性, 策略融合器可显著提升追踪星面对多样化逃逸策略的泛化能力与可靠性.
基于双高斯分布混合的可解释自适应鲁棒神经网络建模方法
刘鑫, 李琪琪, 代伟
2026, 52(3): 463-480.   doi: 10.16383/j.aas.c250602 cstr: 32138.14.j.aas.c250602
[摘要](160) [HTML全文](173) [PDF 7627KB](22)
摘要:
工业过程数据常常受到混合噪声干扰, 传统基于单一重尾分布的鲁棒建模方法在处理混合噪声问题时, 在准确性与可解释性方面均存在一定局限. 基于此, 提出一种混合双高斯分布的可解释鲁棒自适应建模方法. 该方法首先采用随机配置算法构建基础的随机配置网络学习模型, 确定模型的隐含层节点数、输入权重和偏置; 其次为保证模型对混合噪声的鲁棒性, 构建双高斯分布(一大一小方差)加权组合而成的噪声表征模型; 随后利用期望最大化算法自适应迭代学习随机配置网络输出权值和混合高斯模型噪声参数, 最终形成基于双高斯分布混合鲁棒建模方法. 该方法具有以下优势: 噪声模型能够通过参数自适应学习逼近实际混合噪声特性, 其中大方差高斯分量负责对异常噪声进行粗调, 小方差高斯分量则用于精细拟合主体噪声, 从而增强模型的可解释性; 在网络模型输出权值估计过程中, 通过为每个输出数据点自适应分配惩罚权重, 保障模型的鲁棒性能. 为验证所提方法的有效性, 分别在函数仿真、基准数据集和工业实例上设计多组对比实验, 结果均表明所提方法具备良好的可靠性与实用性.
基于混合驱动与梯度优化的模糊宽度模型预测控制
田昊, 汤健, 余文, 乔俊飞
2026, 52(3): 481-509.   doi: 10.16383/j.aas.c250195 cstr: 32138.14.j.aas.c250195
[摘要](53) [HTML全文](44) [PDF 8719KB](17)
摘要:
模型预测控制(MPC)是广泛应用于各类工业过程的先进过程控制策略. 深度神经网络能够提升传统MPC性能, 但存在计算复杂度高和过拟合风险. 在MPC中采用常规粒子群优化(PSO)虽具备全局搜索能力, 却因计算消耗和初始解依赖等问题难以满足实时控制需求. 针对上述问题, 提出基于混合驱动和梯度优化的模糊宽度MPC. 首先, 采用区间二型模糊宽度学习系统构建预测模型, 增强非线性建模和不确定性处理能力. 其次, 在滚动优化过程中, 引入梯度下降与PSO的协同策略, 以确保快速收敛并提升全局搜索性能, 同时利用系统样本数据库和粒子档案数据库构建知识−数据驱动的代理模型以降低计算消耗. 最后, 设计操纵变量基线求解策略以提高控制输出的安全性和可靠性. 通过典型非线性系统和实际城市固废焚烧过程控制的仿真实验, 验证了所提方法的有效性.
深度强化学习驱动的超视距空战自主决策方法
吕茂隆, 王金河, 韩浩然, 丁晨博, 万路军
2026, 52(3): 510-524.   doi: 10.16383/j.aas.c250334 cstr: 32138.14.j.aas.c250334
[摘要](314) [HTML全文](337) [PDF 6156KB](6)
摘要:
随着机载传感器和中远距空空导弹技术的快速发展, 超视距空战已经成为现代空战的主流形式. 在这种复杂多变的作战环境中, 开发能够实时掌握战场态势并制定合理机动决策的智能化技术, 已成为军事技术研究领域的热点问题. 首先, 构建一个涵盖飞机六自由度动力学模型、导弹制导系统模型和雷达传感器系统的高保真仿真环境; 接着, 融合模仿学习和自博弈方法, 提出基于对手学习的空战决策框架, 以解决深度强化学习在空战中适应性和泛化性差的缺点, 提升智能体在复杂多变战场环境中快速适应和策略优化的能力; 最后, 构建10种具有显著战术差异性的专家系统, 在高保真空战仿真平台中与智能体进行博弈对抗. 结果表明, 在收敛速度和胜率等关键指标上, 所提出的空战决策框架优于传统深度强化学习决策策略, 有效性和泛化性强, 可为复杂超视距空战态势下快速生成可靠策略提供技术支持.
基于局部分形维数最大化的单幅图像细节增强
江鹤, 乙夫迪, 郑州, 顾豪, 寇旗旗, 程德强
2026, 52(3): 525-540.   doi: 10.16383/j.aas.c250368 cstr: 32138.14.j.aas.c250368
[摘要](368) [HTML全文](282) [PDF 10290KB](43)
摘要:
随着人们对图像画质要求的不断提高, 各类图像细节增强技术不断涌现. 然而, 基于局部滤波器速度较快, 但其细节增强效果往往有限; 全局滤波器效果突出, 但计算开销较大; 深度学习方法高度依赖人工标注数据, 且其缺乏可解释性; 基于残差学习的策略则容易陷入局部最优, 难以充分挖掘潜在的全局最优特征. 针对上述挑战, 提出一种基于局部分形维数最大化的图像细节增强算法. 研究发现, 图像的分形维数在一定程度上能够有效刻画图像纹理结构, 其空间分布呈现出一定规律: 边缘区域通常具有较高的分形维数, 纹理区域次之, 平坦区域则最低. 基于上述特性, 构建图像纹理特征与分形维数之间的映射关系, 并进一步探讨分形维数与图像细节层之间的内在关联机制. 该方法在保持整体结构一致性的前提下, 通过提升局部分形维数, 实现图像细节的有效增强, 进而为图像增强提供一种具有理论依据的新思路. 大量实验结果表明, 该方法在主观视觉感受和客观评价指标上具有竞争力的表现. 如在BSDS200数据集上进行四倍增强因子的测试中, 所提方法在峰值信噪比和结构相似度指标上相较于当前流行方法QWLS分别提升5.20 dB和0.1456, 充分展示了其在图像细节增强任务中的优势与算法强大的泛化特性.
非重复受扰批次过程的自适应迭代学习经济模型预测控制
马乐乐, 赵宇石, 刘向杰, 高福荣
2026, 52(3): 541-554.   doi: 10.16383/j.aas.c250447 cstr: 32138.14.j.aas.c250447
[摘要](65) [HTML全文](41) [PDF 1753KB](29)
摘要:
迭代学习模型预测控制作为一种重要的批次过程先进控制方法, 具备较强的学习能力和闭环性能. 传统的迭代学习模型预测控制算法能有效消除重复扰动影响, 同时对小范围实时扰动鲁棒性较强. 当被控系统存在较大实时干扰时, 经济性能和系统稳定性通常难以保障. 对此, 提出一种面向非重复扰动的自适应迭代学习经济模型预测控制策略, 沿迭代方向和时间方向对系统动态进行分解, 将系统扰动拆分为重复部分和非重复部分, 分别建立批次间和批次内的动态经济优化问题. 批次间执行基于迭代学习控制的离线经济优化, 消除重复扰动影响; 批次内引入扩展状态观测器对非重复扰动进行估计, 基于批次间优化结果在线实施经济模型预测控制, 在抑制实时扰动的同时提高系统动态经济性. 论文结合观测器稳定性分析方法, 对所提自适应迭代学习经济模型预测控制策略的稳定性进行理论证明, 并通过间歇反应器仿真实验对算法实施有效性进行验证.
非线性多智能体系统的动态事件触发固定时间一致性控制
邵蝉云, 安爱民, 徐承承, 刘向航, 李二超
2026, 52(3): 555-577.   doi: 10.16383/j.aas.c250304 cstr: 32138.14.j.aas.c250304
[摘要](469) [HTML全文](570) [PDF 2010KB](56)
摘要:
研究通信拓扑固定下受有界扰动影响的非线性多智能体系统固定时间一致性问题. 针对现有事件触发控制方法存在的收敛时间依赖初值、扰动下触发可靠性低、控制参数缺乏理论设计依据等挑战, 提出一种动态事件触发固定时间一致性控制方法. 首先, 设计融合非线性增益与双曲正切扰动补偿的固定时间控制器, 在消除抖振的同时保证收敛时间上界严格独立于系统初始状态. 其次, 构造基于动态变量自适应调节的事件触发机制, 显著降低通信频率并严格证明系统不存在Zeno行为. 进一步, 通过建立新型Lyapunov稳定性分析框架, 显式给出收敛时间上界与事件触发间隔下界. 仿真结果表明, 所提方法在保证固定时间收敛性能的同时, 有效实现通信效率的优化提升.
基于观测器的混杂切换多智能体系统有界群一致性追踪
裴惠琴, 谭鉴恒, 肖红利, 梁炜森
2026, 52(3): 578-592.   doi: 10.16383/j.aas.c250303 cstr: 32138.14.j.aas.c250303
[摘要](208) [HTML全文](205) [PDF 1521KB](7)
摘要:
考虑脉冲作用下基于观测器二阶混杂切换多智能体系统的有界群一致性追踪问题, 建立一种在脉冲作用下的混杂切换多智能体系统动力学模型, 每个跟踪智能体只能够获取邻居智能体和目标的位置信息. 然而, 每个跟踪智能体并不能获得邻居智能体和目标的速度信息. 针对跟踪智能体在获取邻居智能体和目标速度信息方面存在的限制, 设计一种基于目标加速度和智能体位置的状态观测器, 为跟踪智能体提供其子群目标的速度估计. 在此基础上, 提出一种在脉冲作用下基于目标速度观测器的有界群一致性追踪控制策略, 通过矩阵理论和Hurwitz稳定性判据, 证明了在该策略下系统可实现有界群一致性追踪. 仿真实例验证了所提方法的有效性.
基于运动过滤和调整的离群点移除
赖桃桃, 张一凡, 李佐勇, 肖国宝, 林维斯, 王菡子
2026, 52(3): 593-610.   doi: 10.16383/j.aas.c250235 cstr: 32138.14.j.aas.c250235
[摘要](253) [HTML全文](236) [PDF 4410KB](7)
摘要:
由现有的特征提取器建立的图像特征点匹配集合通常包含大量离群点, 这严重影响特征匹配的有效性和依赖匹配结果的下游任务的性能. 最近提出的几种离群点去除方法通过估计运动场来利用匹配对的运动一致性, 并使用卷积神经网络(CNN)来减少离群点造成的污染, 以捕获上下文. 然而, CNN在捕捉全局上下文方面存在固有缺陷, 其感受野的固定性与局部性导致模型难以自适应地整合远距离信息, 从而制约相关方法的性能. 与这些使用卷积神经网络直接估计运动场的方法不同, 本文尝试在不使用CNN的情况下估计高质量的运动场. 因此, 提出基于运动过滤和调整的网络, 以减轻在捕捉上下文时离群点的影响. 具体而言, 首先, 设计一个运动过滤模块, 以迭代地去除离群点并捕获上下文. 然后, 设计一个规则化和调整模块, 该模块先估计初始运动场, 接着通过利用额外的位置信息对其进行调整, 使其更加准确. 在离群点去除和相对姿态估计任务中, 利用室内和室外数据集评估所提出方法的性能. 实验结果表明, 与现有多种方法相比, 所提方法展现出更优的性能.
本刊经同行评议拟录用的文章,目前在编校阶段,尚未确定卷期及页码,已有DOI。
显示方式:
高效提升多模态大语言模型推理能力的级联强化学习策略
王玮赟, 蒲恒骏, 景凌林, 乔宇
当前状态:  doi: 10.16383/j.aas.c250515  cstr: 32138.14.j.aas.c250515
[摘要](17) [HTML全文](7)
摘要:
强化学习在提升多模态大语言模型的推理能力上展现出巨大潜力, 逐渐成为模型训练过程中的关键步骤. 然而, 在线强化学习算法需要策略模型在训练过程中实时采样, 且收敛速度较慢, 因此训练成本昂贵; 离线强化学习虽然整体成本更低, 但是也牺牲了性能上限. 本文尝试将离线强化学习训练成本低的特性与在线强化学习性能上限高的优势相结合, 提出一种新的训练策略--级联强化学习. 这套训练策略包含离线强化学习和在线强化学习两个训练阶段, 其中离线强化学习阶段用于加速模型收敛并提升后续训练的稳定性; 在线强化学习阶段对模型进行了更精细的训练, 进一步提升其性能上限. 本文通过一系列定量分析实验证明了相比单一的在线强化学习算法, 级联强化学习可以通过一半的训练成本达到更高的性能上限. 这种简单有效的训练策略将InternVL3.5-8B-Instruct和InternVL3.5-241B-A28B-Instruct在七个多模态推理评测基准上的平均准确率分别提升了6.7%和6.5%, 证明了这一策略的有效性和可扩展性.
基于原油类型聚类泊位分配的港炼一体化调度模型
王天媛, 章立峰, 袁志宏, 杨涛
当前状态:  doi: 10.16383/j.aas.c250631  cstr: 32138.14.j.aas.c250631
[摘要](15) [HTML全文](4)
摘要:
针对炼油全流程调度中传统序贯优化方法因忽略港口作业与生产各环节耦合关系而导致的储罐频繁切换、库存成本增加及装置原料供应不连续等问题, 采用按原油类型集中卸载的泊位分配策略, 基于事件点的混合时间建模方法, 将泊位分配、原油卸载、储罐调度、蒸馏加工、二次加工至产品调配各环节集成, 构建港炼一体化调度模型. 模型综合刻画港口卸载与罐区库存的衔接约束、储罐切换与装置进料的时序关系及原油搭配与产品质量的耦合机制, 并采用归一化多参数分解技术对模型进行求解. 基于某炼化企业实际数据的案例研究结果表明, 所提模型能够有效优化泊位分配与原油卸载顺序, 显著改善罐区库存管理、蒸馏装置进料连续性、二次加工装置运行及成品油调配等后续生产环节的运行状态. 与传统序贯优化方法相比, 该模型有效降低了总运行成本, 提高了调度效率.
基于有限时间扩展状态观测器的不确定二自由度直升机系统自适应规定性能控制
赵志甲, 陈志臻, 翁言, 马鸽, 何树德, 陈首彦
当前状态:  doi: 10.16383/j.aas.c250494  cstr: 32138.14.j.aas.c250494
[摘要](21) [HTML全文](10)
摘要:
针对具有外部干扰的不确定二自由度直升机系统, 提出一种基于有限时间扩展状态观测器的自适应规定性能控制方法. 设计的规定性能函数和基于切换模型的变换误差克服了传统性能控制的初始误差限制. 然后, 引入有限时间扩展状态观测器来估计总扰动. 将变换误差与自适应非奇异快速终端滑模控制相结合, 规避了奇异性问题, 保障了系统的性能. 此外, 通过Lyapunov方法验证了系统的稳定性. 仿真和实验验证了所提控制策略的可行性和有效性.
基于集合贝叶斯交互基元的机械臂自主肝脏超声扫查
马骥, 赵悦, 刘壮, 胡悦, 刘健行, 沈毅
当前状态:  doi: 10.16383/j.aas.c250530  cstr: 32138.14.j.aas.c250530
[摘要](11) [HTML全文](11)
摘要:
针对人体肝脏结构的超声扫查需求, 提出一种基于集合贝叶斯交互基元的全自主机械臂辅助扫查方法, 并搭建了相应的实验系统.该方法将扫查流程划分为顺序执行的“初始定位”与“模仿学习”两个阶段.在初始定位阶段, 系统通过RGB-D图像引导探头与患者建立接触, 并基于实时超声图像判断向模仿学习阶段切换的时机. 在模仿学习阶段, 系统将医师示范的扫查技能编码为超声图像与探头运动轨迹, 并通过集合贝叶斯交互基元实现对扫查技能的学习与复现, 最终完成肝脏的自主超声扫查. 最后, 在人体腹部体模上对所提方法进行了实验验证. 实验结果表明, 该方法在无需人工干预的条件下即可完成肝脏自主扫查任务, 展现出良好的临床应用前景.
基于分数阶图神经扩散的跨频域对齐对比学习方法
王友清, 徐世龙, 赵天祥, 王宇晨, 辛梦媛, 张琦, 苏烨, 郭继鹏
当前状态:  doi: 10.16383/j.aas.c250604  cstr: 32138.14.j.aas.c250604
[摘要](18) [HTML全文](9)
摘要:
图对比学习(GCL)作为一种强大的自监督表示学习范式, 能够通过有效利用无标签数据来增强半监督学习中的表示判别性和泛化能力. 然而, 现有的GCL方法在学习判别性嵌入表示以及图数据增强过程中实现对比多样性与语义不变性之间的平衡方面存在困难, 这导致在构建增强视图时关键信息的丢失. 为了解决这些挑战, 提出了一种新颖的跨频域对齐对比学习(CfACL)框架, 利用分数阶图神经扩散(FGND)进行图节点表示学习. FGND利用切比雪夫多项式分数阶微分方程实现图信号中多阶邻域信息的远程扩散, 缓解过平滑问题并提高图嵌入表示的判别能力. 随后, 通过高频和低频滤波器分别构建两种不同的FGND形式, 形成自然的增强对比视图, 避免了随机增强引起的内在结构坍塌和语义偏移. CfACL方法将高频滤波分量转换到低频域, 并在镜像的虚拟谱空间中进行对比学习, 从而能够在全局一致的语义空间中吸收有益的高频细节, 为下游任务生成全面的表示. 在同配性和异配性基准图数据集上的大量节点分类实验结果验证了所提方法的有效性.
以数据手套为媒介的人手—机械手抓握技能传递
郭策, 郭子睿, 陈斯灏, 李依鸿, 肖浩然, 李金哲, 陈谢沅澧, 曾志文, 卢惠民
当前状态:  doi: 10.16383/j.aas.c250512  cstr: 32138.14.j.aas.c250512
[摘要](23) [HTML全文](13)
摘要:
模仿学习是实现从人手到机械手技能传递的有效方式. 传统示教方法面临示教方式不够直观、示教数据难以复用、触觉和动觉感知特征难以有效传递等问题. 为解决上述问题, 设计一款能够同时采集触觉和动觉特征的数据手套, 并提出以该手套为媒介的抓握技能传递方案, 包括基于图结构和极坐标的多模态特征表示、静力平衡假设下未知接触力估计、基于期望关节角度和接触力分布的动态重映射方法等. 实验证明, 对于可变形、不规则等多种属性的物体, 该方案能够在实现较高抓握成功率的同时保持合理的接触力控制, 相比于其他基准方案, 实现了相对更接近人手直接抓握的效果.
基于混沌数据加密的切换系统最优控制与隐私保护
齐义文, 乔鑫鑫, 邓飞其, 王云龙
当前状态:  doi: 10.16383/j.aas.c250636  cstr: 32138.14.j.aas.c250636
[摘要](32) [HTML全文](21)
摘要:
针对控制系统中数据经网络传输存在的隐私泄露以及隐私保护导致的性能损失问题, 本文研究一种具有隐私保护的切换系统最优控制方法. 根据混沌系统的非周期性及不可预测性, 开发一种基于混沌系统的数据加密方法. 将主混沌系统生成的伪随机序列添加到切换系统输出数据中, 能避免其经非理想网络传输时隐私的泄露. 其次, 设计一种基于粒子群优化算法的混沌形态同步控制器, 降低不确定项的影响, 保障主从混沌系统的同步性, 确保解密后数据的可用性. 然后, 利用自适应动态规划算法对采用解密后数据构造的代价函数进行优化, 将预更新最优子系统的更新规则做为候选切换律. 通过对比候选切换律与当前切换律作用下系统的性能, 将性能好的切换律做为控制策略的一部分, 确保切换系统性能最优. 最后, 通过仿真对所提方法的可行性进行验证.
基于模体增强对比学习的图神经网络后门防御方法
陈晋音, 穆文博, 郑海斌
当前状态:  doi: 10.16383/j.aas.240767  cstr: 32138.14.j.aas.c250767
[摘要](42) [HTML全文](18)
摘要:
图神经网络在图数据挖掘任务中表现出卓越性能, 因此广泛应用于社交网络、商品推荐等领域. 在图分类任务中, 模型决策高度依赖全局拓扑结构, 使得图神经网络易受后门攻击. 已有研究表明, 在训练数据中注入中毒信息使得训练获得的模型容易被触发样本欺骗, 严重威胁模型安全. 因此, 相继提出一些针对后门攻击的防御方法, 一定程度上检测中毒样本并过滤, 或者去除模型内的后门. 然而, 防御方法仍然存在一些挑战, 即对不同后门攻击的防御泛化性弱、无法有效均衡主任务性能与防御成功率等问题. 针对这些问题, 首次提出一种基于模体增强对比学习的图神经网络后门攻击防御方法(Motif-Defense), 可高效防御多种未知类型的后门攻击, 且在主任务性能仅略有下降. 首先, 设计了模体角度增强图的对比学习模型选取出可疑后门样本, 并使用Jaccard相似度和标签平滑策略将可疑后门样本净化为干净样本, 实现了对图后门攻击的防御. 最终, 在四个真实数据集上展开防御实验, Motif-Defense平均降低84.61%的攻击成功率, 且分类准确率平均仅下降5.32%.
基于大语言模型的多智能体自动渗透测试框架构建与评估
江颉, 王豪, 李明达, 朱添田
当前状态:  doi: 10.16383/j.aas.c250293  cstr: 32138.14.j.aas.c250293
[摘要](79) [HTML全文](91)
摘要:
渗透测试作为一种主动的安全评估手段, 在保障网络安全中发挥着至关重要的作用. 传统的渗透测试通常高度依赖专家经验和人工操作, 测试过程复杂且耗时. 基于大语言模型的渗透测试智能体能够在测试环境中生成和调整策略, 相较于传统的方式, 具备更强的创新性和适应性. 在大语言模型辅助渗透测试的过程中, 存在因测试路径偏移、大语言模型"幻觉"问题而导致渗透测试任务的中断或失败的情况. 基于此, 提出一个基于大语言模型的多智能体渗透测试框架LangPentest, 旨在通过自然语言处理技术提高攻击策略的自动生成和执行能力, 框架采用了大语言模型驱动的程序框架(LangChain)和检索增强生成技术, 提高LangPentest性能并降低大语言模型在应用渗透测试方面的“幻觉”问题. 框架由任务生成、任务执行、经验管理和任务调节四部分模块组成, 对基准目标测试后, 基于Claude 3.5 Sonnet模型的框架任务成功率最高; 且与AutoGPT和PentestGPT相比, 本框架在任务成功率方面具有明显优势, 在任务完成和整体性能方面证明了LangPentest的可行性和有效性.
大模型参数高效微调方法综述: 技术、趋势与挑战
唐岸达, 林宙辰
当前状态:  doi: 10.16383/j.aas.c250451  cstr: 32138.14.j.aas.c250451
[摘要](284) [HTML全文](245)
摘要:
大规模预训练模型已经在自然语言处理等领域展现出强大的能力. 为更好地适配下游任务, 微调预训练模型是一个常用的方法. 然而, 大模型的全参数微调面临计算成本高昂、存储需求巨大等严峻挑战. 参数高效微调(PEFT)作为解决这些问题的关键技术范式, 仅引入或选择极少量可训练参数, 在显著降低计算和存储开销的同时, 有效保持模型的能力. 该综述系统梳理PEFT领域的主流方法体系、关键技术进展与发展趋势. 首先, 将现有方法归纳为四大范式: 添加式、局部式、重参数化式以及融合式, 并深入剖析各类方法的核心机理、性能特征、应用场景及策略优势. 进而, 重点探讨PEFT的技术演进, 从技术变化中分析出现该发展的内在本质规律, 总结出PEFT 方法从单一方法创新向存储、计算、性能三元权衡, 以及自动化、智能化、软硬件协同等统一框架发展的技术趋势. 更进一步, 该综述对各类PEFT中的代表性方法进行系统性的定量比较, 在统一的模型与数据集上评估其性能与参数效率. 此外, 本综述还涵盖PEFT 技术在视觉、语音及跨模态模型等领域的拓展应用, 展现其广泛的适用性. 最后, 总结并探讨未来研究方向, 以推动更高效、更适应多样化任务的大型模型微调技术的发展.
基于混合专家的可扩展情感分析模型
陈千, 胡梦强, 郭鑫, 王素格
当前状态:  doi: 10.16383/j.aas.c250366  cstr: 32138.14.j.aas.c250366
[摘要](95) [HTML全文](66)
摘要:
情感分析作为自然语言处理领域的核心任务之一, 面临着如何精准捕捉细粒度情感特征以及提升模型可解释性的双重挑战. 为此, 提出一种基于混合专家 (MoE) 模型的可扩展情感分析框架, 通过将门控机制融入专家内部, 设计可在任意预训练语言模型中扩展的混合专家模块. 该框架旨在以可控的计算开销扩展模型容量, 促进细粒度条件计算和专家专业化. 在三个典型情感分析数据集上的综合实验表明, 与基线模型相比, 本方法在关键指标上均取得显著提升, 尤其在处理复杂多分类任务时, 其性能已达到甚至超过主流参数高效微调大语言模型的水平. 更重要的是, 得益于稀疏激活机制, 模型在保持高性能的同时, 展现出卓越的推理效率. 通过对专家激活模式和输出表征的深入分析, 清晰地观察到不同专家针对特定语义模式形成了功能专精, 为模型决策提供了直观且有力的可解释性证据, 验证了该框架在构建高效、高性能且可信赖的情感分析系统中的巨大潜力.
一类不确定离散时间系统有限次迭代学习误差跟踪控制
陈强, 葛之琳, 成云, 王守勤, 何熊熊
当前状态:  doi: 10.16383/j.aas.c250383  cstr: 32138.14.j.aas.c250383
[摘要](69) [HTML全文](32)
摘要:
本文针对一类在有限时间内执行重复任务的不确定离散时间系统轨迹跟踪问题, 提出一种有限次迭代学习误差跟踪控制方法. 首先, 构造不依赖于参考轨迹的期望误差轨迹, 放宽传统迭代学习控制中的初值一致条件, 且离散形式的期望误差轨迹设计仅需已知每次迭代的误差初值, 简化设计要求. 其次, 通过在迭代轴上构建饱和迭代吸引律, 设计带有干扰补偿的迭代学习控制器, 并推导出跟踪误差的稳态误差带和满足精度要求所需的最大迭代次数表达式, 根据期望精度选择控制器参数, 在参数设计阶段保证系统鲁棒性, 实现跟踪误差有限次迭代收敛. 最后, 通过数值仿真和实验结果验证所提控制方法的有效性.
一种基于双支协同滤波网络的目标跟踪方法
张文安, 乔小龙, 林安迪, 杨旭升
当前状态:  doi: 10.16383/j.aas.c250590  cstr: 32138.14.j.aas.c250590
[摘要](89) [HTML全文](53)
摘要:
针对时序−状态相关性提取不足引起的目标跟踪性能下降问题, 提出了一种基于双支协同滤波网络(Dual-Branch Collaborative Filtering Network, DBCF-Net)的目标跟踪方法. 首先, 为实现运动模型和过程噪声参数的动态调整, 分别设计了非马尔可夫信息网络和状态相关信息网络, 以学习运动目标状态演化过程中的时序依赖性及其状态变量间的局部相关性. 其次, 设计了一种基于最大均值差异(Maximum Mean Discrepancy, MMD)的网络权重协同更新机制, 通过差异化分支网络输出特征来增强分支网络间的学习互补性, 从而提升DBCF-Net对未知运动模式的适应能力. 进而, 融合贝叶斯滤波与神经网络的优势, 引入无偏量测转换到DBCF-Net以增强目标跟踪的鲁棒性. 最后, 通过目标跟踪实验验证了DBCF-Net的有效性.
基于门控渐进高斯滤波网络的人体运动估计
杨旭升, 杨基业, 张文安
当前状态:  doi: 10.16383/j.aas.c250250  cstr: 32138.14.j.aas.c250250
[摘要](89) [HTML全文](32)
摘要:
针对表面肌电信号和人体运动等模型误差引起的运动估计性能下降问题, 提出一种基于门控渐进高斯滤波网络(gated progressive Gaussian filtering network, GPGF-net) 的人体运动估计方法, 以实现对模型误差的补偿以及提升运动估计的精度. 首先, 设计门控记忆机制来调控信息流, 以学习出系统状态的长期依赖与观测信号的时变特性, 从而动态调整误差补偿项的分布参数. 其次, 通过融合贝叶斯滤波与深度学习的优势, 引入渐进式观测更新策略到GPGF-net, 以减小非线性近似误差以及增强模型鲁棒性. 最后, 通过人体肢体运动估计实验表明, 相较于现有方法, GPGF-net显著提高了估计精度, 均方根误差降低15.62 %, 相关系数R2提升5.08 %, 验证了所提方法的有效性.
基于视觉特征提示的跨类别航天器关键点检测方法
周栋, 马炜钊, 孙光辉, 胡瑀晖, 贺子鹏, 张兵
当前状态:  doi: 10.16383/j.aas.c250472  cstr: 32138.14.j.aas.c250472
[摘要](51) [HTML全文](74)
摘要:
航天器视觉位姿估计是空间智能在轨服务的技术核心, 其往往采用关键点检测与位姿解算相结合的两阶段方案. 然而, 现有的航天器关键点检测方法通常利用单一航天器的视觉图像数据进行训练, 因此, 它们无法适用于其他类型的航天器目标, 这严重限制了空间在轨服务的推广与应用. 为此, 提出一种基于视觉特征提示的跨类别航天器关键点检测方法. 当针对未知类别的新目标航天器时, 该方法仅需要给定一张支持图像和对应的关键点提示, 便可以准确预测出目标航天器关键点在查询图像中的位置. 为进一步验证所提方法的有效性, 依托虚拟仿真平台构建一个包含多种航天器、二维关键点标注以及三维姿态标注的多航天器位姿估计数据集. 在该数据集上进行的大量实验结果表明, 所提方法在跨类别航天器关键点检测任务中表现出色, 显著优于当前主流的关键点检测方法. 此外, 该方法与传统PnP算法相结合, 可以实现对任意航天器的高精度位姿估计. 本文方法的代码和数据集均已开源, 详见https://github.com/Dongzhou-1996/CSKDet.
针对目标检测的可迁移性对抗补丁生成方法
燕庆龙, 向昕宇, 张浩, 马佳义
当前状态:  doi: 10.16383/j.aas.c250300  cstr: 32138.14.j.aas.c250300
[摘要](117) [HTML全文](73)
摘要:
随着目标检测模型在实际应用中的广泛部署, 其安全性问题日益成为研究热点. 对抗攻击技术通过精心设计对抗补丁, 能够有效诱导模型产生错误预测, 揭示了深度神经网络在决策过程中存在的内在脆弱性. 为提升对抗补丁在不同检测器上的攻击迁移性, 现有方法大多依赖静态权重融合策略进行联合优化, 难以充分协调不同检测器在脆弱性分布及优化动态上的差异, 导致攻击效果无法在各模型间兼顾, 迁移能力受到显著限制. 针对这一挑战, 提出一种基于多任务动态重加权机制的可迁移性对抗补丁生成框架. 该框架设计全局校正因子和局部校正因子, 分别从任务间整体优化进度及单任务细粒度收敛行为两个层面动态调整任务权重, 实现多模型联合优化过程中的协调与鲁棒性提升. 通过系统性的数字域与物理域实验验证, 所提方法显著增强了对抗补丁在不同目标检测器上的对抗攻击迁移性, 并且在真实物理的部署中表现出优秀的攻击效果.
基于时序大数据的飞行安全状态评估方法综述
杨洁, 唐荻音, 马泽珊, 刘宝鼎, 贡欣宇, 文正旭, 于劲松, 卢劲鹏, 康锐, 韩丹阳, 陶来发, 冯灿, 刘涛
当前状态:  doi: 10.16383/j.aas.c250449  cstr: 32138.14.j.aas.c250449
[摘要](145) [HTML全文](104)
摘要:
随着全球航班规模与运行密度提升, 传统人工监控方法在应对复杂动态飞行环境方面逐渐显现出局限性. 近年来, 数据驱动的智能监控方法成为提升飞行安全与运行效率的研究热点. 本文对基于时序大数据的飞行安全状态评估方法进行综述, 从飞行数据的时序特性出发, 梳理三类面向不同时间维度的关键方法: 异常检测、征兆挖掘以及趋势跟踪与预测, 涵盖飞行异常状态的识别与潜在风险事件的早期预警与预测. 首先, 对上述三类评估方法进行系统定义, 可覆盖“过去−现在−未来”的安全保障. 其次, 介绍各类方法的代表性研究进展与存在问题; 以高风险进近阶段为典型场景, 分析评估方法的应用现状与协同机制, 并回顾其技术支撑, 包括数据通信和软件平台. 最后, 总结当前挑战和未来方向, 包括异常检测的可解释性、征兆事件的动态表征与定位、趋势预测与因果推理的融合, 以及大模型应用潜力等.
基于结构频谱感知框架的配电网点云语义分割
唐友源, 张辉, 杜瑞, 张恺宁, 曹云康, 别克扎提·巴合提, 陈厚权, 王耀南
当前状态:  doi: 10.16383/j.aas.c250540  cstr: 32138.14.j.aas.c250540
[摘要](90) [HTML全文](64)
摘要:
配电网点云语义分割对于实现无人化巡检与智能电网运维具有重要意义. 尽管已有方法在空间建模与结构增强方面取得了一定进展, 但在频谱特征挖掘与大规模点云处理效率上仍面临突出挑战. 为此, 本文提出一种结构频谱感知框架(Structure Spectrum-Aware Framework, SSAF), 以提升长距离配网场景下的点云表达能力. 在数据预处理阶段, 提出了一种结合结构引导的层级点云去噪策略与结构感知的样本划分方法, 在压缩冗余背景点云的同时, 有效保持杆塔、导线等关键目标的结构完整性与连续性. 在语义分割阶段, 构建空谱协同语义分割网络(Spatial-Spectral Collaborative Semantic Segmentation Network, SSCNet), 引入局部极坐标系以增强方向敏感特征的建模能力, 并设计基于注意力图的动态融合机制, 实现空间特征与频谱特征之间的自适应交互与信息增强. 实验结果表明, SSAF能在真实配电网场景点云数据集上实现更高的分割精度与推理效率, 在多个关键指标上显著优于现有主流方法, 验证了其在复杂场景下的实用性与工程潜力.
面向复杂工程系统的安全分析研究综述
王德琳, 张可, 朱哲人, 陈小龙, 陈志文, 蒋朝辉, 柴毅, 宋执环
当前状态:  doi: 10.16383/j.aas.c250493  cstr: 32138.14.j.aas.c250493
[摘要](161) [HTML全文](163)
摘要:
面向工程系统运行安全的分析技术对于提升风险感知、预防潜在安全事故发生、保障系统安全可靠运行具有重要意义. 然而, 随着工程系统功能与结构的复杂化、内部组件之间非线性相互作用的日益增强, 其运行过程中的安全分析往往面临着安全事件难以系统识别、评估指标难以准确选取、风险传播机制难以清晰刻画、安全边界难以有效量化等诸多挑战. 为此, 本文系统地梳理复杂工程系统运行过程中安全的定义及其内涵, 阐述安全分析的整体实施框架. 全面回顾和总结有关安全事件分析、评估指标选取、事故模型构建及安全区域刻画等方面的研究进展, 并对该领域未来的发展趋势与研究方向进行探讨.
视听多模态学习综述
宣寒宇, 陈强, 吴之亮, 韩向敏, 董文祥, 马楠
当前状态:  doi: 10.16383/j.aas.c250341  cstr: 32138.14.j.aas.c250341
[摘要](216) [HTML全文](279)
摘要:
在人类信息获取过程中, 视听觉扮演着重要角色, 大脑通过整合视听信息, 形成统一、连贯且稳定的知觉体验. 视听多模态学习旨在模拟人类的视听多感官整合能力, 近年来受到研究者的广泛关注. 然而, 该领域在应用场景、任务目标和技术方法上呈现出显著的多样性, 目前尚且缺乏对视听多模态学习领域系统性回顾和分析的综合性中文综述. 基于人类的多感官整合机制在视听认知中的重要性以及不同视听多模态学习任务间的内在关联性, 提出一个统一框架, 将现有研究归纳为三类: 视听增强通过引入音频或视觉信息实现对初始单模态任务的增强效应; 跨模态交互旨在探索视听信息间的相互转换; 视听协作致力于探索视听信息的综合理解方法及其协同效应. 在此基础上, 对该领域中的最新研究进展进行系统性综述和总结. 此外, 深入剖析当前视听多模态学习研究所面临的五大核心共性问题和挑战---视听表征、对齐、转换、融合和共同学习; 并探讨大模型背景下视听多模态学习的发展现状.
基于专家经验引导的浮选泡沫图像表征学习
张进, 黄嘉豪, 艾明曦, 唐朝晖, 谢永芳, 马军
当前状态:  doi: 10.16383/j.aas.c250628  cstr: 32138.14.j.aas.c250628
[摘要](144) [HTML全文](99)
摘要:
矿浆品位等关键指标难以通过传感器在线直接测量, 研究利用易获取的过程运行数据与泡沫图像间接估计矿浆品位的软测量方法具有重要工程意义. 针对传统泡沫图像表征方法表征能力不足且泛化性差的问题, 提出专家经验引导的泡沫图像表征学习方法. 该方法由分布特征隔离与经验引导表征学习两部分构成: 前者将泡沫图像映射至尺寸、颜色、纹理等具有明确工艺解释意义的视觉属性子空间, 以及用于补充隐性判别信息的数据特征子空间, 实现结构化的视觉属性表征; 后者通过构造模拟人工视觉判断过程的对比学习机制, 引导模型在各子空间中学习与专家经验一致的判别特征, 建立视觉属性子空间与专家知识之间的显式对应关系. 基于中国某铅锌浮选厂的工业数据实验结果表明, 所提方法在锌、铅、铁底流品位软测量中的决定系数较近期提出的软测量模型DEFIE分别提升 3.97%、1.97%和 2.40%.
基于非合作博弈的四轮独立驱动电动汽车轮毂电机群稳定性裕度与能效优化管理
丁月恒, 王禹棋, 花为, 许德智, 吴中泽
当前状态:  doi: 10.16383/j.aas.c250629  cstr: 32138.14.j.aas.c250629
[摘要](94) [HTML全文](202)
摘要:
针对四轮独立驱动电动汽车轮毂电机转矩矢量控制中稳定性与经济性相冲突的问题, 提出一种基于稳定裕度博弈与分层优化的协同控制策略. 首先建立车辆动力学模型与高保真能耗模型; 进而设计分层控制器: 上层基于线性二次调节器计算广义横摆力矩, 中层通过模型预测控制在相平面稳定裕度约束下以系统损耗最小为目标优化横摆力矩与分配权重, 下层利用二次规划算法求解最优轮端转矩. 基于dSPACE平台的硬件在环仿真结果表明, 在双移线工况下, 所提策略在保证稳定性的同时能耗降低5.7%, 具有优良的综合性能与鲁棒性.
基于相关熵核学习演化模糊系统的混沌时间序列在线预测
胡磊, 许星晗, 刘建卫, 韩敏
当前状态:  doi: 10.16383/j.aas.c250343  cstr: 32138.14.j.aas.c250343
[摘要](82) [HTML全文](69)
摘要:
演化模糊系统(EFSs)是在线学习领域中广泛应用的方法. 然而, 大部分EFSs往往隐含高斯噪声假设, 在重尾、偏态及强相关等非高斯扰动下易出现性能退化. 为此, 提出一种相关熵核学习演化模糊系统(CKL-EFS). CKL-EFS融合结构自组织与鲁棒递归学习两种机制, 以提升非高斯噪声环境下的在线建模能力. 在结构演化方面, 模型基于数据密度与激活度实现数据云的按需生成与效用驱动移除, 并通过在线归属更新维护数据云统计量, 从而抑制规则库无界膨胀并保持紧凑结构; 在参数更新方面, 采用核学习策略将输入映射至高维特征空间, 并引入改进相关熵准则对大误差样本自适应降权, 以增强对离群冲击与非高斯噪声的鲁棒性. 此外, 给出模型的计算复杂度分析. 在多个公开数据集上的实验结果表明, 所提CKL-EFS在预测精度与抗非高斯扰动稳定性方面均优于现有代表性方法.
宇航用处理器发展与展望
年嘉伟, 王旭茹, 刘鸿瑾, 房方, 杨孟飞
当前状态:  doi: 10.16383/j.aas.c250393  cstr: 32138.14.j.aas.c250393
[摘要](147) [HTML全文](102)
摘要:
本文系统回顾美国、欧洲及我国在宇航用处理器领域的技术演进, 重点分析了基于PowerPC架构的美国代表性处理器产品以及采用SPARC架构的欧洲与我国典型处理器方案. 研究揭示, 未来宇航用处理器的发展将显著分化为通用型与智能型两大技术路线. 通用型宇航用处理器将呈现高性能(如提升多核并行计算能力)、高集成度(如实现系统级芯片SoC)、高可靠性(如强化抗辐射设计)及低功耗的协同发展趋势; 而智能型处理器则将侧重于提升在轨实时智能信息处理能力.
基于多模态特征融合与局部感知推理的多智能体分布式路径协作方法
霍琳, 毛剑琳, 伞红军, 付丽霞, 宣志玮, 贺志刚
当前状态:  doi: 10.16383/j.aas.c250593  cstr: 32138.14.j.aas.c250593
[摘要](150) [HTML全文](76)
摘要:
在部分可观测且动态变化的环境中, 深度强化学习(DRL) 为多智能体路径规划(MAPF) 提供了具备自学习、泛化与动态适应能力的分布式求解途径. 然而,DRL 在该问题中仍存在协调性不足与局部近视两个挑战: 智能体间的隐式交互易引发冲突, 仅依赖局部观测的反应式避障又导致路径冗长与全局偏离. 为此, 提出一种基于多模态特征融合与局部感知推理的分布式路径协作方法(local yielding and reasoning for agents, LYRA). 该方法在分布式DRL 框架下构建从感知到决策的学习体系, 使智能体能依托局部观测实现推理与隐式让行. 多模态状态编码器融合局部碰撞线索与全局路径语义, 平衡即时避障与长期导航目标; 奖励引导的路径学习策略保证局部决策与全局任务一致; 群体协作机制通过隐式优先级推理化解局部冲突; 自适应学习率机制动态调节策略更新以提升训练稳定性. 实验结果表明, LYRA 在任务成功率与安全性上较基线方法分别提升约35 % 和25 %, 在不同环境复杂度下保持良好泛化性, 为实现高效鲁棒的分布式多智能体路径规划提供了新范式.
结构仿生六杆张拉整体机器人折叠控制的形态智能方法
石家旭, 陶子辰, 桂昀, 刘珂, 刘华平, 方浩, 杨庆凯
当前状态:  doi: 10.16383/j.aas.c250529  cstr: 32138.14.j.aas.c250529
[摘要](92) [HTML全文](67)
摘要:
形态智能通常指机器人利用"身体"的物理特性、几何结构以及动力学特征等简化复杂的计算(如控制器设计), 具备良好环境适应性的特点, 是实现具身智能的核心机制. 本文针对六杆张拉整体完全折叠问题, 提出一种利用形态智能机理简化控制方法, 实现部分绳驱下机器人整体的等效折叠. 首先基于"端点聚拢"形态构造折叠目标, 通过结构对称性分析得到四种折叠模式及对应的绳长变化量. 再通过图论回路空间分析, 识别由几何构型产生的冗余绳长变化量, 基于此确定折叠过程中的被控绳. 然后在静力学框架下建立电机输入与绳长变化映射关系并给出可达性判据, 以此得到每种模式下简化控制策略. 最后通过MATLAB准静态仿真及实物实验, 验证了所提方法的有效性. 四种折叠模式下的简化控制策略均能实现机器人完全折叠, 驱动绳的数量可由传统方法的24降低至9. 展现了形态智能在简化机器人控制器设计方面的潜力.
基于超宽带信息智能决策的无人机自主精确定位方法
贾镜汀, 李文硕, 田波, 余翔
当前状态:  doi: 10.16383/j.aas.c250526  cstr: 32138.14.j.aas.c250526
[摘要](123) [HTML全文](94)
摘要:
在卫星信号拒止环境中实现无人机的高精度定位是一项关键且具有挑战性的任务. 针对这一难题, 提出一种基于超宽带信息智能决策的无人机自主精确定位方法, 通过超宽带的全局测距校正视觉惯性里程计的累计误差, 从而显著提升定位结果的精确性与鲁棒性. 具体来说, 采用复合干扰滤波方法对超宽带定位中存在的多源异质干扰进行处理; 同时构建超宽带信息评估模块, 对定位结果的可靠性进行量化评估. 实验结果表明, 所提基于超宽带信息智能决策的无人机自主精确定位方法有效提高无人机定位精度.
非完备模态下的可靠多媒体推荐方法
檀彦超, 沈春旭, 陈佳敏, 马国芳, 林政鸿, 王石平, 易玲玲
当前状态:  doi: 10.16383/j.aas.c240659  cstr: 32138.14.j.aas.c240659
[摘要](124) [HTML全文](140)
摘要:
随着多模态内容的快速增长, 多媒体推荐系统在数据挖掘中发挥着重要作用. 然而, 现有方法通常假设项目具有完备的多模态信息, 难以适应真实场景中的模态缺失问题. 针对这一挑战, 提出一种融合稀疏超图与模态特定二分图的非完备多媒体推荐框架(S2GRec). 该框架通过基于稀疏超图的自适应模态补全机制, 捕获模态内高阶相似性, 实现无监督的缺失模态补全, 并进一步利用模态特定二分图建模用户在不同模态视角下的偏好, 以提升推荐性能. 在多个公开数据集及大规模工业数据集上的实验结果表明, S2GRec在召回率、准确率和NDCG等指标上较现有方法平均提升4.42%, 验证了其在非完备多媒体推荐任务中的有效性.
水陆两栖跨介质仿生机器人研究进展
秦博扬, 李磊, 孔诗涵, 喻俊志
当前状态:  doi: 10.16383/j.aas.c250507  cstr: 32138.14.j.aas.c250507
[摘要](204) [HTML全文](196)
摘要:
水陆两栖机器人凭借其跨介质运动能力, 在巡检、侦察、生态监测等多个领域展现出广阔的应用前景. 仿生学通过借鉴水陆两栖动物的形态结构与运动策略, 为提升机器人的环境适应性与运动机动性提供重要的设计思路. 首先, 系统梳理具有不同形态特征的典型水陆两栖生物, 并阐明其推进机制对机器人设计所产生的双向促进作用. 其次, 以推进策略为主线, 将现有两栖机器人划分为采用统一驱动的单一推进机制(包括鳍推进、刚性肢体推进、柔性肢体推进及连续体波推进)以及采用不同驱动方式的混合推进机制, 分别介绍各类代表性仿生两栖机器人原型样机, 并分析各种推进方式在不同介质的适应性变化及效能. 随后, 总结感知、驱动与控制等关键技术的当前发展状况, 比较不同推进模式下控制策略的共性与差异. 最后, 结合跨介质多场景运动、具身智能及物理智能等前沿理念, 探讨水陆两栖仿生机器人未来的研究方向与应用前景.
源代码处理任务中的深度学习模型对抗攻防研究综述
潘海为, 马宝英, 张可佳, 杨晓阳, 秦颖鑫, 卢国强, 范书平
当前状态:  doi: 10.16383/j.aas.c250331  cstr: 32138.14.j.aas.c250331
[摘要](241) [HTML全文](327)
摘要:
随着智能软件的发展, 深度学习模型在缺陷检测与定位等源代码处理任务中的应用日益广泛, 但其鲁棒性不足的问题也逐渐凸显. 众多学者对源代码对抗攻击与防御方法进行深入研究. 然而, 现有综述鲜有从源代码任务特性出发总结模型特点, 也缺乏对模型窃取、后门防御和防御蒸馏等典型对抗攻防方法的梳理与分析. 本文从模型架构视角入手, 首先系统归纳面向源代码处理任务的深度学习模型, 分析其在对抗攻击环境下的表现与适应性. 随后对源代码对抗攻击与防御方法进行全面分类与综述, 并汇总相关基准数据集. 最后分析现有研究的不足, 提出未来的潜在研究方向.
基于分层策略强化学习的多类型流量差异化路由优化
赵之栩, 刘坤, 王璐瑶, 夏元清
当前状态:  doi: 10.16383/j.aas.c250413  cstr: 32138.14.j.aas.c250413
[摘要](267) [HTML全文](319)
摘要:
路由是优化网络资源分配的重要方法. 然而, 传统路由算法依赖静态策略优化单一服务质量指标, 难以应对多类型流量爆发性增长下的差异化需求. 尽管深度强化学习为动态网络环境下的路由优化提供了新思路, 现有方法仍缺乏对流量类型的精细化感知能力, 无法灵活调整路由策略. 为此, 本文针对不同类型流量的差异化路由需求, 设计一种基于分层策略强化学习的流量感知路由算法. 首先, 引入流量分类模块, 实现对不同流量差异化业务需求的精细感知. 其次, 利用图卷积网络对网络拓扑进行高效建模, 并在此基础上设计分层决策网络以及差异化奖励函数, 引导智能体生成自适应路由决策, 实现对各流量类别路由策略的动态调整. 同时, 在演员-评论家框架中引入全局注意力机制, 增强智能体对网络状态时空依赖关系的建模能力, 并通过广义优势估计和近端策略优化算法提升训练的效率与稳定性. 最后, 在多种拓扑网络上验证了所提算法的有效性.
基于“形态−感知−动作”仿生机理的机器人自适应力控抓取方法
赵洲, 耿明强, 何秋实, 何赟鑫, 蔡明达, 周翔宇, 罗晶
当前状态:  doi: 10.16383/j.aas.c250453  cstr: 32138.14.j.aas.c
[摘要](423) [HTML全文](389)
摘要:
随着机器人技术快速发展, 其对精细感知能力需求日益增长. 然而, 现有机器人仍难以具备如人类般灵活的操作能力. 在精细抓取任务中, 机器人恒力抓取策略存在局限性: 抓取力过大易损伤物体, 抓取力过小则导致抓取不稳. 为应对上述问题, 提出一种基于视觉与触觉融合的机器人自适应力控抓取方法. 该方法由视觉模块、触觉模块和抓取策略组成: 视觉模块用于预测目标抓取位置; 在接触阶段, 触觉模块借助视触觉传感器恢复触觉深度并估算接触面积与法向力; 随后, 通过最大深度变化率和帧间均方差进行形变判定, 并触发抓取力调整策略, 从而实现“渐进增力–形变检测–力回退”的仿生反馈抓取机制. 实验结果表明, 该方法将多种日常物体的整体抓取成功率由87.50% 提升至98.75%, 在易碎物体抓取中实现零损坏.
视觉SLAM运动分割技术综述
冯嘉琪, 杨恺伦, 林家丞, 杨观赐
当前状态:  doi: 10.16383/j.aas.c250365  cstr: 32138.14.j.aas.c250365
[摘要](571) [HTML全文](794)
摘要:
作为移动机器人与自动驾驶领域的关键基础技术, 视觉同时定位与地图构建(V-SLAM)在动态环境中面临严峻挑战. 由动态物体引起的特征匹配错误常常导致定位偏差、地图失真以及系统鲁棒性受损. 运动分割技术是提高V-SLAM性能的重要手段, 但在复杂动态场景中准确区分静态和动态元素仍极具挑战性. 本文系统梳理V-SLAM运动分割研究进展, 根据对环境的潜在假设, 将现有方法分为三个主要研究范式, 并给出各范式的技术原理, 代表性策略的核心优势、本质局限及适用边界. 最后展望未来的研究方向.
工业边缘异构集群的大模型分布式弹性推理框架
陈致蓬, 何健, 沈玲, 桂卫华
当前状态:  doi: 10.16383/j.aas.c250497  cstr: 32138.14.j.aas.c250497
[摘要](497) [HTML全文](626)
摘要:
在工业4.0时代, 大语言模型向工业边缘异构集群的迁移已成为一项关键技术挑战.边缘设备计算与存储资源受限、动态负载波动、异构架构复杂以及网络高延迟等特性, 使得传统推理框架难以满足工业场景对实时性、鲁棒性和隐私保护的需求.提出一种动态弹性推理框架(Dynama), 设计全域心跳被动感知器和实时弹性量化调度算法.该框架采用管道环并行结构, 实现模型层动态分配与懒加载; 通过被动监测设备延迟向量, 触发实时弹性量化调度算法在不改变层分配前提下优化量化版本, 平衡延迟最小化和精度损失. Dynama通过优化数据传输与量化策略, 显著提升高延迟网络环境下的推理效率, 适应工业边缘的动态环境变化.实验结果表明, Dynama在工业边缘异构集群中展现出优异的实时性与鲁棒性, 为工业智能的落地应用提供高效、可靠的解决方案.
3D空间先验驱动的相机轨迹可控视频扩散生成模型
朱泓舟, 杨雪, 赵敏, 李崇轩, 朱军
当前状态:  doi: 10.16383/j.aas.c250124  cstr: 32138.14.j.aas.c250124
[摘要](441) [HTML全文](477)
摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
一种基于单比特通信压缩的大模型训练方法研究
陈楚岩, 刘烨谞, 贾维宸, 何雨桐, 袁坤, 王立威
当前状态:  doi: 10.16383/j.aas.c250087  cstr: 32138.14.j.aas.c250087
[摘要](939) [HTML全文](621)
摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
面向大模型时代的持续学习方法论演变
王全子昂, 王仁振, 孟德宇, 徐宗本
当前状态:  doi: 10.16383/j.aas.c240805  cstr: 32138.14.j.aas.c240805
[摘要](2690) [HTML全文](1500) [PDF 2727KB](454)
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
基于 PID 自整定功能的自适应双路输出的黑体温度控制
张海弟
当前状态:  doi: 10.16383/j.aas.c190277
[摘要](1500) [HTML全文](944)
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
仿人智能控制理论及应用研究进展
戴小文, 宋建霖, 岳丽全
当前状态:  doi: 10.16383/j.aas.c200007
[摘要](2903) [HTML全文](1479)
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
基于生成对抗网络的对抗攻击防御模型
孔锐, 蔡佳纯, 黄钢
当前状态:  doi: 10.16383/j.aas.2020.c200033
[摘要](3660) [HTML全文](2407)
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.