• 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

优先发表

优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
基于超宽带信息智能决策的无人机自主精确定位方法
贾镜汀, 李文硕, 田波, 余翔
, doi: 10.16383/j.aas.c250526 , cstr: 32138.14.j.aas.c250526
摘要:
在卫星信号拒止环境中实现无人机的高精度定位是一项关键且具有挑战性的任务. 针对这一难题, 提出一种基于超宽带信息智能决策的无人机自主精确定位方法, 通过超宽带的全局测距校正视觉惯性里程计的累计误差, 从而显著提升定位结果的精确性与鲁棒性. 具体来说, 采用复合干扰滤波方法对超宽带定位中存在的多源异质干扰进行处理; 同时构建超宽带信息评估模块, 对定位结果的可靠性进行量化评估. 实验结果表明, 所提基于超宽带信息智能决策的无人机自主精确定位方法有效提高无人机定位精度.
基于相关熵核学习演化模糊系统的混沌时间序列在线预测
胡磊, 许星晗, 刘建卫, 韩敏
, doi: 10.16383/j.aas.c250343 , cstr: 32138.14.j.aas.c250343
摘要:
演化模糊系统(EFSs)是在线学习领域中广泛应用的方法. 然而, 大部分EFSs往往隐含高斯噪声假设, 在重尾、偏态及强相关等非高斯扰动下易出现性能退化. 为此, 提出一种相关熵核学习演化模糊系统(CKL-EFS). CKL-EFS融合结构自组织与鲁棒递归学习两种机制, 以提升非高斯噪声环境下的在线建模能力. 在结构演化方面, 模型基于数据密度与激活度实现数据云的按需生成与效用驱动移除, 并通过在线归属更新维护数据云统计量, 从而抑制规则库无界膨胀并保持紧凑结构; 在参数更新方面, 采用核学习策略将输入映射至高维特征空间, 并引入改进相关熵准则对大误差样本自适应降权, 以增强对离群冲击与非高斯噪声的鲁棒性. 此外, 给出模型的计算复杂度分析. 在多个公开数据集上的实验结果表明, 所提CKL-EFS在预测精度与抗非高斯扰动稳定性方面均优于现有代表性方法.
基于专家经验引导的浮选泡沫图像表征学习
张进, 黄嘉豪, 艾明曦, 唐朝晖, 谢永芳, 马军
, doi: 10.16383/j.aas.c250628 , cstr: 32138.14.j.aas.c250628
摘要:
矿浆品位等关键指标难以通过传感器在线直接测量, 研究利用易获取的过程运行数据与泡沫图像间接估计矿浆品位的软测量方法具有重要工程意义. 针对传统泡沫图像表征方法表征能力不足且泛化性差的问题, 提出专家经验引导的泡沫图像表征学习方法. 该方法由分布特征隔离与经验引导表征两部分构成: 前者将泡沫图像映射至尺寸、颜色、纹理等具有明确工艺解释意义的视觉属性子空间, 以及用于补充隐性判别信息的数据特征子空间, 实现结构化的视觉属性表征; 后者通过构造模拟人工视觉判断过程的对比学习机制, 引导模型在各子空间中学习与专家经验一致的判别特征, 建立视觉属性子空间与专家知识之间的显式对应关系. 基于中国某铅锌选厂的工业数据实验结果表明, 所提方法在锌、铅、铁底流品位软测量中的决定系数较近期提出的软测量模型DEFIE分别提升 3.97%、1.97%和 2.40%, 预测区间覆盖率提升15.00%.
非完备模态下的可靠多媒体推荐方法
檀彦超, 沈春旭, 陈佳敏, 马国芳, 林政鸿, 王石平, 易玲玲
, doi: 10.16383/j.aas.c240659 , cstr: 32138.14.j.aas.c240659
摘要:
随着多模态内容的快速增长, 多媒体推荐系统在数据挖掘中发挥着重要作用. 然而, 现有方法通常假设项目具有完备的多模态信息, 难以适应真实场景中的模态缺失问题. 针对这一挑战, 提出一种融合稀疏超图与模态特定二分图的非完备多媒体推荐框架(S2GRec). 该框架通过基于稀疏超图的自适应模态补全机制, 捕获模态内高阶相似性, 实现无监督的缺失模态补全, 并进一步利用模态特定二分图建模用户在不同模态视角下的偏好, 以提升推荐性能. 在多个公开数据集及大规模工业数据集上的实验结果表明, S2GRec在召回率、准确率和NDCG等指标上较现有方法平均提升4.42%, 验证了其在非完备多媒体推荐任务中的有效性.
水陆两栖跨介质仿生机器人研究进展
秦博扬, 李磊, 孔诗涵, 喻俊志
, doi: 10.16383/j.aas.c250507 , cstr: 32138.14.j.aas.c250507
摘要:
水陆两栖机器人凭借其跨介质运动能力, 在巡检、侦察、生态监测等多个领域展现出广阔的应用前景. 仿生学通过借鉴水陆两栖动物的形态结构与运动策略, 为提升机器人的环境适应性与运动机动性提供重要的设计思路. 首先, 系统梳理具有不同形态特征的典型水陆两栖生物, 并阐明其推进机制对机器人设计所产生的双向促进作用. 其次, 以推进策略为主线, 将现有两栖机器人划分为采用统一驱动的单一推进机制(包括鳍推进、刚性肢体推进、柔性肢体推进及连续体波推进)以及采用不同驱动方式的混合推进机制, 分别介绍各类代表性仿生两栖机器人原型样机, 并分析各种推进方式在不同介质的适应性变化及效能. 随后, 总结感知、驱动与控制等关键技术的当前发展状况, 比较不同推进模式下控制策略的共性与差异. 最后, 结合跨介质多场景运动、具身智能及物理智能等前沿理念, 探讨水陆两栖仿生机器人未来的研究方向与应用前景.
基于非合作博弈的四轮独立电动汽车轮毂电机群稳定性裕度与能效优化管理
丁月恒, 王禹棋, 花为, 许德智, 吴中泽
, doi: 10.16383/j.aas.c250629 , cstr: 32138.14.j.aas.c250629
摘要:
针对四轮独立驱动电动汽车轮毂电机转矩矢量控制中稳定性与经济性相冲突的问题, 提出一种基于稳定裕度博弈与分层优化的协同控制策略. 首先建立车辆动力学模型与高保真能耗模型; 进而设计分层控制器: 上层基于线性二次调节器计算广义横摆力矩, 中层通过模型预测控制在相平面稳定裕度约束下以系统损耗最小为目标优化横摆力矩与分配权重, 下层利用二次规划算法求解最优轮端转矩. 基于~dSPACE~平台的硬件在环仿真结果表明, 在双移线工况下, 所提策略在保证稳定性的同时能耗降低5.7%, 具有优良的综合性能与鲁棒性.
星群内外态势认知与安全控制的体系架构及理论方法
李文博, 刘鹏, 刘萍, 刘成瑞, 刘文静, 马亚杰, 薛文超, 党庆庆
, doi: 10.16383/j.aas.c250326 , cstr: 32138.14.j.aas.c250326
摘要:
围绕下一代空间基础设施体系建设的重大战略需求, 针对复杂任务下卫星集群的态势认知与安全控制技术展开探讨. 首先, 分析国内外卫星集群的发展现状与面临挑战, 指出当前研究在理论体系完备性、感知信息全面性、评估可信度、决策合理性及执行精准性等方面存在不足. 其次, 重点阐述星群OODA架构体系, 分别探讨感知、评估、决策与执行各环节的关键技术与研究进展. 最后, 对星群态势认知与安全控制技术的未来发展进行展望, 提出需构建能力量化表征模型, 发展多源信息交互与融合的态势全面感知、内外因素耦合影响下的可信评估以及动态场景下的快速合理决策和多目标跨尺度任务的精准执行, 以提升星群自主安全运行能力.
深度强化学习驱动的超视距空战自主决策方法
吕茂隆, 王金河, 韩浩然, 丁晨博, 万路军
, doi: 10.16383/j.aas.c250334 , cstr: 32138.14.j.aas.c250334
摘要:
随着机载传感器和中远距空空导弹技术的快速发展, 超视距空战已经成为现代空战的主流形式. 在这种复杂多变的作战环境中, 开发能够实时掌握战场态势并制定合理机动决策的智能化技术, 已成为军事技术研究领域的热点问题. 首先, 构建一个涵盖飞机六自由度动力学模型、导弹制导系统模型和雷达传感器系统的高保真仿真环境. 接着, 融合模仿学习和自博弈方法, 提出基于对手学习的空战决策框架, 以解决深度强化学习在空战中适应性和泛化性差的缺点, 提升智能体在复杂多变战场环境中快速适应和策略优化能力. 最后, 构建具有战术差异性的专家系统, 在高保真空战仿真平台中与智能体进行博弈对抗. 结果表明, 在收敛速度和胜率等关键指标上, 所提出的空战决策框架优于传统深度强化学习决策策略, 有效性和泛化性强, 可为复杂超视距空战态势下快速生成可靠策略提供技术支持.
自动驾驶系统逻辑场景全覆盖测试用例生成方法
闵海涛, 张志强, 范天昕, 张培兴, 张诚, 曲歌
, doi: 10.16383/j.aas.c250347 , cstr: 32138.14.j.aas.c250347
摘要:
基于场景的测试方法是验证自动驾驶系统安全性的主流手段, 然而逻辑场景使用参数空间的形式对场景进行描述, 当被测系统性能存在差异时, 第三方检测机构难以使用同样的测试用例在保证测试公平性的同时兼顾测试覆盖率. 为此, 提出一种基于测试用例代表性的自动驾驶系统逻辑场景全覆盖测试用例生成方法. 首先建立了自动驾驶系统全覆盖测试用例生成框架; 提出综合分析自然驾驶概率分布及危险情况的测试用例代表性量化评价方法; 开发了一种基于热度驱动层次贪心算法和遗传算法的差异化样本组合空间全覆盖问题优化求解方法, 获取测试用例参数组合实现逻辑场景参数空间全覆盖. 使用前车切入场景对本文提出的方法进行了验证. 结果表明, 本文提出的方法在逻辑场景参数空间覆盖率(100%)、测试边界拟合误差(8%)均显著高于当前主流的蒙特卡洛方法(覆盖率84.3%、拟合误差19%)与组合测试方法(覆盖率86.5%、拟合误差14%), 可有效帮助检测机构建设公平、高效的测试场景生成体系.
融合形态特征的基于GRU的介入机器人导丝轨迹预测建模
张任飞, 董林杰, 王兴松, 田梦倩, 苏浩波
, doi: 10.16383/j.aas.c250506 , cstr: 32138.14.j.aas.c250506
摘要:
在介入手术场景中, 导丝整体轨迹的预测对导航安全至关重要. 提出一种基于门控循环单元(GRU)的因果时序建模框架: 将导丝物理属性, 血管接触区形态特征与操作环境参数中的序列级常量(刚度, 进入角度, 摩擦系数等)按时间步广播, 与动态几何量(中心线坐标, 直径等)拼接, 经两层特征编码后输入单向GRU, 逐时回归二维坐标. 针对变长序列, 提出时间步长度分类策略训练机制, 在不改网络结构的前提下提升收敛与适配能力. 实验结果表明, 在多类导丝与多进入角度条件下, 模型在保持因果性的同时兼具准确性与实时性: 最小误差0.40 mm, 平均误差0.46 mm, 最大误差0.54 mm; 相较未采用分类策略的基线, 收敛epoch降低42%, 训练用时降低52%, 单次推理时延降低51%. 本研究为介入机器人导丝轨迹建模与术中导航提供了可部署的算法基础.
源代码处理任务中的深度学习模型对抗攻防研究综述
潘海为, 马宝英, 张可佳, 杨晓阳, 秦颖鑫, 卢国强, 范书平
, doi: 10.16383/j.aas.c250331 , cstr: 32138.14.j.aas.c250331
摘要:
随着智能软件的发展, 深度学习模型在缺陷检测与定位等源代码处理任务中的应用日益广泛, 但其鲁棒性不足的问题也逐渐凸显. 众多学者对源代码对抗攻击与防御方法进行深入研究. 然而, 现有综述鲜有从源代码任务特性出发总结模型特点, 也缺乏对模型窃取、后门防御和防御蒸馏等典型对抗攻防方法的梳理与分析. 本文从模型架构视角入手, 首先系统归纳面向源代码处理任务的深度学习模型, 分析其在对抗攻击环境下的表现与适应性. 随后对源代码对抗攻击与防御方法进行全面分类与综述, 并汇总相关基准数据集. 最后分析现有研究的不足, 提出未来的潜在研究方向.
基于双高斯分布混合的可解释自适应鲁棒神经网络建模方法
刘鑫, 李琪琪, 代伟
, doi: 10.16383/j.aas.c250602 , cstr: 32138.14.j.aas.c250602
摘要:
工业过程数据常常受到混合噪声干扰, 传统基于单一厚尾分布的鲁棒建模方法在处理混合噪声问题时, 在准确性与可解释性方面均存在一定局限. 基于此, 提出一种混合双高斯分布的可解释鲁棒自适应建模方法. 该方法首先采用随机配置算法构建基础的随机配置网络学习模型, 确定模型的隐含层节点数、输入权重和偏置; 其次为保证模型对混合噪声的鲁棒性, 构建双高斯分布(一大一小方差)加权组合而成的噪声表征模型; 随后利用期望最大化方法自适应迭代学习随机配置网络输出权值和混合高斯模型噪声参数, 最终形成基于双高斯分布混合鲁棒建模方法. 该方法具有以下优势: 噪声模型能够通过参数自适应学习逼近实际混合噪声特性, 其中大方差高斯分量负责对异常噪声进行粗调, 小方差高斯分量则用于精细拟合主体噪声, 从而增强模型的可解释性; 在网络模型输出权值估计过程中, 通过为每个输出数据点自适应分配惩罚权重, 保障模型的鲁棒性能. 为验证所提方法的有效性, 分别在函数仿真、基准数据集和工业实例上设计多组对比实验, 结果均表明所提方法具备良好的可靠性与实用性.
基于行为预测和策略融合的轨道博弈决策方法
王英杰, 袁利, 黄煌, 耿远卓
, doi: 10.16383/j.aas.c250268 , cstr: 32138.14.j.aas.c250268
摘要:
轨道追逃博弈中逃逸策略的高度未知性与行为多样性, 给追踪策略的泛化能力带来了严峻挑战. 深度强化学习虽可提升追踪星的博弈效能, 但当逃逸策略偏离训练分布时, 策略网络易产生次优甚至失效的决策. 为此, 本文提出一种基于行为预测和策略融合的轨道博弈决策方法. 在训练阶段, 首先采用“预测制导+人工势场法”构建多样化逃逸策略集. 随后在传统演员−评论家训练框架基础上, 通过引入预测网络构建预测器−演员−评论家算法, 针对每类逃逸策略分别训练以获得对应的追踪子策略. 其中预测网络用于估计逃逸星动作, 并通过预测结果与真实动作的相似性衡量子策略与未知逃逸策略的匹配度. 在执行阶段, 策略融合器以逃逸星历史动作与各追踪子策略的预测结果为输入, 动态计算匹配度并选择最优子策略进行博弈决策. 实验结果表明, 预测网络能有效评估追踪子策略对未知逃逸策略的适应性, 策略融合器可显著提升追踪星面对多样化逃逸策略的泛化能力与可靠性.
基于分层策略强化学习的多类型流量差异化路由优化
赵之栩, 刘坤, 王璐瑶, 夏元清
, doi: 10.16383/j.aas.c250413 , cstr: 32138.14.j.aas.c250413
摘要:
路由是优化网络资源分配的重要方法. 然而, 传统路由算法依赖静态策略优化单一服务质量指标, 难以应对多类型流量爆发性增长下的差异化需求. 尽管深度强化学习为动态网络环境下的路由优化提供了新思路, 现有方法仍缺乏对流量类型的精细化感知能力, 无法灵活调整路由策略. 为此, 本文针对不同类型流量的差异化路由需求, 设计一种基于分层策略强化学习的流量感知路由算法. 首先, 引入流量分类模块, 实现对不同流量差异化业务需求的精细感知. 其次, 利用图卷积网络对网络拓扑进行高效建模, 并在此基础上设计分层决策网络以及差异化奖励函数, 引导智能体生成自适应路由决策, 实现对各流量类别路由策略的动态调整. 同时, 在演员-评论家框架中引入全局注意力机制, 增强智能体对网络状态时空依赖关系的建模能力, 并通过广义优势估计和近端策略优化算法提升训练的效率与稳定性. 最后, 在多种拓扑网络上验证了所提算法的有效性.
基于“形态−感知−动作”仿生机理的机器人自适应力控抓取方法
赵洲, 耿明强, 何秋实, 何赟鑫, 蔡明达, 周翔宇, 罗晶
, doi: 10.16383/j.aas.c250453 , cstr: 32138.14.j.aas.c
摘要:
随着机器人技术快速发展, 其对精细感知能力需求日益增长. 然而, 现有机器人仍难以具备如人类般灵活的操作能力. 在精细抓取任务中, 机器人恒力抓取策略存在局限性: 抓取力过大易损伤物体, 抓取力过小则导致抓取不稳. 为应对上述问题, 提出一种基于视觉与触觉融合的机器人自适应力控抓取方法. 该方法由视觉模块、触觉模块和抓取策略组成: 视觉模块用于预测目标抓取位置; 在接触阶段, 触觉模块借助视触觉传感器恢复触觉深度并估算接触面积与法向力; 随后, 通过最大深度变化率和帧间均方差进行形变判定, 并触发抓取力调整策略, 从而实现“渐进增力–形变检测–力回退”的仿生反馈抓取机制. 实验结果表明, 该方法将多种日常物体的整体抓取成功率由87.50% 提升至98.75%, 在易碎物体抓取中实现零损坏.
基于观测器的混杂切换多智能体系统有界群一致性追踪
裴惠琴, 谭鉴恒, 肖红利, 梁炜森
, doi: 10.16383/j.aas.c250303 , cstr: 32138.14.j.aas.c
摘要:
考虑脉冲作用下基于观测器二阶混杂切换多智能体系统的有界群一致性追踪问题, 建立一种在脉冲作用下的混杂切换多智能体系统动力学模型, 每个跟踪智能体只能够获取邻居智能体或者目标的位置信息. 然而, 每个跟踪智能体并不能获得邻居和目标的速度信息. 针对跟踪智能体在获取邻居和目标速度信息方面存在的限制, 设计一种基于目标加速度和智能体位置的状态观测器, 为跟踪智能体提供其子群目标的速度估计. 在此基础上, 提出一种在脉冲作用下基于目标速度观测器的有界群一致性追踪控制策略, 通过矩阵理论和Hurwitz稳定性判据, 证明了在该策略下系统可实现有界群一致性追踪. 仿真实例验证了所提出方法的有效性.
视觉SLAM运动分割技术综述
冯嘉琪, 杨恺伦, 林家丞, 杨观赐
, doi: 10.16383/j.aas.c250365 , cstr: 32138.14.j.aas.c250365
摘要:
作为移动机器人与自动驾驶领域的关键基础技术, 视觉同时定位与地图构建(V-SLAM)在动态环境中面临严峻挑战. 由动态物体引起的特征匹配错误常常导致定位偏差、地图失真以及系统鲁棒性受损. 运动分割技术是提高V-SLAM性能的重要手段, 但在复杂动态场景中准确区分静态和动态元素仍极具挑战性. 本文系统梳理V-SLAM运动分割研究进展, 根据对环境的潜在假设, 将现有方法分为三个主要研究范式, 并给出各范式的技术原理, 代表性策略的核心优势、本质局限及适用边界. 最后展望未来的研究方向.
工业边缘异构集群的大模型分布式弹性推理框架
陈致蓬, 何健, 沈玲, 桂卫华
, doi: 10.16383/j.aas.c250497 , cstr: 32138.14.j.aas.c250497
摘要:
在工业4.0时代, 大语言模型向工业边缘异构集群的迁移已成为一项关键技术挑战.边缘设备计算与存储资源受限、动态负载波动、异构架构复杂以及网络高延迟等特性, 使得传统推理框架难以满足工业场景对实时性、鲁棒性和隐私保护的需求.提出一种动态弹性推理框架(Dynama), 设计全域心跳被动感知器和实时弹性量化调度算法.该框架采用管道环并行结构, 实现模型层动态分配与懒加载; 通过被动监测设备延迟向量, 触发实时弹性量化调度算法在不改变层分配前提下优化量化版本, 平衡延迟最小化和精度损失. Dynama通过优化数据传输与量化策略, 显著提升高延迟网络环境下的推理效率, 适应工业边缘的动态环境变化.实验结果表明, Dynama在工业边缘异构集群中展现出优异的实时性与鲁棒性, 为工业智能的落地应用提供高效、可靠的解决方案.
视觉强化学习方法研究综述
王荣荣, 程玉虎, 王雪松
, doi: 10.16383/j.aas.c250422 , cstr: 32138.14.j.aas.c250422
摘要:
视觉作为强化学习智能体感知环境的主要途径, 能够提供丰富的细节信息, 从而支持智能体实现更复杂、精准的决策. 然而, 视觉数据的高维特性易导致信息冗余与样本效率低下, 成为强化学习应用中的关键挑战. 如何在有限交互数据中高效提取关键视觉表征, 提升智能体决策能力, 已成为当前研究热点. 为此, 系统梳理视觉强化学习方法, 依据核心思想与实现机制, 将其归纳为五类: 图像增强型、模型增强型、任务辅助型、知识迁移型以及离线视觉强化学习, 深入分析各类方法的研究进展及代表性工作的优势与局限. 同时, 综述DMControl、DMControl-GB、Distracting Control Suite 和RL-ViGen四大主流基准平台, 总结视觉强化学习在机器人控制、自动驾驶以及多模态大模型等典型场景中的应用实践. 最后, 结合当前研究瓶颈, 探讨未来发展趋势与潜在研究方向, 以期为该领域提供清晰的技术脉络与研究参考.
非线性多智能体系统的动态事件触发固定时间一致性控制
邵蝉云, 安爱民, 徐承承, 刘向航, 李二超
, doi: 10.16383/j.aas.c250304 , cstr: 32138.14.j.aas.c250304
摘要:
研究通信拓扑固定下受有界扰动影响的非线性多智能体系统固定时间一致性问题. 针对现有事件触发控制方法存在的收敛时间依赖初值、扰动下触发可靠性低, 控制参数缺乏理论设计依据等挑战, 提出一种动态事件触发固定时间一致性控制方法. 首先, 设计融合非线性增益与双曲正切扰动补偿的固定时间控制器, 在消除抖振的同时保证收敛时间上界严格独立于系统初始状态. 其次, 构造基于动态变量自适应调节的事件触发机制, 显著降低通信频率并严格证明系统不存在Zeno行为. 进一步, 通过建立新型Lyapunov稳定性分析框架, 显式给出收敛时间上界与事件触发间隔下界. 仿真结果表明, 所提方法在保证固定时间收敛性能的同时, 有效实现通信效率的优化提升.
基于PIML的微观人群移动建模仿真与干预决策框架
郭润康, 朱正秋, 艾川, 叶佩军, 秦龙, 尹全军, 王飞跃
, doi: 10.16383/j.aas.c250312 , cstr: 32138.14.j.aas.c250312
摘要:
人群移动是影响城市公共安全及应急管理的重要因素, 如何对其进行高精度的建模仿真和有效干预是亟待解决的问题. 为此, 提出一种物理信息机器学习驱动的微观人群移动建模仿真与干预决策框架. 基于平行智能思想, 该框架构建“数据感知-融合建模-动态仿真-智能干预”四层闭环结构, 形成从建模仿真到策略生成、执行及反馈修正的完整链路. 针对人群的移动仿真与引导决策问题, 分别提出基于物理信息时空图神经网络的导航势能场模型和物理信息多智能体深度确定性策略梯度算法, 有效解决传统方法中模型准确性较差、仿真与干预孤立以及决策依赖人工经验的问题. 最后, 基于真实数据集开展仿真实验验证了所提框架的有效性.
基于局部分形维数最大化的单幅图像细节增强
江鹤, 乙夫迪, 郑州, 顾豪, 寇旗旗, 程德强
, doi: 10.16383/j.aas.c250368 , cstr: 32138.14.j.aas.c250368
摘要:
随着人们对图像画质要求的不断提高, 各类图像细节增强技术不断涌现. 然而, 基于局部滤波器速度较快, 但其细节增强效果往往有限; 全局滤波器效果突出, 但计算开销较大; 深度学习方法高度依赖人工标注数据, 且其缺乏可解释性; 基于残差学习的策略则容易陷入局部最优, 难以充分挖掘潜在的全局最优特征. 针对上述挑战, 提出了一种基于局部分形维数最大化的图像细节增强算法. 研究发现, 图像的分形维数在一定程度上能够有效刻画图像纹理结构, 其空间分布呈现出一定规律: 边缘区域通常具有较高的分形维数, 纹理区域次之, 平坦区域则最低. 基于上述特性, 构建图像纹理特征与分形维数之间的映射关系, 并进一步探讨了分形维数与图像细节层之间的内在关联机制. 该方法在保持整体结构一致性的前提下, 通过提升局部分形维数, 实现了图像细节的有效增强, 进而为图像增强提供了一种具有理论依据的新思路. 大量实验结果表明, 该方法在主观视觉感受和客观评价指标上具有竞争力的表现. 如在BSDS200数据集上进行4倍增强因子的测试中, 所提方法在PSNR和SSIM指标上相较于当前流行方法QWLS分别提升了5.20 dB和0.1456, 充分展示了其在图像细节增强任务中的优势与算法良好的泛化特性.
基于运动过滤和调整的离群点移除
赖桃桃, 张一凡, 李佐勇, 肖国宝, 林维斯, 王菡子
, doi: 10.16383/j.aas.c250235 , cstr: 32138.14.j.aas.c250235
摘要:
由现有的特征提取器建立的图像特征点匹配集合通常包含大量离群点, 这严重影响了特征匹配的有效性和依赖匹配结果的下游任务的性能. 最近提出的几种离群点去除方法通过估计运动场来利用匹配对的运动一致性, 并使用卷积神经网络(Convolutional neural network, CNN)来减少离群点造成的污染, 以捕获上下文. 然而, CNN在捕捉全局上下文方面的固有缺点, 如过度平滑和感受野的有限和固定大小, 限制了这些方法的性能. 与这些使用卷积神经网络直接估计运动场的方法不同, 本文通过尝试在不使用CNN的情况下估计高质量的运动场. 因此, 提出基于运动过滤和调整的网络, 以减轻在捕捉上下文时离群点的影响. 具体而言, 首先设计一个运动过滤模块, 以迭代地去除离群点并捕获上下文. 然后, 设计一个规则化和调整模块, 该模块先估计初始运动场, 接着通过利用额外的位置信息对其进行调整, 使其更加准确. 在离群点去除和相对姿态估计任务上, 在室内和室外数据集上评估了本文所提出的方法的性能. 实验结果表明, 与现有多种方法相比, 本文所提方法展现出更优的性能.
3D空间先验驱动的相机轨迹可控视频扩散生成模型
朱泓舟, 杨雪, 赵敏, 李崇轩, 朱军
, doi: 10.16383/j.aas.c250124 , cstr: 32138.14.j.aas.c250124
摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
一种基于单比特通信压缩的大模型训练方法研究
陈楚岩, 刘烨谞, 贾维宸, 何雨桐, 袁坤, 王立威
, doi: 10.16383/j.aas.c250087 , cstr: 32138.14.j.aas.c250087
摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
面向大模型时代的持续学习方法论演变
王全子昂, 王仁振, 孟德宇, 徐宗本
, doi: 10.16383/j.aas.c240805 , cstr: 32138.14.j.aas.c240805
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
基于 PID 自整定功能的自适应双路输出的黑体温度控制
张海弟
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
仿人智能控制理论及应用研究进展
戴小文, 宋建霖, 岳丽全
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
基于生成对抗网络的对抗攻击防御模型
孔锐, 蔡佳纯, 黄钢
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.