自动化学报

姓名
邮箱
手机号码
标题
留言内容
验证码

优先发表

优先发表栏目展示本刊经同行评议确定正式录用的文章，这些文章目前处在编校过程，尚未确定卷期及页码，但可以根据DOI进行引用。

显示方式:

文利燕, 刘宇, 姜斌, 马亚杰, 崔玉康

, doi: 10.16383/j.aas.c250180 , cstr: 32138.14.j.aas.c250180

[摘要](8) [HTML全文](3)

摘要:
针对不确定扰动下具有混合相对阶的异构多智能体系统, 提出一种新的分布式自适应扰动抑制控制方法, 实现了切换拓扑下领导者-跟随者输出一致性. 首先, 通过引入局部输出一致性的概念, 将领导者-跟随者全局输出一致性问题转化为相邻智能体局部输出一致性问题; 然后, 针对系统参数和扰动已知的情况, 基于智能体系统控制-扰动相对阶匹配条件, 提出一种基于高阶微分邻居信息的布式标称扰动抑制控制器; 基于此, 针对因混合相对阶差异而导致控制器中的高阶微分邻居信号难以直接获取的问题, 提出基于高阶滑模微分器的精确估计方法, 突破了传统控制设计对系统相对阶一致性的依赖, 解决了固定/切换拓扑下局部-全局输出一致性; 进而, 针对系统参数和扰动不确定的情况, 进行分布式自适应扰动抑制控制器设计, 实现切换拓扑下的领导者-跟随者输出一致性以及期望的扰动补偿. 所设计的控制方法不仅能够在不依赖全局智能体信息及领导者信息的前提下, 确保整个智能体系统的闭环稳定性、实现跟随者对领导者的输出跟踪, 并达到期望的扰动抑制效果. 与常规的自适应一致性控制方案相比, 还具备处理具有混合相对阶特性的异构多智能体系统的能力. 最后, 仿真研究验证所设计控制方案的有效性.

面向具身操作的视觉−语言−动作模型综述

李浩然, 陈宇辉, 崔文博, 刘卫恒, 刘锴, 周明才, 张正涛, 赵冬斌

, doi: 10.16383/j.aas.c250394 , cstr: 32138.14.j.aas.c250394

[摘要](30) [HTML全文](21)

摘要:
具身智能系统通过智能体与环境不断交互, 从而提升智能体能力, 受到学术界和产业界的广泛关注. 视觉−语言−动作模型作为一种受到大模型发展启发的机器人通用控制模型, 提高了具身智能系统中智能体与环境交互的能力, 大大扩展了具身智能机器人的应用场景. 本文对具身操作中的视觉−语言−动作模型进行综述. 首先, 详细介绍视觉−语言−动作模型的发展历程. 然后, 对视觉−语言−动作模型架构、训练数据、预训练方法、后训练方法和模型评估5个方面的研究现状进行详细分析. 最后, 针对视觉−语言−动作模型发展过程和落地应用中面临的挑战和未来可能的发展方向进行总结.

云−边−端协同下考虑多车影响的混行车群集中式协同控制

黄帅, 冯雨航, 郑太雄, 李永福

, doi: 10.16383/j.aas.c240775 , cstr: 32138.14.j.aas.c250775

[摘要](10) [HTML全文](2)

摘要:
随着车联网技术的进步, 由网联人驾车与网联自动车组成的混行车群规模正逐渐增大, 导致混行车群间的协同与交互难度增加, 进而影响混行车群行驶状态的一致性. 为解决此问题, 提出一种云−边−端协同下考虑多车影响的混行车群集中式协同控制方法, 以提高混行车群协同行驶效率. 首先, 为有效处理和分析较大规模混行车群产生的海量异构信息数据, 设计混合交通场景下云−边−端协同架构. 然后, 考虑网联人驾车前方两辆车及紧邻后车状态信息的影响, 以及网联自动车前方所有车辆及紧邻后车状态信息的影响, 分别在云控平台建立基于分子动力学的网联自动车和固定权重的网联人驾车协同行驶模型. 再者, 根据混行车群间动态信息影响关系, 设计基于云−边−端协同架构的混行车群集中式协同控制方法, 并利用稳定性和串稳定性理论获得混行车群协同行驶一致性条件. 最后, 通过对比仿真实验验证了本文所提控制方法的有效性.

基于流场可视化技术的生物扑翼气动机理研究进展

刘英特, 黄海丰, 贺威

, doi: 10.16383/j.aas.c250245 , cstr: 32138.14.j.aas.c250245

[摘要](81) [HTML全文](73)

摘要:
扑翼飞行是生物高效利用流体能量的典型范式. 解析其非定常气动机理高度依赖流场可视化技术的革新. 本文系统梳理基于流场可视化技术的生物扑翼气动机理研究进展, 着重探讨实验技术创新与机理认知深化的互动关系. 通过对比多种流场可视化技术的生物实验适配性, 明确其在捕捉瞬态涡结构和量化三维流场特征方面的效能差异. 重点分析活体生物流场可视化实验的设计要素, 涵盖流场构建、示踪粒子选择及生物行为操纵策略. 此外, 重点归纳昆虫、鸟类与蝙蝠三类典型生物的已有流场可视化成果, 如前缘涡延迟脱落、尾流捕获等普适性非定常气动机理. 对比说明不同生物类群在柔性翼变形调控、涡流—运动耦合等策略上的进化差异. 最后针对性梳理当前研究存在的问题, 并展望结合先进人工智能技术的机理解析及仿生扑翼飞行器工程转化等未来发展方向.

基于部分可观蒙特卡洛树搜索算法的无人系统异步任务规划

周鑫, 陈子夷, 周天

, doi: 10.16383/j.aas.c250313 , cstr: 32138.14.j.aas.c250313

[摘要](33) [HTML全文](38)

摘要:
无人系统正深刻重塑社会生活方式与战争形态. 围绕无人系统动态规划领域, 首先将环境抽象为由节点和边组成的拓扑网络; 其次, 针对异步规划中变步长时间推进的问题, 提出一种新颖的异步规划算法, 即半马尔科夫环境下的部分可观蒙特卡洛树搜索(SPOMCP)算法, 其创新之处在于将拓扑网络转化为具有最简信息表示的子目标图, 并实现基于变步长时间推进机制的策略快速寻优. 通过理论分析, 证明了SPOMCP算法能够生成最优策略, 且计算复杂度与子目标节点数量呈指数相关. 最后仿真实验表明了SPOMCP的性能高于基准算法, 只用不到基准算法89.18 %的计算时间, 得到了高于基准算法的平均回报值.

基于改进ESO的星间激光通信精跟踪自适应自抗扰控制

李伟鹏, 刘泽书, 包泽宇, 乔建忠, 朱玉凯

, doi: 10.16383/j.aas.c250102 , cstr: 32138.14.j.aas.c250102

[摘要](84) [HTML全文](63)

摘要:
星间激光通信中的光束指向误差会显著降低链路质量. 精跟踪系统因其高带宽特性, 主要负责对高频扰动进行实时修正. 针对精跟踪环节所面临的高频扰动, 传统自抗扰控制(ADRC)在扰动估计与补偿方面仍存在性能瓶颈. 本文考虑一种特殊的干扰形式, 并基于此构造具备频率分离能力的改进扩张状态观测器(ESO), 实现对快慢变扰动的解耦. 在此基础上提出一种融合自适应滤波的自适应ADRC框架, 该方法在传统ADRC框架基础上, 引入并联自适应滤波器, 通过滤波器权重在线更新实现对光束指向误差的自适应抑制, 提升系统在高频干扰下的控制性能. 实验结果表明, 所提方法相比传统控制方法具有更强的扰动抑制能力.

基于空−海−潜跨域无人平台协同的海上目标探测追踪策略

田泽兴, 闫敬, 高麒媛, 杨睍, 关新平

, doi: 10.16383/j.aas.c250438 , cstr: 32138.14.j.aas.c250438

[摘要](36) [HTML全文](35)

摘要:
提出一种基于空−海−潜跨域无人平台协同的海上目标探测追踪策略. 首先, 构建无人机−水面艇−潜器协同的海上跨域无人系统; 进一步, 针对海上目标的高机动性以及无人平台自身约束, 采用测度理论解析无人机−水面艇−潜器最佳探测编队队形, 实现目标探测概率最大化; 当探测到目标后, 设计基于逆强化学习的无人机−水面艇−潜器编队控制器, 实现障碍物环境下水面/水下目标的可靠有效追踪. 最后, 通过仿真与实验验证了所提方法的有效性. 结果表明, 所提探测模式可以实现有限时间内移动目标探测概率最大化, 同时所提逆强化学习编队控制器可以在保持队形稳定的基础上, 结合动态避障策略, 实现复杂环境下跨域无人平台安全协同追踪.

基于部分状态反馈的燃料电池系统协同滑模控制

王凌枫, 杨宇杰, 王江鹏, 郭方洪, 吴争光, 苏宏业, 王雷

, doi: 10.16383/j.aas.c250358 , cstr: 32138.14.j.aas.c250358

[摘要](53) [HTML全文](34)

摘要:
质子交换膜燃料电池因其高效清洁的特性, 成为替代传统内燃机的理想选择. 在质子交换膜燃料电池系统中, 空气供给子系统的氧气过量比与阴极压力是影响其性能和寿命的关键变量. 然而, 这些变量在实际应用中通常难以直接测量, 且系统模型存在参数不确定性. 为应对上述挑战, 提出一种部分状态反馈预设时间协同控制策略. 该策略的核心在于, 首先创新性地设计了仅依赖于可测状态与目标设定值的“引导变量”, 并借助输入——状态稳定性理论, 将原控制问题转化为“引导变量”的镇定问题. 随后, 选取“引导变量”及其导数的线性组合来构建滑模面, 并提出一种基于障碍李雅普诺夫函数的自适应滑模控制律, 确保滑动变量在预设时间内收敛至指定小邻域内, 从而间接实现对氧气过量比和阴极压力的精确控制, 同时抑制测量噪声的干扰. 该方法规避了对关键状态的直接测量需求, 且不依赖于精确的系统模型参数. 仿真与硬件在环实验结果共同验证了所提策略具有优异的动态响应性能和对参数不确定性的鲁棒性.

基于多智能体强化学习的流程工业多操作参数协同优化

刘柢炬, 王雅琳, 刘晨亮, 罗彪, 桂卫华

, doi: 10.16383/j.aas.c250308 , cstr: 32138.14.j.aas.c250308

[摘要](83) [HTML全文](34)

摘要:
流程工业普遍存在多操作参数强耦合、工艺拓扑复杂和多工序协同难等问题, 导致传统局部优化方法难以满足全局最优运行需求. 针对上述挑战, 提出一种基于图谱理论的流程拓扑结构感知的多智能体强化学习协同优化方法, 以实现复杂拓扑流程工业的多操作参数协同优化. 首先, 构建基于拉普拉斯谱分析的拓扑结构解析框架, 刻画工业过程多操作参数耦合结构关系, 为智能体任务分配与协同决策提供支撑; 然后, 设计融合长短期记忆网络与多头注意机制的时序感知模块, 实现历史状态轨迹中关键时间依赖特征提取; 进一步, 引入多层次空间注意力机制, 面向组织层、变量层及连续控制域实现优化关注度的动态自适应调节; 在此基础上, 构建局部-全局协同的分层强化学习决策架构, 实现多智能体间的协调控制与策略优化. 在连续搅拌釜反应器系统和盐湖化工典型流程的工业数据基础上, 构建了仿真实验以验证所提方法的有效性. 实验结果表明, 所提方法相较于传统方法性能提升41.2%, 展现出更优的收敛性能和策略稳定性, 为流程工业多操作参数协同优化提供了新思路和参考技术路径.

海上跨域集群水下目标协同追踪: 关键技术与展望

李一辰, 关新平, 黄沛烁, 王布依祎, 杨紫雯, 于文彬

, doi: 10.16383/j.aas.c250309 , cstr: 32138.14.j.aas.c250309

[摘要](44) [HTML全文](68)

摘要:
随着海洋开发的不断推进, 水下目标追踪作为实现无人集群对作业目标持续接近的基础性技术, 在海上搜救、海洋监测、海底资源勘探等关键应用中发挥着重要作用. 同时, 海上跨域集群通过无人机、无人船与无人潜器等异构平台间的信息交互与自主协同, 能够在复杂海洋环境中实现对水下目标的高效探测与持续追踪, 相比单一水下域集群, 在感知与作业能力的提升等方面具有巨大的潜力. 然而, 当前水下协同追踪技术仍存在感知测量能力不足、跨域协同机制不完善和环境适应性难以兼顾等挑战. 为此, 本文首先针对水下目标追踪的发展趋势进行了分析; 同时, 面向追踪过程中定位、跟踪、传输与规划四个基础模块, 总结了研究难点和挑战, 并梳理了国内外研究进展; 最后, 针对联合设计等新颖的研究理念和前沿需求进行了探讨, 以期为海上跨域集群水下目标追踪技术的发展提供参考.

知识−数据−模型驱动的低空动目标轨迹融合预测方法

周同乐, 刘子仪, 陈谋

, doi: 10.16383/j.aas.c250429 , cstr: 32138.14.j.aas.c250429

[摘要](72) [HTML全文](87)

摘要:
针对低空环境下动目标轨迹预测问题, 提出一种知识—数据—模型驱动的动目标轨迹融合预测框架. 基于低空飞行器运动特征构建飞行知识混合专家模型, 通过将多源传感器数据输入至各飞行知识专家模块, 实现目标机动模态的精细化识别, 并使用Mamba模型提取时空关联特征; 设计权值自适应调节机制, 利用注意力机制动态融合多源感知数据, 解决传感器时空异步问题; 采用门控循环单元建模长期时序依赖关系, 根据目标历史飞行数据生成初步预测轨迹; 基于低空目标运动学方程构建物理信息神经网络, 通过动态权衡数据驱动损失与物理约束损失, 矫正数据驱动偏差, 确保预测轨迹满足运动学约束并有效抑制多步预测误差累积. 数值仿真及实验验证结果表明, 所提出的知识—数据—模型驱动的动目标轨迹融合预测方法, 能够有效预测低空目标飞行轨迹.

通信受限的双网络零和博弈分布式在线优化

廖岚, 于湛, 袁德明, 张保勇, 徐胜元

, doi: 10.16383/j.aas.c250295 , cstr: 32138.14.j.aas.c250295

[摘要](48) [HTML全文](76)

摘要:
研究双网络零和博弈中的分布式优化问题, 两个网络代表两个对立的玩家. 每个网络由一组具有时变损失函数的智能体组成, 智能体通过通信和协作来优化己方网络在博弈中的收益. 考虑到现实优化场景中通信资源受限和信息反馈受限两种通信受限情形, 设计了基于事件触发通信和两点Bandit反馈的分布式在线优化算法, 并采用动态纳什均衡遗憾评估算法的性能. 在某些假设条件下, 建立相对于总博弈次数为次线性的动态纳什均衡遗憾界, 从而验证了算法的有效性. 此外, 将设计的算法拓展为多周期版本并建立次线性的动态纳什均衡遗憾界. 最后, 通过双线性矩阵博弈的仿真算例进一步验证了所设计的两个算法的性能.

城市空中交通系统最优规模评估与调度

郭戈, 郑智远, 张忍永康

, doi: 10.16383/j.aas.c250396 , cstr: 32138.14.j.aas.c250396

[摘要](77) [HTML全文](80)

摘要:
针对城市空中交通系统,提出一种优化方法以同时确定满足乘客需求的最小系统规模和最佳系统再平衡策略.研究构建了流体模型与多服务器M/M/s排队模型的联合框架,描述乘客、飞行器与电池在站点间迁移、换电及充电过程.在该模型框架下对飞行器和电池数量的适定性进行了证明,并给出了系统供需均衡时的必要条件.在此基础上,通过线性规划求解系统供需均衡下的再平衡分配率与最小机队规模,并计算最优充电站位置、电池数量及电池运输车数量.数值仿真分析了影响系统规模的因素,实例验证证明了所提再平衡方法的有效性.

基于大模型量化突发事件影响的工业能源价格预测研究

罗江, 王雅琳, 刘晨亮, 袁小锋

, doi: 10.16383/j.aas.c250395 , cstr: 32138.14.j.aas.c250395

[摘要](172) [HTML全文](155)

摘要:
能源是现代工业运行的核心要素, 其价格波动对工业企业的成本结构和竞争力具有显著影响. 然而, 受政策变化和地缘冲突等突发事件影响, 工业能源价格呈现高频波动特征, 难以实现精准预测. 此外, 现有深度学习方法在事件量化、动态响应及可解释性方面存在不足, 导致预测结果的不确定性显著增加. 为此, 提出一种基于大模型量化突发事件影响的工业能源价格预测方法. 首先, 为实现突发事件的量化表征与显式推理路径提取, 构建领域知识微调与结构化数据微调的两阶段协同机制, 设计事件冲击函数驱动的多尺度事件解析器, 并结合注意力机制自适应调整衰减速率, 将事件影响分解为短期冲击、中期传导与长期趋势. 其次, 为统一事件量化与价格预测过程, 将量化结果作为外部输入增强模型响应能力, 并输入门控循环神经网络实现价格预测. 最后, 在秦皇岛港煤炭月度价格和布伦特原油月度价格两个真实工业数据集上开展系统实验, 验证了所提方法的有效性, 并进一步分析大模型推理文本对预测性能的贡献机制.

智能机器人类脑情景认知方法研究现状与展望

于乃功, 闫金涵, 王宗侠, 张志雯, 刘建军

, doi: 10.16383/j.aas.c240716 , cstr: 32138.14.j.aas.c240716

[摘要](132) [HTML全文](133)

摘要:
机器人的最高境界是拥有类脑智能并像人和动物一样具有智能行为. 随着对机器人感知、认知能力要求的不断提高, 传统人工智能方法逐渐陷入瓶颈. 自然界中的哺乳动物拥有卓越的情景认知能力, 借鉴其大脑的神经信息传递和处理机制, 研究机器人类脑情景认知方法已成为研究热点. 首先介绍大鼠、猕猴等哺乳动物的情景认知神经机理, 进而探讨受其启发的情景认知计算模型, 随后概述机器人类脑情景认知方法研究情况, 最后总结当前研究面临的挑战并展望未来发展方向.

城市污水处理进水过程自适应恒压控制

韩红桂, 季维宇, 刘峥, 孙浩源, 伍小龙

, doi: 10.16383/j.aas.c250359 , cstr: 32138.14.j.aas.c250359

[摘要](85) [HTML全文](62)

摘要:
针对城市污水处理进水过程总管压力难以稳定控制, 导致污水处理过程运行不稳定的问题, 提出一种自适应恒压控制(Adaptive constant pressure control, ACPC)方法. 首先, 建立基于时滞特性的城市污水处理进水过程控制模型, 设计基于帕德逼近的等效变换模型, 动态补偿运行过程滞后的影响. 其次, 提出基于障碍李雅普诺夫函数的ACPC方法, 设计转移策略放宽初始总管压力对控制器约束, 保障进水过程在规定压力范围内运行. 然后, 提出神经网络自适应动态调整算法, 根据进水过程运行状态实时调整控制参数, 降低膜组器清洗操作导致的总管压力波动, 提升进水过程的稳定性. 最后, 给出控制器稳定性分析, 证明进水过程中所有变量是半全局最终有界的, 实现总管压力的稳定控制. 实验结果表明, 该方法能够保证城市污水处理进水过程稳定运行.

无线控制系统中的联合鲁棒波束成形与设备调度算法

马彪, 姜正莽, 欧阳慧珉, 王子宁, 林敏

, doi: 10.16383/j.aas.c250120 , cstr: 32138.14.j.aas.c250120

[摘要](70) [HTML全文](49)

摘要:
在无线资源受限的情况下, 采用多波束技术来实现多个环路的同时控制是无线控制系统领域的技术难题. 在仅已知非完美信道状态信息的条件下, 提出一种联合鲁棒波束成形与设备调度算法, 保证控制稳定性的同时降低系统总成本. 首先, 以系统控制成本和通信成本的加权和最小化为目标函数, 以满足控制稳定性和发射功率限制为约束条件, 建立一个多个环路同时控制场景下的优化问题. 其次, 通过二次李雅普诺夫函数将稳定性约束转换为传输成功概率约束. 由于该非凸问题难以求解, 进一步提出控制成本与通信成本联合优化的双目标方案, 并基于怀特指数方法提出控制成本最小化的设备调度算法, 同时采用伯恩斯坦不等式和半正定规划等数学工具, 设计满足控制稳定性的通信成本最小化鲁棒波束成形算法. 最后, 计算机仿真表明, 所提方案相比于典型传输方案能够降低10% 至 41%的总成本, 实现通信与控制成本之间的良好折中.

混合动力电推进系统能量管理与分层优化控制策略研究

李建奇, 孙健, 杨涛, 曹斌芳, 唐一文, 鲁建权

, doi: 10.16383/j.aas.c250174 , cstr: 32138.14.j.aas.c250174

[摘要](133) [HTML全文](102)

摘要:
为了提高混合动力飞行器经济性并改善动力系统的动态性能, 提出一种混合动力分层控制的能量管理策略. 首先, 在顶层提出基于改进等效燃油消耗最小化的能量管理策略, 根据发电机组的燃油消耗特性、储能电池组的荷电状态以及等效惩罚因子动态调整发电机组的最优工作曲线, 从而获得最佳的燃油经济性. 在底层提出一种基于电流反馈的改进下垂控制策略, 负责管理电池组的充放电状态和维持直流母线电压的动态平衡, 同时实现飞行器的经济性与动态响应的协同控制, 达到对混合电推进飞行器能量的动态优化管理的目的. 最后, 通过基于RT-LAB的混合动力系统硬件在环实验平台验证该能量管理策略的有效性.

“结构−内容”框架下融合时空特征的技术预测模型

袭希, 许伟, 刘传斌, 刘玮倩, 苏忻洁

, doi: 10.16383/j.aas.c250094 , cstr: 32138.14.j.aas.c250094

[摘要](132) [HTML全文](120)

摘要:
科学技术发展是一种动态非线性的复杂演进过程.为了提升技术发展的精准预测, 本文基于大语言模型(Large Language Model, LLM)、图卷积神经网络(Graph Convolutional Networks, GCN)、双向长短期记忆神经网络(Bi-directional Long Short-Term Memory, BiLSTM)以及鲁棒随机配置网络(Robust Stochastic Configuration Networks, RSCN), 提出了一种全新的"结构−内容"时空技术预测模型(Spatiotemporal Technological Forecasting Model with LLM as Representation, STTeFL 模型).首先, 通过结合图卷积神经网络和双向长短期记忆神经网络, 分别捕捉技术网络中的空间依赖关系和时间演化规律, 从而突破了传统预测模型在动态性和结构表征上的局限性, 克服了传统技术预测模型的“伪动态”和“静态”限制; 其次, 引入大语言模型对技术网络中的节点特征和边特征进行双重语义表征, 将预测框架从单一的结构维度扩展至“结构−内容”双维度分析, 显著增强了模型对技术发展信息的理解能力和表征深度. 最后, 通过集成RSCN, 模型能够有效应对极端不均衡数据分布的挑战, 进一步提升了预测的鲁棒性和准确性.本文提出的预测框架在多个指标上均优于当前多种技术预测方法, 为推动技术预测建模和评估未来技术发展轨迹提供了有力的支持.

3D空间先验驱动的相机轨迹可控视频扩散生成模型

朱泓舟, 杨雪, 赵敏, 李崇轩, 朱军

, doi: 10.16383/j.aas.c250124 , cstr: 32138.14.j.aas.c250124

[摘要](182) [HTML全文](170)

摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.

基于语义概念关联的参考多目标跟踪方法

林家丞, 陈嘉俊, 李智勇, 王耀南

, doi: 10.16383/j.aas.c250118 , cstr: 32138.14.j.aas.c250118

[摘要](178) [HTML全文](220)

摘要:
参考目标跟踪(Referring multi-object tracking, RMOT)是一项利用语言与视觉模态数据进行目标定位与跟踪的任务, 旨在根据语言提示在视频帧中精准识别并持续跟踪指定目标. 尽管现有RMOT方法在该领域取得了一定进展, 但针对语言表述概念粒度的建模仍较为有限, 导致模型在处理复杂语言描述时存在语义解析不足的问题. 为此, 提出基于语义概念关联的参考多目标跟踪方法SCATrack), 通过引入共享语义概念(Sharing semantic concept, SSC)和语义概念辅助生成(Semantic concept generation, SCG)模块, 以提升模型对语言表述的深层理解能力, 从而增强跟踪任务的持续性与鲁棒性. 具体而言, SSC模块对语言表述进行语义概念划分, 使模型能够有效区分相同语义的不同表达方式, 以及不同语义间的相似表达方式, 从而提升多粒度输入条件下的目标辨别能力. SCG模块则采用特征遮蔽与生成机制, 引导模型学习多粒度语言概念的表征信息, 增强其对复杂语言描述的鲁棒性和辨别能力. 在两个广泛使用的基准数据集上的实验结果表明, 所提出的SCATrack显著提升RMOT任务的跟踪性能, 验证了方法的有效性与优越性.

一种基于单比特通信压缩的大模型训练方法研究

陈楚岩, 刘烨谞, 贾维宸, 何雨桐, 袁坤, 王立威

, doi: 10.16383/j.aas.c250087 , cstr: 32138.14.j.aas.c250087

[摘要](602) [HTML全文](312)

摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.

面向大模型时代的持续学习方法论演变

王全子昂, 王仁振, 孟德宇, 徐宗本

, doi: 10.16383/j.aas.c240805 , cstr: 32138.14.j.aas.c240805

[摘要](1697) [HTML全文](796) [PDF 2727KB](293)

摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.

基于 PID 自整定功能的自适应双路输出的黑体温度控制

张海弟

, doi: 10.16383/j.aas.c190277

[摘要](1150) [HTML全文](669)

摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.

仿人智能控制理论及应用研究进展

戴小文, 宋建霖, 岳丽全

, doi: 10.16383/j.aas.c200007

[摘要](2469) [HTML全文](1093)

摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.

基于生成对抗网络的对抗攻击防御模型

孔锐, 蔡佳纯, 黄钢

, doi: 10.16383/j.aas.2020.c200033

[摘要](3241) [HTML全文](2152)

摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.