自动化学报

姓名
邮箱
手机号码
标题
留言内容
验证码

韩京良, 于海, 张兆鹏, 何慰, 梁潇, 方勇纯

当前状态: doi: 10.16383/j.aas.c250434 cstr: 32138.14.j.aas.c250434

[摘要](0) [HTML全文](0)

摘要:
传统多旋翼无人机广泛应用于工业检测、物资运输和灾后搜救等任务. 然而在狭窄空间内, 其飞行往往受到机体尺寸和姿态调节能力的限制, 影响通行效率与飞行安全性. 为此, 面向串联倾转双旋翼无人机平台, 提出一种针对受限环境下考虑方向约束并基于平面速度分量计算偏航角的轨迹生成策略. 该方法改进了最小二阶加速度(SNAP)轨迹生成方法, 实现对位置与偏航轨迹的协调优化, 并设计最短偏航路径算法和航点附近插值平滑算法来提升飞行过程的平滑性与安全性. 将所提方法与不考虑偏航方向约束的最小SNAP方法进行对比, 结果表明改进后的最小SNAP方法更加适用于双旋翼无人机平台. 进一步通过丰富的实验验证了所提方法的有效性与适用性.

低空立体交通跨模式协同与智能调度研究综述

段海滨, 梅宇, 范彦铭

当前状态: doi: 10.16383/j.aas.c250369 cstr: 32138.14.j.aas.c250369

[摘要](16) [HTML全文](10)

摘要:
随着低空立体交通系统进程的加速推进, 空中、地面与水面三维异构交通平台的协同愈加关键. 智能调度与资源优化的深度融合, 正逐步成为智慧城市建设与应急响应体系中不可或缺的核心支撑力量. 围绕多模式协同调度的研究热点展开综述. 首先, 综合回顾了无人机、无人车与无人艇在多源信息融合、环境感知与自适应决策方面的协同机制. 其次, 从任务分解、路径规划、协同控制与系统调度四个层面, 总结了强化学习、图优化、进化算法等在复杂动态环境下的典型调度方法. 进一步地, 梳理了集中式、分布式与混合式控制架构下的任务分配与通信策略, 并分析了传感器数据、仿真数据与运行大数据在调度优化中的作用. 最后, 探讨了当前低空立体交通系统在资源分配、安全保障与跨域协同中的关键挑战, 并展望了基于大数据驱动与智能增强的低空立体交通系统未来发展路径.

多障碍场景下基于多策略进化机制的无人机三维路径规划

朱润泽, 赵静, 陆宁云, 马亚杰, 宋来收

当前状态: doi: 10.16383/j.aas.c250319 cstr: 32138.14.j.aas.c250319

[摘要](12) [HTML全文](12)

摘要:
针对无人机(UAV)在三维多障碍物场景下路径规划存在的收敛精度低、稳定性不足等问题, 提出一种多策略进化粒子群算法(MSEPSO). 在初始化阶段, 针对粒子群算法(PSO)对粒子初始位置敏感的问题, 采用拉丁超立方采样(LHS)优化粒子初始分布, 提高种群多样性; 在进化阶段, 设计“平衡−记忆−增强”进化框架, 即利用非线性迭代策略来平衡全局开发和局部搜索, 采用个体历史记忆启发机制(PHMM)增强算法的全局开发能力, 并引入进化粒子, 增强种群对于群体极值附近空间的探索能力, 降低算法陷入局部最优的概率. 在CEC2020测试函数集上与山地/城市场景下的对比实验结果表明, MSEPSO展现出了稳定的寻优性能, 可以规划长度更短、平滑度更高的安全路径.

智能网联无人系统云控制平台的关键理论与技术

夏元清, 刘丹阳, 杨洪玖, 于东东, 高润泽

当前状态: doi: 10.16383/j.aas.c250423 cstr: 32138.14.j.aas.c250423

[摘要](52) [HTML全文](33)

摘要:
针对智慧城市中无人系统因通信架构不统一、任务调度效率低下及数字孪生技术难以支撑实时全局决策所导致的跨域协同难题, 融合云控制系统理论与数字孪生技术, 基于云网边端协同云控制架构, 构建智能网联无人系统云控制平台及关键理论与技术体系. 该体系涵盖云控制系统综合建模、模型-数据联合驱动控制、多运动体跨域协同云控制等关键理论, 研究数字孪生系统、容器化云工作流调度系统、动态云控制系统、远程驾驶系统等关键技术. 在校园场景下部署无人机、无人车、无人船、机器人等异构无人系统, 形成空基、地基、海(水)基动态云并实现跨域协同, 验证了所提理论体系的可行性与有效性, 为未来智慧城市发展与跨域无人系统协同应用提供理论支撑与技术路径.

基于分层策略强化学习的多类型流量差异化路由优化

赵之栩, 刘坤, 王璐瑶, 夏元清

当前状态: doi: 10.16383/j.aas.c250413 cstr: 32138.14.j.aas.c250413

[摘要](53) [HTML全文](44)

摘要:
路由是优化网络资源分配的重要方法. 然而, 传统路由算法依赖静态策略优化单一服务质量指标, 难以应对多类型流量爆发性增长下的差异化需求. 尽管深度强化学习为动态网络环境下的路由优化提供了新思路, 现有方法仍缺乏对流量类型的精细化感知能力, 无法灵活调整路由策略. 为此, 本文针对不同类型流量的差异化路由需求, 设计一种基于分层策略强化学习的流量感知路由算法. 首先, 引入流量分类模块, 实现对不同流量差异化业务需求的精细感知. 其次, 利用图卷积网络对网络拓扑进行高效建模, 并在此基础上设计分层决策网络以及差异化奖励函数, 引导智能体生成自适应路由决策, 实现对各流量类别路由策略的动态调整. 同时, 在演员-评论家框架中引入全局注意力机制, 增强智能体对网络状态时空依赖关系的建模能力, 并通过广义优势估计和近端策略优化算法提升训练的效率与稳定性. 最后, 在多种拓扑网络上验证了所提算法的有效性.

螺旋桨转速受限多四旋翼无人机的编队运输分层控制方案

武权伟, 王翔宇, 刘金浩

当前状态: doi: 10.16383/j.aas.c250439 cstr: 32138.14.j.aas.c250439

[摘要](40) [HTML全文](43)

摘要:
多四旋翼无人机协同编队运输技术因其高容错性和强灵活性等特点, 近年来受到广泛关注. 针对受到螺旋桨转速约束和外界环境干扰影响的多四旋翼无人机系统, 提出一种分层控制方案以实现多无人机协同编队运输. 该方案设计主要包含分布式协调器设计和跟踪控制器设计. 在分布式协调器中, 位置协调器基于虚拟领导者的位置、速度等信息生成各带载无人机的期望位置, 然后微分平坦器输出无人机的期望无偏轨迹; 跟踪控制器采用非线性模型预测控制、角速度控制以及螺旋桨转速分配算法相结合的策略, 为各带载无人机生成合理的螺旋桨转速指令, 确保无人机精确跟踪其期望轨迹. 在所提方案作用下, 多带载无人机能维持期望编队队形并跟踪虚拟领导者, 从而实现多无人机协同编队运输. 特别地, 当省略位置协调器时, 该方案可简化为单无人机轨迹跟踪控制器. 数值仿真包括单机轨迹跟踪和多机协同运输两个场景, 结果表明: 在单机跟踪任务中, 所提方案展现出良好的跟踪精度; 在多机运输场景下, 多无人机能够有效实现协同编队运输.

基于“形态−感知−动作”仿生机理的机器人自适应力控抓取方法

赵洲, 耿明强, 何秋实, 何赟鑫, 蔡明达, 周翔宇, 罗晶

当前状态: doi: 10.16383/j.aas.c250453 cstr: 32138.14.j.aas.c

[摘要](109) [HTML全文](85)

摘要:
随着机器人技术快速发展, 其对精细感知能力需求日益增长. 然而, 现有机器人仍难以具备如人类般灵活的操作能力. 在精细抓取任务中, 机器人恒力抓取策略存在局限性: 抓取力过大易损伤物体, 抓取力过小则导致抓取不稳. 为应对上述问题, 提出一种基于视觉与触觉融合的机器人自适应力控抓取方法. 该方法由视觉模块、触觉模块和抓取策略组成: 视觉模块用于预测目标抓取位置; 在接触阶段, 触觉模块借助视触觉传感器恢复触觉深度并估算接触面积与法向力; 随后, 通过最大深度变化率和帧间均方差进行形变判定, 并触发抓取力调整策略, 从而实现“渐进增力–形变检测–力回退”的仿生反馈抓取机制. 实验结果表明, 该方法将多种日常物体的整体抓取成功率由87.50% 提升至98.75%, 在易碎物体抓取中实现零损坏.

基于社会化协同的无人机集群目标合围控制

彭雅兰, 段海滨, 范彦铭, 李明

当前状态: doi: 10.16383/j.aas.c250415 cstr: 32138.14.j.aas.c

[摘要](66) [HTML全文](78)

摘要:
面向感知、通信受限且存在环境障碍的移动目标合围控制, 提出一种基于社会化协同的控制策略. 首先, 借鉴生物集群社会化行为, 构建协同响应模型与层级交互机制; 在拓扑切换与丢包条件下, 显式建模受限信息流, 以驱动集群实现目标合围. 其次, 提出强引导式任务-避碰并行协同控制, 在优先保障飞行安全的前提下实现鲁棒合围控制. 再次, 设计一致性目标状态观测器, 对目标位置与速度进行稳健估计. 最后, 仿真结果表明, 所提方法在障碍环境以及感知、通信受限条件下能够实现稳定合围, 并表现出较好的鲁棒性.

基于观测器的混杂切换多智能体系统有界群一致性追踪

裴惠琴, 谭鉴恒, 肖红利, 梁炜森

当前状态: doi: 10.16383/j.aas.c250303 cstr: 32138.14.j.aas.c

[摘要](63) [HTML全文](49)

摘要:
考虑脉冲作用下基于观测器二阶混杂切换多智能体系统的有界群一致性追踪问题, 建立一种在脉冲作用下的混杂切换多智能体系统动力学模型, 每个跟踪智能体只能够获取邻居智能体或者目标的位置信息. 然而, 每个跟踪智能体并不能获得邻居和目标的速度信息. 针对跟踪智能体在获取邻居和目标速度信息方面存在的限制, 设计一种基于目标加速度和智能体位置的状态观测器, 为跟踪智能体提供其子群目标的速度估计. 在此基础上, 提出一种在脉冲作用下基于目标速度观测器的有界群一致性追踪控制策略, 通过矩阵理论和Hurwitz稳定性判据, 证明了在该策略下系统可实现有界群一致性追踪. 仿真实例验证了所提出方法的有效性.

视觉SLAM运动分割技术综述

冯嘉琪, 杨恺伦, 林家丞, 杨观赐

当前状态: doi: 10.16383/j.aas.c250365 cstr: 32138.14.j.aas.c250365

[摘要](189) [HTML全文](188)

摘要:
作为移动机器人与自动驾驶领域的关键基础技术, 视觉同时定位与地图构建(V-SLAM)在动态环境中面临严峻挑战. 由动态物体引起的特征匹配错误常常导致定位偏差、地图失真以及系统鲁棒性受损. 运动分割技术是提高V-SLAM性能的重要手段, 但在复杂动态场景中准确区分静态和动态元素仍极具挑战性. 本文系统梳理V-SLAM运动分割研究进展, 根据对环境的潜在假设, 将现有方法分为三个主要研究范式, 并给出各范式的技术原理, 代表性策略的核心优势、本质局限及适用边界. 最后展望未来的研究方向.

工业边缘异构集群的大模型分布式弹性推理框架

陈致蓬, 何健, 沈玲, 桂卫华

当前状态: doi: 10.16383/j.aas.c250497 cstr: 32138.14.j.aas.c250497

[摘要](163) [HTML全文](180)

摘要:
在工业4.0时代, 大语言模型向工业边缘异构集群的迁移已成为一项关键技术挑战.边缘设备计算与存储资源受限、动态负载波动、异构架构复杂以及网络高延迟等特性, 使得传统推理框架难以满足工业场景对实时性、鲁棒性和隐私保护的需求.提出一种动态弹性推理框架(Dynama), 设计全域心跳被动感知器和实时弹性量化调度算法.该框架采用管道环并行结构, 实现模型层动态分配与懒加载; 通过被动监测设备延迟向量, 触发实时弹性量化调度算法在不改变层分配前提下优化量化版本, 平衡延迟最小化和精度损失. Dynama通过优化数据传输与量化策略, 显著提升高延迟网络环境下的推理效率, 适应工业边缘的动态环境变化.实验结果表明, Dynama在工业边缘异构集群中展现出优异的实时性与鲁棒性, 为工业智能的落地应用提供高效、可靠的解决方案.

面向低空交通运输的无人机−无人车协同感知技术综述

李永福, 黄鑫, 郭常员, 王怡然, 吴三妹, 简金埠

当前状态: doi: 10.16383/j.aas.c250386 cstr: 32138.14.j.aas.c

[摘要](233) [HTML全文](253)

摘要:
随着低空经济的兴起与智能交通的发展, 低空交通运输作为空地一体化的新兴交通系统, 对环境感知、通信与计算能力提出更高要求. 本文旨在全面阐述面向低空交通运输的无人机−无人车协同感知关键技术及发展趋势. 系统梳理协同感知的三类基础支撑技术, 包括基于LiDAR、视觉与多传感器融合的感知方法, C-V2X、5G、Wi-Fi等通信技术, 以及端−边−云协作的边缘计算架构. 在此基础上, 进一步总结协同感知信息融合、感知信息压缩与传输、协同组网、通信安全及资源分配等关键技术研究进展. 最后, 分析当前无人机−无人车协同感知系统在感知模型优化、未来应用场景等方面的挑战, 并对该领域的未来发展趋势进行探讨与展望, 以期为低空交通运输中多智能体协同感知系统的研究与落地应用提供参考.

视觉强化学习方法研究综述

王荣荣, 程玉虎, 王雪松

当前状态: doi: 10.16383/j.aas.c250422 cstr: 32138.14.j.aas.c250422

[摘要](243) [HTML全文](178)

摘要:
视觉作为强化学习智能体感知环境的主要途径, 能够提供丰富的细节信息, 从而支持智能体实现更复杂、精准的决策. 然而, 视觉数据的高维特性易导致信息冗余与样本效率低下, 成为强化学习应用中的关键挑战. 如何在有限交互数据中高效提取关键视觉表征, 提升智能体决策能力, 已成为当前研究热点. 为此, 系统梳理视觉强化学习方法, 依据核心思想与实现机制, 将其归纳为五类: 图像增强型、模型增强型、任务辅助型、知识迁移型以及离线视觉强化学习, 深入分析各类方法的研究进展及代表性工作的优势与局限. 同时, 综述DMControl、DMControl-GB、Distracting Control Suite 和RL-ViGen四大主流基准平台, 总结视觉强化学习在机器人控制、自动驾驶以及多模态大模型等典型场景中的应用实践. 最后, 结合当前研究瓶颈, 探讨未来发展趋势与潜在研究方向, 以期为该领域提供清晰的技术脉络与研究参考.

露天矿机器人化采运理论技术框架

葛世荣, 杨健健, 黄乾坤, 宋瑞琦, 陈龙, 陈鹏, 杨胜利, 何适, 丁震, 王飞跃

当前状态: doi: 10.16383/j.aas.c250097 cstr: 32138.14.j.aas.c250097

[摘要](177) [HTML全文](199)

摘要:
露天矿机器人化采运系统面临复杂特定场景数据不足、极端工况测试困难、现场试验与调试安全风险高、高动态变化环境的感知与建模复杂和全场景物理实验周期长等挑战, 亟需突破提效开采演化机理、高精度全域融合感知、高效率稳定协同控制、高可靠安全群体管控4大科学问题. 通过研究极端环境全域多模感知与变载稳健自适应控制、动态装卸区多机装载协同与多车高效卸载规划、采运系统自主学习建模与虚实融合平行仿真、高适用性工程应用方案, 提出露天矿立足机器人化采运“端边感知、平行控制”的智慧生产模式, 从感控、协同、调度、应用等多层次提出机器人化采运关键理论与技术. 通过技术创新和迭代优化, 实现我国露天矿机器人化采运系统技术自主创新和关键技术自主可控, 确保露天煤矿机器人化运输车的大批量安全高效作业运行, 形成我国露天煤矿迈向高水平智能化的“双十 (10项创新技术、10项机器人化采运标准)、双百 (100台车应用示范, 较有人系统的110%的综合运输运行效率)、双千 (1000台车容量的监控平台, 1000小时平均无故障运行时间)”的中国方案, 有力支撑我国矿山智能化绿色开采发展战略.

连续时间系统混合迭代鲁棒自适应评判控制

王鼎, 刘奥, 乔俊飞

当前状态: doi: 10.16383/j.aas.c250327 cstr: 32138.14.j.aas.c250327

[摘要](158) [HTML全文](110)

摘要:
针对存在扰动的连续时间非线性系统, 设计一种结合混合迭代机制和自适应评判框架的鲁棒控制方法. 通过优化传统值迭代算法, 实现加速学习并放宽预设条件的目标. 引入可调参数确保控制策略在迭代过程中的可容许性, 从而放松加速因子的设置条件. 结合广义策略迭代的思想, 构建新型混合迭代机制, 从而获得更优的收敛特性. 最后, 利用两个仿真实例验证算法性能. 针对线性系统的仿真结果表明, 算法具有较高的收敛精度. 在导弹自动驾驶仪系统仿真中, 相对于值迭代方法, 本文算法不依赖初始可容许控制策略, 同时能使收敛速度提高约49%.

融合进化算法和深度强化学习的飞行器制导控制一体化

陈建国, 姚蔚然, 孙光辉, 吴立刚

当前状态: doi: 10.16383/j.aas.c250278 cstr: 32138.14.j.aas.c250278

[摘要](238) [HTML全文](209)

摘要:
针对高超声速飞行器在外界干扰与模型不确定性影响下的制导控制难题, 提出一种融合双延迟深度确定性策略梯度与交叉熵方法 (cross-entropy method, CEM) 的进化强化学习框架. 首先, 构建高超声速飞行器的运动模型与制导控制一体化模型; 其次, 将复杂干扰环境下的多约束控制问题转化为强化学习决策优化过程, 依托深度强化学习的无模型数据驱动特性, 建立从状态观测到舵偏角指令的端到端映射机制. 同时, 引入基于CEM的动作空间采样机制, 通过Q值最大化准则筛选精英候选动作集, 利用价值函数引导进化搜索方向, 有效克服传统强化学习探索低效、盲目性强的缺陷, 提升样本利用效率. 最后, 仿真结果表明所提算法能够适应初始高度偏差±300 m、速度偏差±200 m/s及气动参数±40%不确定性等变任务飞行条件, 且在终端控制精度与鲁棒性等核心指标上显著优于传统控制方法.

面向分段计划负荷的耦合配烧优化模型与硫分约束界调整

黄晓迪, 王广博, 姜彦辰, 李前胜, 王永富, 柴天佑

当前状态: doi: 10.16383/j.aas.c250277 cstr: 32138.14.j.aas.c250277

[摘要](125) [HTML全文](173)

摘要:
针对目前我国火电企业的配煤掺烧方案制定普遍采用人工经验模式, 导致方案制定效率低、配烧成本非最优的问题, 本文首次系统性开展了面向分段计划负荷的耦合配烧优化模型与硫分约束界调整研究. 首先, 为保证更快速与更精准地制定配烧方案, 通过磨煤机组的切换磨向量建立分段计划负荷与配烧优化模型之间的耦合关系, 实现了以计算机优化模型为主的数字化配烧. 然后, 针对耦合配烧优化模型中的关键环保指标硫分约束, 综合考虑了机组燃煤硫转化效率、脱硫效率与锅炉燃烧等不确定性的影响, 在反演计算硫分约束界的基础上, 基于改进随机配置网络建立了硫分约束界前馈补偿模型. 接下来, 为保证前馈补偿模型的历史训练样本案例数据库的最优性, 通过监测机组的实时生产数据全周期迭代动态更新案例数据库, 进而提升前馈补偿模型的全周期预测精准性. 最后, 基于该模型开发的计算机软件系统运行后, 配烧方案制定时间由原40分钟/次缩减到5分钟/次之内, 显著提升了运行人员的配烧效率; 另外, 在满足带负荷最佳匹配的前提下, 通过优化技术, 掺烧低热值经济煤种的比例明显增加, 相比人工经验制定的配烧方案成本平均下降21元/吨, 取得了良好经济效益.

非线性多智能体系统的动态事件触发固定时间一致性控制

邵蝉云, 安爱民, 徐承承, 刘向航, 李二超

当前状态: doi: 10.16383/j.aas.c250304 cstr: 32138.14.j.aas.c250304

[摘要](201) [HTML全文](186)

摘要:
研究通信拓扑固定下受有界扰动影响的非线性多智能体系统固定时间一致性问题. 针对现有事件触发控制方法存在的收敛时间依赖初值、扰动下触发可靠性低, 控制参数缺乏理论设计依据等挑战, 提出一种动态事件触发固定时间一致性控制方法. 首先, 设计融合非线性增益与双曲正切扰动补偿的固定时间控制器, 在消除抖振的同时保证收敛时间上界严格独立于系统初始状态. 其次, 构造基于动态变量自适应调节的事件触发机制, 显著降低通信频率并严格证明系统不存在Zeno行为. 进一步, 通过建立新型Lyapunov稳定性分析框架, 显式给出收敛时间上界与事件触发间隔下界. 仿真结果表明, 所提方法在保证固定时间收敛性能的同时, 有效实现通信效率的优化提升.

基于PIML的微观人群移动建模仿真与干预决策框架

郭润康, 朱正秋, 艾川, 叶佩军, 秦龙, 尹全军, 王飞跃

当前状态: doi: 10.16383/j.aas.c250312 cstr: 32138.14.j.aas.c250312

[摘要](121) [HTML全文](183)

摘要:
人群移动是影响城市公共安全及应急管理的重要因素, 如何对其进行高精度的建模仿真和有效干预是亟待解决的问题. 为此, 提出一种物理信息机器学习驱动的微观人群移动建模仿真与干预决策框架. 基于平行智能思想, 该框架构建“数据感知-融合建模-动态仿真-智能干预”四层闭环结构, 形成从建模仿真到策略生成、执行及反馈修正的完整链路. 针对人群的移动仿真与引导决策问题, 分别提出基于物理信息时空图神经网络的导航势能场模型和物理信息多智能体深度确定性策略梯度算法, 有效解决传统方法中模型准确性较差、仿真与干预孤立以及决策依赖人工经验的问题. 最后, 基于真实数据集开展仿真实验验证了所提框架的有效性.

基于局部分形维数最大化的单幅图像细节增强

江鹤, 乙夫迪, 郑州, 顾豪, 寇旗旗, 程德强

当前状态: doi: 10.16383/j.aas.c250368 cstr: 32138.14.j.aas.c250368

[摘要](169) [HTML全文](142)

摘要:
随着人们对图像画质要求的不断提高, 各类图像细节增强技术不断涌现. 然而, 基于局部滤波器速度较快, 但其细节增强效果往往有限; 全局滤波器效果突出, 但计算开销较大; 深度学习方法高度依赖人工标注数据, 且其缺乏可解释性; 基于残差学习的策略则容易陷入局部最优, 难以充分挖掘潜在的全局最优特征. 针对上述挑战, 提出了一种基于局部分形维数最大化的图像细节增强算法. 研究发现, 图像的分形维数在一定程度上能够有效刻画图像纹理结构, 其空间分布呈现出一定规律: 边缘区域通常具有较高的分形维数, 纹理区域次之, 平坦区域则最低. 基于上述特性, 构建图像纹理特征与分形维数之间的映射关系, 并进一步探讨了分形维数与图像细节层之间的内在关联机制. 该方法在保持整体结构一致性的前提下, 通过提升局部分形维数, 实现了图像细节的有效增强, 进而为图像增强提供了一种具有理论依据的新思路. 大量实验结果表明, 该方法在主观视觉感受和客观评价指标上具有竞争力的表现. 如在BSDS200数据集上进行4倍增强因子的测试中, 所提方法在PSNR和SSIM指标上相较于当前流行方法QWLS分别提升了5.20 dB和0.1456, 充分展示了其在图像细节增强任务中的优势与算法良好的泛化特性.

基于运动过滤和调整的离群点移除

赖桃桃, 张一凡, 李佐勇, 肖国宝, 林维斯, 王菡子

当前状态: doi: 10.16383/j.aas.c250235 cstr: 32138.14.j.aas.c250235

[摘要](128) [HTML全文](97)

摘要:
由现有的特征提取器建立的图像特征点匹配集合通常包含大量离群点, 这严重影响了特征匹配的有效性和依赖匹配结果的下游任务的性能. 最近提出的几种离群点去除方法通过估计运动场来利用匹配对的运动一致性, 并使用卷积神经网络(Convolutional neural network, CNN)来减少离群点造成的污染, 以捕获上下文. 然而, CNN在捕捉全局上下文方面的固有缺点, 如过度平滑和感受野的有限和固定大小, 限制了这些方法的性能. 与这些使用卷积神经网络直接估计运动场的方法不同, 本文通过尝试在不使用CNN的情况下估计高质量的运动场. 因此, 提出基于运动过滤和调整的网络, 以减轻在捕捉上下文时离群点的影响. 具体而言, 首先设计一个运动过滤模块, 以迭代地去除离群点并捕获上下文. 然后, 设计一个规则化和调整模块, 该模块先估计初始运动场, 接着通过利用额外的位置信息对其进行调整, 使其更加准确. 在离群点去除和相对姿态估计任务上, 在室内和室外数据集上评估了本文所提出的方法的性能. 实验结果表明, 与现有多种方法相比, 本文所提方法展现出更优的性能.

切换拓扑下混合相对阶异构多智能体系统自适应扰动抑制设计

文利燕, 刘宇, 姜斌, 马亚杰, 崔玉康

当前状态: doi: 10.16383/j.aas.c250180 cstr: 32138.14.j.aas.c250180

[摘要](134) [HTML全文](137)

摘要:
针对不确定扰动下具有混合相对阶的异构多智能体系统, 提出一种新的分布式自适应扰动抑制控制方法, 实现了切换拓扑下领导者-跟随者输出一致性. 首先, 通过引入局部输出一致性的概念, 将领导者-跟随者全局输出一致性问题转化为相邻智能体局部输出一致性问题; 然后, 针对系统参数和扰动已知的情况, 基于智能体系统控制-扰动相对阶匹配条件, 提出一种基于高阶微分邻居信息的布式标称扰动抑制控制器; 基于此, 针对因混合相对阶差异而导致控制器中的高阶微分邻居信号难以直接获取的问题, 提出基于高阶滑模微分器的精确估计方法, 突破了传统控制设计对系统相对阶一致性的依赖, 解决了固定/切换拓扑下局部-全局输出一致性; 进而, 针对系统参数和扰动不确定的情况, 进行分布式自适应扰动抑制控制器设计, 实现切换拓扑下的领导者-跟随者输出一致性以及期望的扰动补偿. 所设计的控制方法不仅能够在不依赖全局智能体信息及领导者信息的前提下, 确保整个智能体系统的闭环稳定性、实现跟随者对领导者的输出跟踪, 并达到期望的扰动抑制效果. 与常规的自适应一致性控制方案相比, 还具备处理具有混合相对阶特性的异构多智能体系统的能力. 最后, 仿真研究验证所设计控制方案的有效性.

面向具身操作的视觉−语言−动作模型综述

李浩然, 陈宇辉, 崔文博, 刘卫恒, 刘锴, 周明才, 张正涛, 赵冬斌

当前状态: doi: 10.16383/j.aas.c250394 cstr: 32138.14.j.aas.c250394

[摘要](671) [HTML全文](557)

摘要:
具身智能系统通过智能体与环境不断交互, 从而提升智能体能力, 受到学术界和产业界的广泛关注. 视觉−语言−动作模型作为一种受到大模型发展启发的机器人通用控制模型, 提高了具身智能系统中智能体与环境交互的能力, 大大扩展了具身智能机器人的应用场景. 本文对具身操作中的视觉−语言−动作模型进行综述. 首先, 详细介绍视觉−语言−动作模型的发展历程. 然后, 对视觉−语言−动作模型架构、训练数据、预训练方法、后训练方法和模型评估5个方面的研究现状进行详细分析. 最后, 针对视觉−语言−动作模型发展过程和落地应用中面临的挑战和未来可能的发展方向进行总结.

云−边−端协同下考虑多车影响的混行车群集中式协同控制

黄帅, 冯雨航, 郑太雄, 李永福

当前状态: doi: 10.16383/j.aas.c240775 cstr: 32138.14.j.aas.c250775

[摘要](270) [HTML全文](230)

摘要:
随着车联网技术的进步, 由网联人驾车与网联自动车组成的混行车群规模正逐渐增大, 导致混行车群间的协同与交互难度增加, 进而影响混行车群行驶状态的一致性. 为解决此问题, 提出一种云−边−端协同下考虑多车影响的混行车群集中式协同控制方法, 以提高混行车群协同行驶效率. 首先, 为有效处理和分析较大规模混行车群产生的海量异构信息数据, 设计混合交通场景下云−边−端协同架构. 然后, 考虑网联人驾车前方两辆车及紧邻后车状态信息的影响, 以及网联自动车前方所有车辆及紧邻后车状态信息的影响, 分别在云控平台建立基于分子动力学的网联自动车和固定权重的网联人驾车协同行驶模型. 再者, 根据混行车群间动态信息影响关系, 设计基于云−边−端协同架构的混行车群集中式协同控制方法, 并利用稳定性和串稳定性理论获得混行车群协同行驶一致性条件. 最后, 通过对比仿真实验验证了本文所提控制方法的有效性.

基于部分可观蒙特卡洛树搜索算法的无人系统异步任务规划

周鑫, 陈子夷, 周天

当前状态: doi: 10.16383/j.aas.c250313 cstr: 32138.14.j.aas.c250313

[摘要](117) [HTML全文](144)

摘要:
无人系统正深刻重塑社会生活方式与战争形态. 围绕无人系统动态规划领域, 首先将环境抽象为由节点和边组成的拓扑网络; 其次, 针对异步规划中变步长时间推进的问题, 提出一种新颖的异步规划算法, 即半马尔科夫环境下的部分可观蒙特卡洛树搜索(SPOMCP)算法, 其创新之处在于将拓扑网络转化为具有最简信息表示的子目标图, 并实现基于变步长时间推进机制的策略快速寻优. 通过理论分析, 证明了SPOMCP算法能够生成最优策略, 且计算复杂度与子目标节点数量呈指数相关. 最后仿真实验表明了SPOMCP的性能高于基准算法, 只用不到基准算法89.18 %的计算时间, 得到了高于基准算法的平均回报值.

基于空−海−潜跨域无人平台协同的海上目标探测追踪策略

田泽兴, 闫敬, 高麒媛, 杨睍, 关新平

当前状态: doi: 10.16383/j.aas.c250438 cstr: 32138.14.j.aas.c250438

[摘要](202) [HTML全文](122)

摘要:
提出一种基于空−海−潜跨域无人平台协同的海上目标探测追踪策略. 首先, 构建无人机−水面艇−潜器协同的海上跨域无人系统; 进一步, 针对海上目标的高机动性以及无人平台自身约束, 采用测度理论解析无人机−水面艇−潜器最佳探测编队队形, 实现目标探测概率最大化; 当探测到目标后, 设计基于逆强化学习的无人机−水面艇−潜器编队控制器, 实现障碍物环境下水面/水下目标的可靠有效追踪. 最后, 通过仿真与实验验证了所提方法的有效性. 结果表明, 所提探测模式可以实现有限时间内移动目标探测概率最大化, 同时所提逆强化学习编队控制器可以在保持队形稳定的基础上, 结合动态避障策略, 实现复杂环境下跨域无人平台安全协同追踪.

基于多智能体强化学习的流程工业多操作参数协同优化

刘柢炬, 王雅琳, 刘晨亮, 罗彪, 桂卫华

当前状态: doi: 10.16383/j.aas.c250308 cstr: 32138.14.j.aas.c250308

[摘要](297) [HTML全文](263)

摘要:
流程工业普遍存在多操作参数强耦合、工艺拓扑复杂和多工序协同难等问题, 导致传统局部优化方法难以满足全局最优运行需求. 针对上述挑战, 提出一种基于图谱理论的流程拓扑结构感知的多智能体强化学习协同优化方法, 以实现复杂拓扑流程工业的多操作参数协同优化. 首先, 构建基于拉普拉斯谱分析的拓扑结构解析框架, 刻画工业过程多操作参数耦合结构关系, 为智能体任务分配与协同决策提供支撑; 然后, 设计融合长短期记忆网络与多头注意机制的时序感知模块, 实现历史状态轨迹中关键时间依赖特征提取; 进一步, 引入多层次空间注意力机制, 面向组织层、变量层及连续控制域实现优化关注度的动态自适应调节; 在此基础上, 构建局部-全局协同的分层强化学习决策架构, 实现多智能体间的协调控制与策略优化. 在连续搅拌釜反应器系统和盐湖化工典型流程的工业数据基础上, 构建了仿真实验以验证所提方法的有效性. 实验结果表明, 所提方法相较于传统方法性能提升41.2%, 展现出更优的收敛性能和策略稳定性, 为流程工业多操作参数协同优化提供了新思路和参考技术路径.

海上跨域集群水下目标协同追踪: 关键技术与展望

李一辰, 关新平, 黄沛烁, 王布依祎, 杨紫雯, 于文彬

当前状态: doi: 10.16383/j.aas.c250309 cstr: 32138.14.j.aas.c250309

[摘要](238) [HTML全文](298)

摘要:
随着海洋开发的不断推进, 水下目标追踪作为实现无人集群对作业目标持续接近的基础性技术, 在海上搜救、海洋监测、海底资源勘探等关键应用中发挥着重要作用. 同时, 海上跨域集群通过无人机、无人船与无人潜器等异构平台间的信息交互与自主协同, 能够在复杂海洋环境中实现对水下目标的高效探测与持续追踪, 相比单一水下域集群, 在感知与作业能力的提升等方面具有巨大的潜力. 然而, 当前水下协同追踪技术仍存在感知测量能力不足、跨域协同机制不完善和环境适应性难以兼顾等挑战. 为此, 本文首先针对水下目标追踪的发展趋势进行了分析; 同时, 面向追踪过程中定位、跟踪、传输与规划四个基础模块, 总结了研究难点和挑战, 并梳理了国内外研究进展; 最后, 针对联合设计等新颖的研究理念和前沿需求进行了探讨, 以期为海上跨域集群水下目标追踪技术的发展提供参考.

知识−数据−模型驱动的低空动目标轨迹融合预测方法

周同乐, 刘子仪, 陈谋

当前状态: doi: 10.16383/j.aas.c250429 cstr: 32138.14.j.aas.c250429

[摘要](235) [HTML全文](291)

摘要:
针对低空环境下动目标轨迹预测问题, 提出一种知识—数据—模型驱动的动目标轨迹融合预测框架. 基于低空飞行器运动特征构建飞行知识混合专家模型, 通过将多源传感器数据输入至各飞行知识专家模块, 实现目标机动模态的精细化识别, 并使用Mamba模型提取时空关联特征; 设计权值自适应调节机制, 利用注意力机制动态融合多源感知数据, 解决传感器时空异步问题; 采用门控循环单元建模长期时序依赖关系, 根据目标历史飞行数据生成初步预测轨迹; 基于低空目标运动学方程构建物理信息神经网络, 通过动态权衡数据驱动损失与物理约束损失, 矫正数据驱动偏差, 确保预测轨迹满足运动学约束并有效抑制多步预测误差累积. 数值仿真及实验验证结果表明, 所提出的知识—数据—模型驱动的动目标轨迹融合预测方法, 能够有效预测低空目标飞行轨迹.

通信受限的双网络零和博弈分布式在线优化

廖岚, 于湛, 袁德明, 张保勇, 徐胜元

当前状态: doi: 10.16383/j.aas.c250295 cstr: 32138.14.j.aas.c250295

[摘要](182) [HTML全文](178)

摘要:
研究双网络零和博弈中的分布式优化问题, 两个网络代表两个对立的玩家. 每个网络由一组具有时变损失函数的智能体组成, 智能体通过通信和协作来优化己方网络在博弈中的收益. 考虑到现实优化场景中通信资源受限和信息反馈受限两种通信受限情形, 设计了基于事件触发通信和两点Bandit反馈的分布式在线优化算法, 并采用动态纳什均衡遗憾评估算法的性能. 在某些假设条件下, 建立相对于总博弈次数为次线性的动态纳什均衡遗憾界, 从而验证了算法的有效性. 此外, 将设计的算法拓展为多周期版本并建立次线性的动态纳什均衡遗憾界. 最后, 通过双线性矩阵博弈的仿真算例进一步验证了所设计的两个算法的性能.

城市空中交通系统最优规模评估与调度

郭戈, 郑智远, 张忍永康

当前状态: doi: 10.16383/j.aas.c250396 cstr: 32138.14.j.aas.c250396

[摘要](162) [HTML全文](206)

摘要:
针对城市空中交通系统,提出一种优化方法以同时确定满足乘客需求的最小系统规模和最佳系统再平衡策略.研究构建了流体模型与多服务器M/M/s排队模型的联合框架,描述乘客、飞行器与电池在站点间迁移、换电及充电过程.在该模型框架下对飞行器和电池数量的适定性进行了证明,并给出了系统供需均衡时的必要条件.在此基础上,通过线性规划求解系统供需均衡下的再平衡分配率与最小机队规模,并计算最优充电站位置、电池数量及电池运输车数量.数值仿真分析了影响系统规模的因素,实例验证证明了所提再平衡方法的有效性.

3D空间先验驱动的相机轨迹可控视频扩散生成模型

朱泓舟, 杨雪, 赵敏, 李崇轩, 朱军

当前状态: doi: 10.16383/j.aas.c250124 cstr: 32138.14.j.aas.c250124

[摘要](270) [HTML全文](296)

摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.

一种基于单比特通信压缩的大模型训练方法研究

陈楚岩, 刘烨谞, 贾维宸, 何雨桐, 袁坤, 王立威

当前状态: doi: 10.16383/j.aas.c250087 cstr: 32138.14.j.aas.c250087

[摘要](726) [HTML全文](449)

摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.

面向大模型时代的持续学习方法论演变

王全子昂, 王仁振, 孟德宇, 徐宗本

当前状态: doi: 10.16383/j.aas.c240805 cstr: 32138.14.j.aas.c240805

[摘要](2058) [HTML全文](1035) [PDF 2727KB](365)

摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.

基于 PID 自整定功能的自适应双路输出的黑体温度控制

张海弟

当前状态: doi: 10.16383/j.aas.c190277

[摘要](1298) [HTML全文](767)

摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.

仿人智能控制理论及应用研究进展

戴小文, 宋建霖, 岳丽全

当前状态: doi: 10.16383/j.aas.c200007

[摘要](2626) [HTML全文](1273)

摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.

基于生成对抗网络的对抗攻击防御模型

孔锐, 蔡佳纯, 黄钢

当前状态: doi: 10.16383/j.aas.2020.c200033

[摘要](3405) [HTML全文](2294)

摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.

留言板

多智能体系统专刊

双语传播工程入选

自动化学报创刊60周年专刊

《自动化学报》致谢审稿人

特别推荐

公告More

相关链接

访问统计