2.765

2022影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码
显示方式:
目录
目录
2023, 49(9).  
[封面浏览] [PDF 8027KB](7)
综述
安全强化学习综述
王雪松, 王荣荣, 程玉虎
2023, 49(9): 1813-1835.   doi: 10.16383/j.aas.c220631
[摘要](1143) [HTML全文](1606) [PDF 840KB](256)
摘要:
强化学习(Reinforcement learning, RL)在围棋、视频游戏、导航、推荐系统等领域均取得了巨大成功. 然而, 许多强化学习算法仍然无法直接移植到真实物理环境中. 这是因为在模拟场景下智能体能以不断试错的方式与环境进行交互, 从而学习最优策略. 但考虑到安全因素, 很多现实世界的应用则要求限制智能体的随机探索行为. 因此, 安全问题成为强化学习从模拟到现实的一个重要挑战. 近年来, 许多研究致力于开发安全强化学习(Safe reinforcement learning, SRL)算法, 在确保系统性能的同时满足安全约束. 本文对现有的安全强化学习算法进行全面综述, 将其归为三类: 修改学习过程、修改学习目标、离线强化学习, 并介绍了5大基准测试平台: Safety Gym、safe-control-gym、SafeRL-Kit、D4RL、NeoRL. 最后总结了安全强化学习在自动驾驶、机器人控制、工业过程控制、电力系统优化和医疗健康领域中的应用, 并给出结论与展望.
论文与报告
无控制器间通信的线性多智能体一致性的降阶协议
马煜文, 李贤伟, 李少远
2023, 49(9): 1836-1844.   doi: 10.16383/j.aas.c220420
[摘要](224) [HTML全文](74) [PDF 1493KB](37)
摘要:
针对线性同质多智能体系统, 提出一种新的降阶输出反馈一致性协议. 该协议仅依赖智能体间相对输出信息, 当相对输出信息可直接测量时, 该协议无需在邻居智能体间共享控制器的状态, 降低系统对通讯媒介的依赖. 本文首先给出该协议存在的充要条件, 然后证明闭环系统的一致性并计算一致性状态. 理论分析表明, 该协议仍然具有类似分离原理的性质, 因此其参数构造过程非常简便. 最后, 通过数值仿真对比实验, 验证了该控制协议的有效性.
基于事件相机的连续光流估计
付婧祎, 余磊, 杨文, 卢昕
2023, 49(9): 1845-1856.   doi: 10.16383/j.aas.c210242
[摘要](1163) [HTML全文](719) [PDF 1765KB](79)
摘要:
事件相机对场景的亮度变化进行成像, 输出异步事件流, 具有极低的延时, 受运动模糊问题影响较少. 因此, 可以利用事件相机解决高速运动场景下的光流(Optical flow, OF)估计问题. 基于亮度恒定假设和事件产生模型, 利用事件相机输出事件流的低延时性质, 融合存在运动模糊的亮度图像帧, 提出基于事件相机的连续光流估计算法, 提升了高速运动场景下的光流估计精度. 实验结果表明, 相比于现有的基于事件相机的光流估计算法, 该算法在平均端点误差、平均角度误差和均方误差3个指标上, 分别提升11%、45% 和8%. 在高速运动场景下, 该算法能够准确重建出高速运动目标的连续光流, 保证了存在运动模糊情况时, 光流估计的精度.
基于误差回传机制的多尺度去雾网络
杨爱萍, 李晓晓, 张腾飞, 王朝臣, 王建
2023, 49(9): 1857-1867.   doi: 10.16383/j.aas.c210264
[摘要](510) [HTML全文](248) [PDF 2004KB](29)
摘要:
针对现有图像去雾方法因空间上/下文信息丢失而无法准确估计大尺度目标特征, 导致图像结构被破坏或去雾不彻底等问题, 提出一种基于误差回传机制的多尺度去雾网络. 网络由误差回传多尺度去雾组(Error-backward multi-scale dehazing group, EMDG)、门控融合模块(Gated fusion module, GFM)和优化模块组成. 其中误差回传多尺度去雾组包括误差回传模块(Error-backward block, EB)和雾霾感知单元(Haze aware unit, HAU). 误差回传模块度量相邻尺度网络特征图之间的差异, 并将生成的差值图回传至上一尺度, 实现对结构信息和上/下文信息的有效复用; 雾霾感知单元是各尺度子网络的核心, 其由残差密集块(Residual dense block, RDB)和雾浓度自适应检测块(Haze density adaptive detection block, HDADB)组成, 可充分提取局部信息并能够根据雾浓度实现自适应去雾. 不同于已有融合方法直接堆叠各尺度特征, 提出的门控融合模块逐像素学习每个子网络特征图对应的最优权重, 有效避免了干扰信息对图像结构和细节信息的破坏. 再经优化模块, 可得到最终的无雾图像. 在合成数据集和真实数据集上的大量实验表明, 该方法优于目前的主流去雾方法, 尤其是对远景雾气去除效果更佳.
电熔镁砂生产用电需量多步智能预报方法
张菁雯, 柴天佑, 李慷
2023, 49(9): 1868-1877.   doi: 10.16383/j.aas.c220659
[摘要](356) [HTML全文](138) [PDF 1423KB](22)
摘要:
电熔镁砂生产 (Fused magnesia smelting process, FMSP)用电需量会出现先升后降的尖峰现象, 当峰值达到用电需量限幅值, 会将电熔镁炉(Fused magnesia furnace, FMF)拉闸断电. 为避免尖峰时刻的不必要拉闸需要对需量尖峰进行识别, 因此需要进行需量多步预报. 利用电熔镁砂生产过程熔化电流闭环控制系统方程建立了由线性模型和未知非线性动态系统组成的需量多步预报模型, 将系统辨识与深度学习相结合提出了端边云协同的电熔镁砂生产用电需量多步智能预报方法. 采用电熔镁砂生产过程的工业大数据的实验结果验证了所提的预报方法可以准确预报需量的变化趋势.
简单无向图的同构判定方法
王卓, 王成红
2023, 49(9): 1878-1888.   doi: 10.16383/j.aas.c230025
[摘要](82) [HTML全文](54) [PDF 1209KB](15)
摘要:
给出了矩阵同构变换、简单无向图距离矩阵、距离矩阵列和向量以及图的距离谱的定义, 将基于邻接矩阵的同构判定条件推广到简单无向图距离矩阵. 针对简单无向连通图的同构判定问题: 给出了基于距离矩阵特征多项式的同构判定条件; 进一步, 为避免计算误差对判定结果的影响, 给出了基于距离矩阵的秩与列和向量的同构判定条件. 上述两个判定条件均是充要条件且均具有多项式时间复杂度.
基于语境辅助转换器的图像标题生成算法
连政, 王瑞, 李海昌, 姚辉, 胡晓惠
2023, 49(9): 1889-1903.   doi: 10.16383/j.aas.c220767
[摘要](122) [HTML全文](44) [PDF 1252KB](11)
摘要:
在图像标题生成领域, 交叉注意力机制在建模语义查询与图像区域的关系方面, 已经取得了重要的进展. 然而, 其视觉连贯性仍有待探索. 为填补这项空白, 提出一种新颖的语境辅助的交叉注意力(Context-assisted cross attention, CACA)机制, 利用历史语境记忆(Historical context memory, HCM), 来充分考虑先前关注过的视觉线索对当前注意力语境生成的潜在影响. 同时, 提出一种名为“自适应权重约束(Adaptive weight constraint, AWC)” 的正则化方法, 来限制每个CACA模块分配给历史语境的权重总和. 本文将CACA模块与AWC方法同时应用于转换器(Transformer)模型, 构建一种语境辅助的转换器(Context-assisted transformer, CAT)模型, 用于解决图像标题生成问题. 基于MS COCO (Microsoft common objects in context)数据集的实验结果证明, 与当前先进的方法相比, 该方法均实现了稳定的提升.
基于外环速度补偿的封闭机器人确定学习控制
王敏, 林梓欣, 王聪, 杨辰光
2023, 49(9): 1904-1914.   doi: 10.16383/j.aas.c220575
[摘要](66) [HTML全文](43) [PDF 2659KB](15)
摘要:
针对未开放力矩控制接口的一类封闭机器人系统, 提出一种基于外环速度补偿的确定学习控制方案. 该控制方案考虑机器人受到未知动力学影响, 且具有未知内环比例积分(Proportional-integral, PI)速度控制器. 首先, 利用宽度径向基函数(Radial basis function, RBF)神经网络对封闭机器人的内部未知动态进行逼近, 设计外环自适应神经网络速度控制指令. 在实现封闭机器人稳定控制的基础上, 结合确定学习理论证明了宽度RBF神经网络的学习能力, 提出基于确定学习的高精度速度控制指令. 该控制方案能够保证被控封闭机器人系统的所有信号最终一致有界且跟踪误差收敛于零的小邻域内. 在所提控制方案中, 通过引入外环补偿控制思想和宽度神经网络动态增量节点方式, 减小了设备计算负荷, 提高了速度控制下机器人的运动性能, 解决了市场上封闭机器人系统难以设计力矩控制的难题, 实现了不同工作任务下的高精度控制. 最后数值系统仿真结果和UR5机器人实验结果验证了该方案的有效性.
面向智能血糖管理的餐前胰岛素剂量贝叶斯学习优化方法
史大威, 蔡德恒, 刘蔚, 王军政, 纪立农
2023, 49(9): 1915-1927.   doi: 10.16383/j.aas.c210067
[摘要](708) [HTML全文](439) [PDF 2829KB](43)
摘要:
餐前胰岛素剂量精准决策是改善糖尿病患者血糖管理的关键. 临床治疗中胰岛素剂量调整一般在较短时间内完成, 具有典型的小样本特征; 数据驱动建模在该情形下无法准确学习患者餐后血糖代谢规律, 难以确保胰岛素剂量的安全和有效决策. 针对这一问题, 设计一种临床经验辅助的餐前胰岛素剂量自适应优化决策框架, 构建高斯过程血糖预测模型和模型有效性在线评估机制, 提出基于历史剂量和临床经验决策约束的贝叶斯优化方法, 实现小样本下餐后血糖轨迹的安全预测和餐前胰岛素注射剂量的优化决策. 该方法的安全性和有效性通过美国食品药品监督管理局接受的UVA/Padova T1DM平台测试结果和1型糖尿病患者实际临床数据决策结果充分验证. 可为餐前胰岛素剂量智能决策及临床试验提供方法基础和技术支持, 也为中国糖尿病患者血糖管理水平的有效改善, 提供了精准医学治疗手段.
基于黎曼度量的一类反馈控制系统性能监测与诊断
李琳琳, 李莎莎, DING Steven Xianchun, 彭鑫, 彭开香
2023, 49(9): 1928-1940.   doi: 10.16383/j.aas.c210027
[摘要](1743) [HTML全文](418) [PDF 2102KB](51)
摘要:
针对复杂工业系统对性能衰退的容忍度低等问题, 提出基于系统性能预测的一类反馈控制系统过程监测方法, 通过黎曼度量对控制性能衰退程度进行预测与监测, 并给出发生故障的类型, 以提升过程监测系统的实时性与准确性. 首先, 利用系统的实时数据, 计算系统性能衰退的预测指标; 其次, 利用黎曼度量对系统性能衰退程度进行预测与监测, 并利用随机算法给出对应的阈值来诊断系统性能衰退; 最后, 通过计算各类引发系统性能衰退的故障的性能预测指标集合的中心和阈值, 实现故障的实时定位. 所提出的方法通过三容水箱仿真实验平台进行验证.
干涉型光纤海洋参数传感器的分布式测量方法研究
郑洪坤, 吕日清, 赵勇, 彭昀, 林子婷, 刘睿杰
2023, 49(9): 1941-1950.   doi: 10.16383/j.aas.c220682
[摘要](51) [HTML全文](16) [PDF 3720KB](9)
摘要:
光纤传感器因其灵敏度高、体积小等优点在海洋监测领域得到了广泛关注. 目前高性能的海洋温盐深参数监测光纤传感器大都基于干涉原理, 难以实现同一系统内多个传感器的复用, 不能满足海洋环境参数高时空分辨力的监测需求. 基于调频连续波原理, 提出一种适用于干涉型海洋参数光纤传感器的大容量复用方法. 利用不同干涉仪端面反射光与参考光形成Mach-Zehnder干涉光谱的特征频率确定不同传感器的位置, 通过不同端面特征频率间的拍频还原了单个传感器的光谱. 设计并搭建了干涉型海洋参数传感器的分布式传感系统, 实现了系统中传感器的定位以及光谱信号还原, 并通过理论计算证明分布式传感系统中至少可以实现500个传感器的复用. 本论文的研究可以为高性能干涉型光纤传感器的海洋参数链式监测提供技术支持.
基于ANFIS的多AUV协同定位系统量测异常检测方法
徐博, 李盛新, 王连钊, 王权达
2023, 49(9): 1951-1966.   doi: 10.16383/j.aas.c200921
[摘要](1154) [HTML全文](437) [PDF 2662KB](40)
摘要:
针对异常水声测距信息对多自主水下航行器(Autonomous underwater vehicles, AUV)协同定位系统的不利影响, 以及传统故障检测方法在多水声测距信息交替混淆的情况下检测效率低的问题, 提出一种基于自适应神经模糊推理系统(Adaptive neuro-fuzzy inference system, ANFIS)的量测异常检测方法. 首先, 分别建立与各水声测距系统相对应的ANFIS模型; 然后, 基于自适应容积卡尔曼滤波(Adaptive cubature Kalman filter, ACKF)和马氏距离构造反映量测异常的特征信息作为ANFIS的输入; 其次, 基于预定义的量测异常信息建立了初始混合数据库以训练ANFIS模型实现对量测异常的在线实时检测与隔离; 最后, 利用湖水实验数据进行了AUV协同定位仿真验证. 实验结果表明该方法可以准确识别异常水声测距信息, 与传统故障检测方法相比, 误报率(False positive rate, FPR)与漏检率(False negative rate, FNR)均减少70%以上.
具有类万有引力的有界置信观点动力学分析与应用
刘青松, 习晓苗, 柴利
2023, 49(9): 1967-1975.   doi: 10.16383/j.aas.c211134
[摘要](253) [HTML全文](72) [PDF 1653KB](21)
摘要:
在社会网络中, Hegselmann-Krause模型描述了置信阈值内不同邻居对个体的观点影响权重都相同且邻居对个体的吸引力与它们的观点差值成正比, 这是不切实际的. 为了克服经典Hegselmann-Krause模型的不足, 提出具有类万有引力的有界置信观点动力学模型, 描述个体观点的更新依赖于观点之间的差值和邻居的权威性, 且不同邻居对个体的观点影响权重不同. 根据置信矩阵的性质证明观点的收敛性, 并分析具有衰减置信阈值的观点动力学行为, 给出观点收敛速率的显式解. 最后, 利用提出的观点动力学模型, 研究社会心理学中的“权威效应”和“非零和效应”. 仿真结果表明, 邻居的权威性有利于观点达成一致.
基于重组性高斯自注意力的视觉Transformer
赵亮, 周继开
2023, 49(9): 1976-1988.   doi: 10.16383/j.aas.c220715
[摘要](71) [HTML全文](15) [PDF 4232KB](17)
摘要:
在目前视觉Transformer的局部自注意力中, 现有的策略无法建立所有窗口之间的信息流动, 导致上下文语境建模能力不足. 针对这个问题, 基于混合高斯权重重组(Gaussian weight recombination, GWR)的策略, 提出一种新的局部自注意力机制SGW-MSA (Shuffled and Gaussian window-multi-head self-attention), 它融合了3种不同的局部自注意力, 并通过GWR策略对特征图进行重建, 在重建的特征图上提取图像特征, 建立了所有窗口的交互以捕获更加丰富的上下文信息. 基于SGW-MSA设计了SGWin Transformer整体架构. 实验结果表明, 该算法在mini-imagenet图像分类数据集上的准确率比Swin Transformer提升了5.1%, 在CIFAR10图像分类实验中的准确率比Swin Transformer提升了5.2%, 在MS COCO数据集上分别使用Mask R-CNN和Cascade R-CNN目标检测框架的mAP比Swin Transformer分别提升了5.5%和5.1%, 相比于其他基于局部自注意力的模型在参数量相似的情况下具有较强的竞争力.
基于分数布朗运动过程模型的混合随机退化设备剩余寿命预测
高旭东, 胡昌华, 张建勋, 杜党波, 喻勇
2023, 49(9): 1989-2002.   doi: 10.16383/j.aas.c200683
[摘要](62) [HTML全文](19) [PDF 2505KB](9)
摘要:
在实际工程中, 设备往往是由多个不同类型元件或部件构成的集合体, 其总体性能退化程度是由内部多种随机退化过程综合影响下的结果. 不同于现有文献主要采用无记忆效应的单一线性或非线性形式随机过程模型来描述设备的真实退化, 首先建立一种基于分数布朗运动(Fractional Brownian motion, FBM)的混合随机退化模型, 用以刻画退化过程中的记忆效应与长期依赖性; 进一步, 在退化模型里同时引入双随机效应, 用以描述不同设备之间的退化差异性, 并基于弱收敛性理论推导得到首达时间(First hitting time, FHT)意义下剩余寿命(Remaining useful life, RUL)概率密度函数(Probability density function, PDF)的近似解析表达形式; 然后, 给出一种共性参数离线估计和随机参数实时更新的策略, 进而实现了剩余寿命的实时预测; 最后, 通过数值仿真例子和陀螺仪的实际退化数据, 验证了该方法的有效性和具有潜在的工程应用价值.
双贮备系统冷/温/热贮备模型的优化选择研究
金海波, 赵欣越, 桑雨
2023, 49(9): 2003-2018.   doi: 10.16383/j.aas.c200533
[摘要](583) [HTML全文](157) [PDF 1370KB](26)
摘要:
对运行设备安装双贮备设备是实现系统高可靠性的有效方法. 在双贮备系统冷/温/热三种贮备模型中, 选择哪种贮备模型对系统性能指标和经济指标均有重要影响, 因此对如何选择双贮备系统的贮备模型从而使系统性能最优或经济效益最大的问题进行研究具有现实意义. 而现有研究成果很少涉及双贮备系统贮备模型的优化选择问题. 为此, 本文创新性地提出一种确定双贮备系统最优贮备模型的选择方法. 分别建立系统冷/温/热贮备模型, 分析每个模型的系统状态及系统半Markov核函数, 利用Markov更新方程、Laplace变换以及Laplace-Stieltjes变换技术推导系统稳态可用度、稳态平均维修次数、维修人员稳态忙期概率以及冷贮备模型的平均激活时间, 并从经济角度给出系统单位时间内的净收益函数. 最后分别以性能指标和经济指标作为研究目标, 通过模型对比分析给出不同条件下的系统贮备模型的优化选择算法, 并对每个研究目标下的优化选择算法进行实例计算. 计算结果表明以不同性能指标和不同费用作为参考得出的最优贮备模型不尽相同, 从而验证了所提方法能够有效地确定不同衡量标准下的系统最优贮备模型.
本刊经同行评议拟录用的文章,目前在编校阶段,尚未确定卷期及页码,已有DOI。
显示方式:
全天实时跟踪无人机目标的多正则化相关滤波算法
王法胜, 李富, 尹双双, 王星, 孙福明, 朱兵
当前状态:  doi: 10.16383/j.aas.c220424
[摘要](0) [HTML全文](0)
摘要:
相关滤波算法(Correlation filter, CF)已广泛应用于无人机目标跟踪. 然而, 受无人机平台本身计算性能的制约, 现有的无人机相关滤波跟踪算法大都仅采用手工特征来描述目标的外观, 难以获得目标的全面语义信息. 并且这些跟踪算法仅能较好地进行光照条件良好场景下的跟踪, 而在跟踪夜间场景下的目标时性能严重下降. 此外, 相关滤波跟踪器采用余弦窗口来抑制循环移位产生的边界效应, 缩小了样本提取区域, 产生了训练样本污染的问题, 这不可避免地降低了跟踪器的性能. 针对以上问题, 提出全天实时多正则化相关滤波算法(All-day and real-time multi-regularized correlation filter, AMRCF)跟踪无人机目标. 首先, 引入一个自适应图像增强模块, 在不影响图像各通道颜色比例的前提下, 对获得的图像进行增强, 以提高夜间目标跟踪性能. 其次, 引入一个轻量型的深度网络来提取目标的深度特征, 并与手工特征一起来表示目标的语义信息. 此外, 在算法框架中嵌入高斯形状掩膜, 在抑制边界效应的同时, 有效避免训练样本污染. 最后, 在5个公开的无人机基准数据集上进行充分的实验. 实验结果表明, 所提出的算法与多个先进的相关滤波跟踪器相比, 取得了有竞争力的结果, 且算法的实时速度约为25 fps, 能够胜任无人机的目标跟踪任务.
具有遗忘群体的社会网络多维观点动力学分析与应用
刘青松, 李明鹏, 柴利
当前状态:  doi: 10.16383/j.aas.c210091
[摘要](1075) [HTML全文](234) [PDF 1467KB](35)
摘要:
在个体观点演化过程中, 由于通讯技术和实际环境的限制, 个体之间往往不能进行充分地交流. 另一方面, 由于社会群体的从众压力影响, 个体会改变已形成的观点. 为此, 研究了具有遗忘群体和从众压力的拟强连通社会网络中表达/私人观点演化问题. 为了刻画不同话题之间表达/私人观点的相互影响, 提出一个新的多维观点动力学模型. 根据逻辑矩阵和网络影响子矩阵的正则性, 给出了表达观点和私人观点收敛的充分条件. 应用本文所提出的观点动力学模型, 复现了“多元无知”的社会现象. 仿真分析表明, 从众压力的恢复力越小, 表达观点与私人观点的差异越大.
高超声速变外形飞行器建模与固定时间预设性能控制
曹承钰, 李繁飙, 廖宇新, 殷泽阳, 桂卫华
当前状态:  doi: 10.16383/j.aas.c230240
[摘要](129) [HTML全文](52)
摘要:
以一种折叠式高超声速变外形飞行器为研究对象, 综合考虑变形引起的气动特性、动力学特性的动态变化和模型不确定性、外部干扰的影响, 开展飞行器建模与固定时间预设性能控制方法研究. 首先, 建立高超声速变外形飞行器的运动模型和姿态控制模型; 然后, 采用固定时间干扰观测器实现对模型不确定性和外部干扰构成的复合总扰动的精确估计, 并设计一种新型固定时间预设性能函数以定量描述期望性能约束, 在此基础上, 基于预设性能控制架构并结合动态面控制技术设计预设性能姿态控制器, 利用Lyapunov稳定性理论证明闭环系统的固定时间稳定性; 最后, 通过数值仿真验证所提出方法的有效性和鲁棒性.
基于自然梯度的噪声自适应变分贝叶斯滤波算法
胡玉梅, 潘泉, 胡振涛, 郭振
当前状态:  doi: 10.16383/j.aas.c210964
[摘要](29) [HTML全文](12) [PDF 1824KB](4)
摘要:
考虑到运动目标跟踪系统机动、隐身等人为对抗特征以及非视距、干扰、遮挡等环境因素, 其系统建模、估计与辨识过程中越来越无法回避非线性、非高斯以及参数未知等复杂系统特征的影响. 针对过程噪声先验信息不准确以及量测噪声非高斯环境下运动目标的非线性状态估计问题, 提出一种基于自然梯度的噪声自适应变分贝叶斯滤波算法. 首先, 利用指数族分布具有统一表达形式的优势, 构建参数化逆威沙特分布作为状态一步预测误差协方差的共轭先验分布, 同时选取学生t分布重构因量测随机缺失导致的具有非高斯特点的似然函数; 其次, 在变分贝叶斯优化框架下采用平均场理论将状态变量联合后验分布近似分解为独立的变分分布, 在此基础上, 结合坐标上升方法更新各变量的变分分布参数; 进而, 结合 Fisher 信息矩阵推导置信下界最大化关于状态估计及其估计误差协方差的自然梯度, 使非线性状态后验分布的近似分布沿梯度下降, 以实现对状态后验概率密度函数的“紧密”逼近. 理论分析和仿真实验表明: 相对传统的非线性滤波方法, 本文算法对噪声不确定问题具有较好的自适应能力, 并且能够获得较高的状态估计精度.
基于突触巩固机制的前馈小世界神经网络设计
李文静, 李治港, 乔俊飞
当前状态:  doi: 10.16383/j.aas.c220638
[摘要](155) [HTML全文](30) [PDF 1977KB](8)
摘要:
小世界神经网络具有较快的收敛速度和优越的容错性, 近年来得到广泛关注. 然而, 在网络构造过程中, 随机重连可能造成重要信息丢失, 进而导致网络精度下降. 针对该问题, 基于Watts-Strogatz (WS) 型小世界神经网络, 提出了一种基于突触巩固机制的前馈小世界神经网络(Feedforward small-world neural network based on synaptic consolidation, FSWNN-SC). 首先, 使用网络正则化方法对规则前馈神经网络进行预训练, 基于突触巩固机制, 断开网络不重要的权值连接, 保留重要的连接权值; 其次, 设计重连规则构造小世界神经网络, 在保证网络小世界属性的同时实现网络稀疏化, 并使用梯度下降算法训练网络; 最后, 通过4个UCI基准数据集和2个真实数据集进行模型性能测试, 并使用Wilcoxon符号秩检验对对比模型进行显著性差异检验. 实验结果表明: 所提出的FSWNN-SC模型在获得紧凑的网络结构的同时, 其精度显著优于规则前馈神经网络及其他WS型小世界神经网络.
基于激光雷达的无人驾驶3D多目标跟踪
熊珍凯, 程晓强, 吴幼冬, 左志强, 刘家胜
当前状态:  doi: 10.16383/j.aas.c210783
[摘要](819) [HTML全文](324) [PDF 5571KB](91)
摘要:
无人驾驶汽车行驶是连续时空的三维运动, 汽车周围的目标不可能突然消失或者出现, 因此, 对于感知层而言, 稳定可靠的多目标跟踪(Multi-object tracking, MOT)意义重大. 针对传统的目标关联和固定生存周期(Birth and death memory, BDM)管理的不足, 提出基于边界交并比(Border intersection over union, BIoU)度量的目标关联和自适应生存周期管理策略. BIoU综合了欧氏距离和交并比(Intersection over union, IoU)的优点, 提高了目标关联的精度. 自适应生存周期管理将目标轨迹置信度与生存周期相联系, 显著减少了目标丢失和误检. 在KITTI多目标跟踪数据集上的实验验证了该方法的有效性.
融合注意力机制的增强受限玻尔兹曼机驱动的交互式分布估计算法
暴琳, 孙晓燕, 巩敦卫, 张勇
当前状态:  doi: 10.16383/j.aas.c200604
[摘要](1030) [HTML全文](194) [PDF 2818KB](90)
摘要:
面向用户生成内容(User generated content, UGC)的进化搜索在大数据及个性化服务领域已引起广泛关注, 其关键在于基于多源异构用户生成内容构建用户认知偏好模型, 进而设计高效的进化搜索机制. 针对此, 提出融合注意力机制的受限玻尔兹曼机(Restricted Boltzmann machine, RBM)偏好认知代理模型构建机制, 并应用于交互式分布估计算法(estimation of distribution algorithm, EDA), 设计含用户生成内容的个性化进化搜索策略. 基于用户群体提供的文本评论, 以及搜索物品的类别文本, 构建无监督受限玻尔兹曼机模型提取广义特征; 设计注意力机制, 融合广义特征, 获取对用户认知偏好高度相关特征的集成; 利用该特征再次训练受限玻尔兹曼机, 实现对用户偏好认知代理模型的构建; 根据用户偏好认知代理模型, 给出交互式分布估计算法概率更新模型以及物品适应度评价函数, 实现物品个性化进化搜索. 算法在亚马逊个性化搜索实例的应用验证了用户认知偏好模型的可靠性, 以及个性化进化搜索的有效性.
基于模糊核估计的图像盲超分辨率神经网络
李公平, 陆耀, 王子建, 吴紫薇, 汪顺舟
当前状态:  doi: 10.16383/j.aas.c200987
[摘要](1119) [HTML全文](640) [PDF 5511KB](40)
摘要:
模糊图像的超分辨率重建具有挑战性并且有重要的实用价值. 为此, 提出一种基于模糊核估计的图像盲超分辨率神经网络(Blurred image blind super-resolution network based on kernel estimation, BESRNet). 该网络主要包括两个部分: 模糊核估计子网络和模糊核自适应的图像重建子网络. 给定任意低分辨率图像(low-resolution image, LR), 首先利用模糊核估计子网络从输入图像估计出实际的模糊核, 然后根据估计到的模糊核, 利用模糊核自适应的图像重建子网络完成输入图像的超分辨率重建. 与其他图像盲超分辨率方法不同, 所提出的模糊核估计子网络能够显式地从输入低分辨率图像中估计出完整的模糊核, 然后模糊核自适应的图像重建子网络根据估计到的模糊核, 动态地调整网络各层的图像特征, 从而适应不同输入图像的模糊. 在多个基准数据集上进行了有效性实验, 定性和定量的结果都表明该网络优于同类的图像盲超分辨率神经网络.
时滞取值概率未知下的线性时滞系统辨识方法
刘鑫
当前状态:  doi: 10.16383/j.aas.c201016
[摘要](620) [HTML全文](177) [PDF 1380KB](30)
摘要:
在大多数系统辨识方法中, 通常假设时变时滞在其可能的取值范围内服从均匀分布. 但是这种假设是非常受限的且在实际过程中常常无法得到满足. 因此在时滞取值概率条件未知的情况下, 针对一类线性时变时滞系统提出有效的辨识方法. 利用期望最大化(Expectation maximization, EM)算法将拟研究的辨识问题公式化, 期望最大化算法通过不断地迭代执行期望步骤和最大化步骤得到优化的参数估计. 在期望步骤中, 将未知的时变时滞当作隐含变量来处理并且假设可能的取值范围已知. 在每一个采样时刻, 时滞的变换由一个概率向量控制, 并且该向量中的每一个元素是未知的, 将其当作待估计的未知参数处理. 在算法的每次迭代过程中, 计算时滞的后验概率密度函数(Probability density function, PDF), 并在此基础上构造代价函数(Q-函数). 在最大化步骤中, 通过不断优化(Q-函数)来估计想要的参数, 包括模型参数、噪声参数、控制概率向量中的每一个元素和未知的时滞. 最后通过一个数值例子验证提出算法的有效性.
面向自动驾驶测试的危险变道场景泛化生成
赵祥模, 赵玉钰, 景首才, 惠飞, 刘建蓓
当前状态:  doi: 10.16383/j.aas.c220772
[摘要](26) [HTML全文](9)
摘要:
针对自动驾驶虚拟测试中危险变道场景构建问题, 提出一种数据−模型驱动的自动驾驶测试危险变道场景泛化生成方法. 基于 NGSIM US101 数据集中的紧急变道数据,提出一种紧急变道轨迹对抗生成方法, 构建基于安全距离的两车变道状态约束模型, 设计危险变道测试场景泛化生成方法, 生成危险变道测试场景库. 实验结果显示: 生成的5万条紧急变道轨迹变道完成时间分布的均方根误差为 0.63, 生成的 5 万个危险变道场景中, 99.54% 的场景被测自动驾驶车辆与变道背景车辆的碰撞时间小于 1 s,表明该方法能够有效生成自动驾驶测试危险变道场景.
基于单试次脑电解码的类自举法谎言预测研究
白帅帅, 陈超, 魏玮, 代璐瑶, 刘烨, 邱爽, 何晖光
当前状态:  doi: 10.16383/j.aas.c220341
[摘要](209) [HTML全文](50) [PDF 1283KB](13)
摘要:
基于脑电(Electroencephalogram, EEG)的谎言预测技术依赖于对事件相关电位(Event-related potential, ERP)的有效解码, 当前主要采用手工设计特征进行脑电分析. 近年来, 单试次脑电分类方法取得了长足进步, 其中端到端的脑电分类方法能够实现对脑电的自动特征提取和分类, 但在谎言预测中缺乏研究和应用, 同时存在无法在测谎场景下直接应用的问题. 本研究设计基于复合反应范式(Complex trial protocol, CTP)进行自我面孔信息识别任务的实验, 采集了18 名被试的脑电数据. 研究了不同端到端的单试次ERP分类方法在谎言预测中的应用, 同时针对单试次脑电解码方法无法直接实际应用的问题, 提出了一种类自举算法. 算法基于数据分布假设, 通过对比各类刺激图像被视为探针刺激时所训练模型的性能, 来推断真正的探针刺激. 实验结果表明, 在基于自我面孔信息的CTP的谎言预测中, 所提出的类自举法性能优于传统探针预测方法, 在仅使用少量脑电数据情况下, 可实现准确的谎言预测.
基于可解释注意力部件模型的行人重识别方法
周勇, 王瀚正, 赵佳琦, 陈莹, 姚睿, 陈思霖
当前状态:  doi: 10.16383/j.aas.c200493
[摘要](1254) [HTML全文](606) [PDF 2029KB](70)
摘要:
大多数行人重识别方法仅将注意力机制作为提取显著特征的辅助手段, 缺少网络对行人图像关注程度的量化研究. 基于此, 提出一种可解释注意力部件模型(Interpretable attention part model, IAPM). 该模型有3 个优点: 1)利用注意力掩码提取部件特征, 解决部件不对齐问题; 2)为了根据部件的显著性程度生成可解释权重, 设计可解释权重生成模块(Interpretable weight generation module, IWM); 3)提出显著部件三元损失(Salient part triplet loss, SPTL)用于IWM的训练, 提高识别精度和可解释性. 在3 个主流数据集上进行实验, 验证所提出的方法优于现有行人重识别方法. 最后通过一项人群主观测评比较IWM生成可解释权重的相对大小与人类直观判断得分, 证明本方法具有良好的可解释性.
异策略深度强化学习中的经验回放研究综述
胡子剑, 高晓光, 万开方, 张乐天, 汪强龙, Neretin Evgeny
当前状态:  doi: 10.16383/j.aas.c220648
[摘要](351) [HTML全文](273)
摘要:
作为一种不需要事先获得训练数据的机器学习方法, 强化学习(Reinforcement learning, RL)在智能体与环境的不断交互过程中寻找最优策略, 是解决序贯决策问题的一种重要方法. 通过与深度学习(Deep learning, DL)结合, 深度强化学习(Deep reinforcement learning, DRL)同时具备了强大的感知和决策能力, 被广泛应用于多个领域来解决复杂的决策问题. 异策略强化学习通过将交互经验进行存储和回放, 将探索和利用分离开来, 更易寻找到全局最优解. 如何对经验进行合理高效的利用是提升异策略强化学习方法效率的关键. 本文首先对强化学习的基本理论进行了介绍; 随后对同策略和异策略强化学习算法进行了简要介绍; 接着介绍了经验回放(Experience replay, ER)问题的两种主流解决方案, 包括经验利用和经验增广; 最后对相关的研究工作进行了总结和展望.
基于距离信息的追逃策略: 信念状态连续随机博弈
陈灵敏, 冯宇, 李永强
当前状态:  doi: 10.16383/j.aas.c230018
[摘要](179) [HTML全文](52)
摘要:
追逃问题的研究在对抗、追踪以及搜查等领域极具现实意义. 借助连续随机博弈与马尔科夫决策过程, 研究使用测量距离求解多对一追逃问题的最优策略. 在此追逃问题中, 追捕群体仅领导者可测量与逃逸者间的相对距离, 而逃逸者具有全局视野. 追逃策略求解被分为追博弈与马尔科夫决策(Markov decision process, MDP)两个过程. 在求解追捕策略时, 通过分割环境引入信念区域状态以估计逃逸者位置, 同时使用测量距离对信念区域状态进行修正, 构建起基于信念区域状态的连续随机追博弈, 并借助不动点定理证明了博弈平稳纳什均衡策略的存在性. 在求解逃逸策略时, 逃逸者根据全局信息建立混合状态下的马尔科夫决策过程及相应的最优贝尔曼方程. 同时给出了基于强化学习的平稳追逃策略求解算法, 并通过案例验证了该算法的有效性.
PLVO: 基于平面和直线融合的RGB-D视觉里程计
孙沁璇, 苑晶, 张雪波, 高远兮
当前状态:  doi: 10.16383/j.aas.c200878
[摘要](1650) [HTML全文](572)
摘要:
针对利用平面特征计算RGB-D相机位姿时的求解退化问题, 提出平面和直线融合的RGB-D视觉里程计(Plane-line-based RGB-D visual odometry, PLVO). 首先, 提出基于平面−直线混合关联图(Plane-line hybrid association graph, PLHAG)的多特征关联方法, 充分考虑平面和平面、平面和直线之间的几何关系, 对平面和直线两类几何特征进行一体化关联. 然后, 提出基于平面和直线主辅相济、自适应融合的RGB-D相机位姿估计方法. 具体来说, 鉴于平面特征通常比直线特征具有更好的准确性和稳定性, 通过自适应加权的方法, 确保平面特征在位姿计算中的主导作用, 而对平面无法约束的位姿自由度(degree of freedom, DoF), 利用直线特征进行补充, 从而实现两类特征的融合, 解决了单纯使用平面特征求解位姿时的退化问题. 最后, 通过公开数据集上的定量实验以及真实室内环境下的机器人实验, 验证了所提出方法的有效性.
基于时序图推理的设备剩余使用寿命预测
刘雨蒙, 郑旭, 田玲, 王宏安
当前状态:  doi: 10.16383/j.aas.c230014
[摘要](29) [HTML全文](7)
摘要:
剩余使用寿命(Remaining useful life, RUL)预测是大型故障预测与设备健康管理(Prognostics and health management, PHM)的重要环节, 对于降低设备维修成本和避免灾难性故障具有重要意义. 针对RUL预测, 首次提出一种基于多变量分析的时序图推理模型(Multivariate similarity temporal knowledge graph, MSTKG), 通过捕捉设备各部件的运行状态耦合关系及其变化趋势, 挖掘其中蕴含的设备性能退化信息, 为寿命预测提供有效依据. 首先, 设计时序图结构, 形式化表达各部件不同工作周期的关联关系. 其次, 提出联合图卷积神经网络(Convolutional neural network, CNN)和门控循环单元 (Gated recurrent unit, GRU)的深度推理网络, 建模并学习设备各部件工作状态的时空演化过程, 并结合回归分析, 得到剩余使用寿命预测结果. 最后, 与现有预测方法相比, 所提方法能够显式建模并利用设备部件耦合关系的变化信息, 仿真实验结果验证了该方法的优越性.
非匹配不确定MIMO系统的分数阶终端滑模控制
周铭浩, 魏可蒙, 冯勇, 穆朝絮, 苏鸿宇
当前状态:  doi: 10.16383/j.aas.c220875
[摘要](253) [HTML全文](108)
摘要:
针对一类非匹配不确定多输入多输出(Multi-input multi-output, MIMO)系统提出一种分数阶终端滑模控制(Fractional-order terminal sliding-mode, FOTSM)策略, 使系统输出收敛到零而非其邻域. 该方法解除传统反步法控制律设计中, 虚拟控制增益右伪逆矩阵必须存在的严苛限制; 对系统不确定性的假设不局限于慢时变和H2范数有界型扰动, 分析控制增益存在摄动情况下系统的控制问题. 分数阶终端滑模面及其控制律的设计使得虚拟和实际控制信号连续, 削弱抖振现象, 利用自适应滑模切换增益技术解决由控制增益矩阵摄动引起的代数环问题. 最后, 仿真分析验证所提方法的正确性和优越性.
非线性系统自适应最优切换控制方法
毛艳岭, 富月
当前状态:  doi: 10.16383/j.aas.c220180
[摘要](246) [HTML全文](115)
摘要:
针对具有未知动态和M个平衡点的连续时间非线性系统, 将线性自适应最优切换控制器和未建模动态补偿器相结合, 基于嵌入转换技术和近似动态规划思想, 提出一种自适应最优切换控制方法. 首先在非线性系统的M个平衡点建立M个线性化模型, 当模型参数已知时, 提出由线性最优切换控制器、切换准则、未建模动态补偿器以及非线性系统组成的控制系统结构; 当模型参数未知时, 在每个平衡点附近采集输入和状态数据, 利用黎卡提方程的迭代求解公式、最小二乘方法、极小值原理以及二次规划技术得到非线性系统的自适应最优切换控制器和最优切换序列; 最后进行仿真实验, 实验结果验证了所提方法的有效性、优越性和实际可应用性.
基于特征变换和度量网络的小样本学习算法
王多瑞, 杜杨, 董兰芳, 胡卫明, 李兵
当前状态:  doi: 10.16383/j.aas.c210903
[摘要](24) [HTML全文](6)
摘要:
在小样本分类任务中, 每类可供训练的样本非常有限, 同类样本在特征空间中分布稀疏, 异类样本间的边界模糊. 文章提出一种新的基于特征变换的网络, 并使用度量的方法来处理小样本分类任务. 算法通过嵌入函数将样本映射到特征空间并计算输入样本与样本中心的特征残差, 利用特征变换函数学习样本中心与同类样本间的残差, 使样本在特征空间中向同类样本中心靠拢, 更新样本中心在特征空间中的位置使它们之间的距离增大. 融合余弦相似度和欧氏距离构造一个新的度量方法, 设计一个度量函数对特征图中每个局部特征的度量距离进行联合地表达, 该函数在网络优化时可同时对样本特征间的夹角和欧氏距离进行优化. 网络模型在小样本分类任务常用数据集上的表现证明, 该模型性能优秀且具有泛化性.
融合实体和上下文信息的篇章关系抽取研究
黄河燕, 袁长森, 冯冲
当前状态:  doi: 10.16383/j.aas.c220966
[摘要](42) [HTML全文](16)
摘要:
篇章关系抽取是识别篇章中实体对之间的关系. 相较于传统的句子级别关系抽取, 篇章级别关系抽取任务更加贴近实际应用, 但是它对实体对的跨句子推理和上下文信息感知等问题提出了新的挑战. 本文提出融合实体和上下文信息(Fuse entity and context information, FECI)的篇章关系抽取方法, 它包含两个模块, 分别是实体信息抽取模块和上下文信息抽取模块. 实体信息抽取模块从两个实体中自动地抽取出能够表示实体对关系的特征. 上下文信息抽取模块根据实体对的提及位置信息, 从篇章中抽取不同的上下文关系特征. 本文在三个篇章级别的关系抽取数据集上进行实验, 效果得到显著地提升.
基于状态识别的高炉料面视频关键帧提取方法
黄建才, 蒋朝辉, 桂卫华, 潘冬, 许川, 周科
当前状态:  doi: 10.16383/j.aas.c220969
[摘要](43) [HTML全文](9)
摘要:
高炉料面视频关键帧是视频中的中心气流稳定、清晰、无炉料及粉尘遮挡且特征明显的图像序列, 对于及时获取炉内运行状态、指导炉顶布料操作具有重要的意义. 然而, 由于高炉内部恶劣的冶炼环境及布料的周期性和间歇性等特征, 料面视频存在信息冗余、图像质量参差不齐、状态多变等问题, 无法直接用于分析处理. 为了从大量高炉冶炼过程料面视频中自动准确筛选清晰稳定的料面图像, 提出基于状态识别的高炉料面视频关键帧提取方法. 首先, 基于高温工业内窥镜采集高炉冶炼过程中的料面视频, 并清晰完整给出料面反应新现象和形貌变化情况; 然后提取能够表征料面运动状态的显著性区域的特征点密集程度和像素位移特征, 并提出融合局部密度极大值和高斯混合模型(Gaussian mixture model, GMM)模型聚类的方法识别料面状态; 最后, 基于料面状态识别结果提取每个布料周期不同状态下的关键帧. 实验结果表明, 该方法能够准确识别料面状态并剔除料面视频冗余信息, 能提取出不同状态下的料面视频关键帧, 为优化炉顶布料操作提供指导.
基于改进舰尾流模型和多层耦合分析的机载雷达测量建模
葛泉波, 王远亮, 李宏
当前状态:  doi: 10.16383/j.aas.c220815
[摘要](27) [HTML全文](8)
摘要:
为提高复杂海洋环境中无人舰载机(UCA)自动着舰时导航定位的准确性, 研究舰尾流对机载雷达测量过程的动态影响问题, 建立一种基于多层级耦合性分析的测量影响动态建模分析方法. 首先, 利用直接分解法和前向差分法建立一种基于离散化状态空间的时变舰尾流模型, 以克服传统传递函数方法存在的局限性; 其次, 基于舰尾流各分量均与飞机飞行速度相关的客观事实, 通过在时变系统中考虑舰尾流分量间的相互作用关系来构建一种更符合实际系统特征的分量自耦合舰尾流模型; 紧接着, 采用UCA姿态角变化能够改变坐标转换矩阵的思想, 研究舰尾流与UCA位姿变化间的耦合联系, 提出一种准确性更高的舰尾流对UCA位姿的深度影响模型; 然后, 以航母姿态变化对舰载雷达测量结果的影响模型为基础, 通过考虑本研究场景的内在特性, 建立UCA姿态变化对雷达测量结果的影响模型分析方法; 紧接着, 采用示意图方式获得位移变化对机载雷达测量结果的影响模型; 最后, 针对舰船受海洋大气(风、浪、流)干扰而出现失速这一现象, 建立实际海洋环境中舰尾流对机载雷达测量结果的非线性非高斯影响分析模型. 仿真实验研究验证了上述模型分析方法的有效性和优越性.
含有输入时滞的非线性系统的输出反馈采样控制
马倩, 盛兆明, 徐胜元
当前状态:  doi: 10.16383/j.aas.c220774
[摘要](79) [HTML全文](46)
摘要:
针对含有输入时滞和低阶非线性项的非线性系统, 提出了一种基于采样机制的无记忆输出反馈控制方法. 该方法移除了传统预测控制方法预测映射难以确定的限制, 同时避免了时滞依赖方法对过去时刻状态信息的依赖性, 在实际中更易实现. 首先, 根据系统输出在采样时刻的信息, 利用加幂积分技术和齐次占优思想设计了无记忆输出反馈控制器. 然后, 利用齐次系统理论提出了闭环系统的稳定性条件. 最后, 仿真结果验证了所提方法的正确性和优越性.
基于注意力机制和循环域三元损失的域适应目标检测
周洋, 韩冰, 高新波, 杨铮, 陈玮铭
当前状态:  doi: 10.16383/j.aas.c220938
[摘要](78) [HTML全文](24)
摘要:
目前大多数深度学习算法都依赖于大量的标注数据并欠缺一定的泛化能力. 无监督域适应算法能提取到已标注数据和未标注数据间隐式共同特征, 从而提高算法在未标注数据上的性能. 目前域适应目标检测算法主要为两阶段目标检测器设计. 针对单阶段检测器中无法直接进行实例级特征对齐导致一定数量域不变特征的缺失, 提出结合通道注意力机制的图像级域分类器加强域不变特征提取. 此外对于域适应目标检测中存在类别特征的错误对齐引起的精度下降问题, 通过原型学习构建类别中心, 设计了一种基于原型的循环域三元损失函数, 从而实现原型引导的精细类别特征对齐. 以单阶段目标检测算法作为检测器, 在多种域适应目标检测公共数据集上进行实验. 实验结果证明该方法能有效提升原检测器在目标域的泛化能力达到更高的检测精度, 并且对于单阶段目标检测网络具有一定的通用性.
面向复杂工业过程的虚拟样本生成综述
汤健, 崔璨麟, 夏恒, 乔俊飞
当前状态:  doi: 10.16383/j.aas.c221006
[摘要](150) [HTML全文](89)
摘要:
用于复杂工业过程运行指标和异常故障建模的样本具有量少稀缺、分布不均衡以及内涵机理知识匮乏等特性. 虚拟样本生成(Virtual sample generation, VSG)作为扩充建模样本数量及其涵盖空间的技术, 已成为解决上述问题的主要手段之一, 但已有研究还存在缺乏理论支撑、分类准则与应用边界模糊等问题. 本文在描述复杂工业过程难测运行指标和异常故障建模所存在问题的基础上, 梳理虚拟样本定义及其内涵, 给出面向工业过程回归与分类问题的VSG实现流程; 接着, 从样本覆盖区域、实现流程与推广应用等方向进行综述; 然后, 分析讨论VSG的下一步研究方向; 最后, 对全文进行总结并给出未来挑战.
带有双球面摆和变绳长效应的桥式起重机轨迹规划
李刚, 马昕, 李轾, 李贻斌
当前状态:  doi: 10.16383/j.aas.c220988
[摘要](86) [HTML全文](33)
摘要:
带有双球面摆和变绳长效应的桥式起重机具有多输入多输出以及欠驱动的动力学特性, 目前仍缺乏有效的控制策略. 在台车移动、桥架移动、负载升降同步作业过程中, 吊钩和负载两级球面摆动特性更为复杂, 各状态量之间的非线性耦合关系更强, 桥式起重机的防摆控制更具挑战性. 不仅如此, 现有方法无法保证桥式起重机系统全状态量的暂态控制性能. 为解决上述问题, 提出了一种基于多项式的优化轨迹规划方法. 首先, 在未进行近似简化的前提下, 使用拉格朗日方法建立了带有双球面摆和变绳长效应的7自由度桥式起重机的精确动力学模型. 在此基础上, 构造了一组包含各状态量的辅助信号, 将施加在台车、桥架、绳长以及吊钩、负载摆动上的约束转化为对辅助信号的约束, 从而将桥式起重机的轨迹规划问题转化为与辅助信号相关的时间优化问题, 并使用二分法求解. 该轨迹规划方法不仅缩短了吊运时间, 而且确保了全状态量满足约束条件. 最后, 仿真结果证明了动力学模型的准确性和轨迹规划方法的有效性.
基于多示例学习图卷积网络的隐写者检测
钟圣华, 张智
当前状态:  doi: 10.16383/j.aas.c220775
[摘要](61) [HTML全文](19)
摘要:
隐写者检测通过设计模型检测在批量图像中嵌入秘密信息进行隐蔽通信的隐写者, 对解决非法使用隐写术的问题具有重要意义. 本文提出一种基于多示例学习图卷积网络的隐写者检测算法(Steganographer detection algorithm based on multiple-instance learning graph convolutional network, MILGCN), 将隐写者检测形式化为多示例学习(Multiple-instance learning, MIL) 任务. 本文中设计的共性增强图卷积网络(Graph convolutional network, GCN) 和注意力图读出模块能够自适应地突出示例包中正示例的模式特征, 构建有区分度的示例包表征并进行隐写者检测. 实验表明, 本文设计的模型能够对抗多种批量隐写术和与对应的策略.
城市固废焚烧过程智能优化控制研究现状与展望
汤健, 夏恒, 余文, 乔俊飞
当前状态:  doi: 10.16383/j.aas.c220810
[摘要](447) [HTML全文](168)
摘要:
针对全球城市固废(Municipal solid waste, MSW)的高增长率导致城市环境持续恶化以至于“垃圾围城”现象日益增多等问题, MSW焚烧(MSW incineration, MSWI)技术能够通过发酵、燃烧、换热和净化等工艺实现废物变能源. 在当前“双碳战略”和“蓝天净土”的新环保背景下, 作为未来长时期内MSW处理主流方式和生态文明建设与循环经济体系托底工业的MSWI过程正面临着重大机遇. 如何融合人工智能、大数据、云计算等技术实现MSWI的智慧化、低碳化和绿色化可持续性发展是目前具有挑战性的难题. 对此, 本文首先描述MSWI工艺机理, 分析其运行控制特性和实现其智能优化控制存在的难点; 然后, 从燃烧特性分析与建模、燃烧过程控制、指标建模与预测、运行监控与故障识别、操作(控制)变量优化、算法仿真验证平台等6个方面进行综述; 接着, 分析MSWI过程智能优化控制研究的必要性; 最后, 结合工业人工智能的本质给出未来研究方向. 在此基础上, 展望基于数字孪生平台的MSWI智能优化控制系统的框架和愿景, 并总结未来挑战.
基于计算机视觉的工业金属表面缺陷检测综述
伍麟, 郝鸿宇, 宋友
当前状态:  doi: 10.16383/j.aas.c230039
[摘要](375) [HTML全文](414)
摘要:
针对金属平面及三维结构材料的工业表面缺陷检测, 本文概述了视觉检测技术的基本原理和研究现状, 并总结出视觉自动检测系统的关键技术包括光学成像技术、图像预处理技术与缺陷检测器. 本文首先介绍了如何根据检测对象的光学特性选择合适的二维、三维光学成像技术; 其次介绍了图像降噪、特征提取、图像分割和拼接等预处理技术的重要作用; 然后根据缺陷检测器的实现原理将其分为模板匹配、图像分类、图像语义分割、目标检测和图像异常检测五类, 并对其中的经典算法进行了归纳分析. 最后, 本文探讨了工业场景下视觉检测技术实施中的关键问题, 并对该技术的发展趋势进行了展望.
逆强化学习算法、理论与应用研究综述
宋莉, 李大字, 徐昕
当前状态:  doi: 10.16383/j.aas.c230081
[摘要](445) [HTML全文](185)
摘要:
随着深度强化学习的研究与发展, 强化学习在博弈与优化决策、智能驾驶等现实问题中的应用也取得显著进展. 然而强化学习在智能体与环境的交互中存在人工设计奖励函数难的问题, 因此研究者提出了逆强化学习这一研究方向. 如何从专家演示中学习奖励函数和进行策略优化是一个新颖且重要的研究课题, 在人工智能领域具有十分重要的研究意义. 本文综合介绍了逆强化学习算法的最新进展, 首先介绍了逆强化学习在理论方面的新进展, 然后分析了逆强化学习面临的挑战以及未来的发展趋势, 最后讨论了逆强化学习的应用进展和应用前景.
基于相对离群因子的标签噪声过滤方法
侯森寓, 姜高霞, 王文剑
当前状态:  doi: 10.16383/j.aas.c230117
[摘要](49) [HTML全文](19)
摘要:
分类任务中含有类别型标签噪声是传统数据挖掘中的常见问题, 目前还缺少针对性的方法来专门检测类别型标签噪声.离群点检测技术能用于噪声的识别与过滤, 但由于离群点与类别型标签噪声并不具有一致性, 使得离群点检测算法无法精确检测分类数据集中的标签噪声.针对这些问题, 提出一种基于离群点检测技术的、适用于过滤类别型标签噪声的方法——基于相对离群因子的集成过滤方法(Label noise ensemble filtering method based on relative outlier factor, EROF).该方法先通过相对离群因子对样本进行噪声概率估计, 再迭代联合多种离群点检测算法实现集成过滤.实验结果表明, 该方法在大多数含有标签噪声的数据集上都能保持优秀的噪声识别能力, 并显著提升各种分类模型的泛化能力.
考虑执行器非线性的固定时间全局预设性能车辆队列控制
高振宇, 孙振超, 郭戈
当前状态:  doi: 10.16383/j.aas.c230189
[摘要](98) [HTML全文](33)
摘要:
针对含有执行器非线性的车辆队列控制系统, 提出了一种固定时间全局预设性能控制方法. 首先, 设计了一种平滑等效变换, 在同一框架下解决了死区及饱和问题, 同时消除了执行器非线性固有拐点问题. 其次, 构造了两个新型性能函数, 并基于此提出了一种全局预设性能控制算法, 实现了如下目标: 1) 保证了跟踪误差在固定时间内收敛到预定稳态区域; 2) 消除了初始误差必须已知的限制; 3) 减小了误差的超调量. 然后, 基于上述等效变换及预设性能控制算法, 设计了一种固定时间滑模队列容错控制方案, 实现了固定时间单车稳定及队列稳定. 最后, 通过 MATLAB 仿真实验, 验证了所提算法的有效性.
基于网络演算的时间敏感网络时延上界分析模型研究
胡文学, 孙雷, 王健全, 朱渊, 毕紫航
当前状态:  doi: 10.16383/j.aas.c220577
[摘要](91) [HTML全文](32)
摘要:
时间敏感网络(Time-sensitive networking, TSN)作为一种新兴工业通信技术, 能够为工业控制业务提供高可靠及确定性时延保障. 针对时间敏感网络在工业场景中广泛采用的时间感知整形(Time-aware shaper, TAS)机制, 提出了一种基于网络演算的时延上界分析模型, 对多节点组网下端到端时延上界进行定量分析, 用以评估门控 (Gate control list, GCL)设置是否满足业务服务质量(Quality of service, QoS)需求, 有助于简化多节点组网场景下门控设置复杂度. 模型仿真部分对影响端到端时延的主要因素进行了对比分析, 并通过OMNeT++实时仿真验证了所提出时延上界分析模型的有效性.
工业无线网络实时传输调度算法研究综述
裘莹, 张敬宣, 柯杰, 方梦园, 徐伟强
当前状态:  doi: 10.16383/j.aas.c220939
[摘要](130) [HTML全文](89)
摘要:
无线网络是工业物联网中的一种具有良好前景的网络互联技术. 它的应用为工业现场设备的部署提供了极大的便利, 使设备摆脱了线缆的束缚从而在空间上的选点更为灵活, 同时能够节省线材和人力等方面的成本. 然而, 无线通信易受环境噪声的影响, 尤其是在复杂电磁干扰的工业环境中, 易导致无线传输的时延增大和数据丢失. 这些问题对于传输实时性要求较高的工业控制系统而言是非常不利的因素. 为了提高无线网络在工业环境中数据传输的实时性, 业界设计了多种传输调度算法以提高无线通信的实时性和可靠性从而满足工业应用的需求. 综述了工业无线网络传输调度算法的研究现状, 对其发展历程、问题定义、评价指标、分类方法和现有标准等方面进行了全面的总结, 详细阐述了具有代表性的调度算法的工作原理, 并指出了未来的研究方向.
基于RUL和SVs-GFF的云服务器老化预测方法
孟海宁, 童新宇, 谢国, 张贝贝, 黑新宏
当前状态:  doi: 10.16383/j.aas.c211112
[摘要](61) [HTML全文](17)
摘要:
针对云服务器中存在软件老化现象, 将造成系统性能衰退与可靠性下降的问题, 借鉴剩余使用寿命(Remaining useful life, RUL)概念, 提出基于支持向量(Support vectors, SVs)和高斯函数拟合(Gaussian function fitting, GFF)的老化预测方法(SVs-GFF). 首先, 提取云服务器老化数据的统计特征指标, 并采用支持向量回归(Support vector regression, SVR) 对统计特征指标进行数据稀疏化处理, 得到支持向量序列数据; 然后, 建立基于密度聚类的高斯函数拟合模型, 对不同核函数下的支持向量序列数据进行老化曲线拟合, 并采用Fréchet距离优化算法选取最优老化曲线; 最后, 基于最优老化曲线, 评估系统到达老化阈值前的RUL, 以预测系统何时发生老化. 在OpenStack云服务器4个老化数据集上的实验结果表明, 基于RUL和SVs-GFF的云服务器老化预测方法与传统预测方法相比, 具有更高的预测精度和更快的收敛速度.
一类具有复杂执行器动态的双曲线型偏微分方程输出调节
肖宇, 徐晓东
当前状态:  doi: 10.16383/j.aas.c221007
[摘要](67) [HTML全文](36)
摘要:
本文研究了一类具有边界执行器动态特性的双曲线型偏微分方程(Partial differential equation, PDE)系统的输出调节问题. 特别地, 执行器由一组非线性常微分方程(Ordinary differential equation,ODE)描述, 控制输入出现在执行器的一端而非直接作用在PDE系统上, 这使得控制任务变得相当困难. 基于几何设计方法和有限维与无限维反步法, 本文提出了显式表达的输出调节器, 实现了该类系统的扰动补偿及跟踪控制. 并且我们采用Lyapunov稳定性理论严格证明了闭环系统及跟踪误差在范数意义上的指数稳定性. 仿真实例对比验证了所提出控制方法的有效性.
重大装备制造多机器人任务分配与运动规划技术研究综述
张振国, 毛建旭, 谭浩然, 王耀南, 张雪波, 江一鸣
当前状态:  doi: 10.16383/j.aas.c220957
[摘要](402) [HTML全文](279)
摘要:
飞机蒙皮、船舶舱体、高铁车身等大型复杂部件高效高品质制造是航空航天、海洋舰船、轨道交通等领域重大装备发展的根基, 是国家加快培育及发展的战略性新兴产业, 在服务国家的重大需求及维护国防安全中发挥着举足轻重的作用. 大型复杂部件具有尺寸超大、工序繁多、型面复杂等特点, 其制造过程规模大、任务多、精度高, 作业场景复杂. 与此同时, 传统的人工、单机制造面临着效率低、柔性不足、一致性差、空间有限等问题, 难以满足大型复杂部件制造的需求. 多机器人具有高鲁棒性、高效性等优点, 为大型复杂部件制造提供了良好的制造基础. 任务分配与运动规划是多机器人制造系统的决策中枢, 其性能影响整个系统的运行效率. 考虑到重大装备部件制造任务分配与运动规划过程中任务工序多、冲突干涉多、精度需求高等挑战, 本文首先对复杂环境下多机器人任务分配与运动规划的重要性进行了说明; 然后阐述了目前主要的任务分配与运动规划方法, 包括其在智能制造领域复杂环境下的应用; 在此基础上, 对现阶段复杂场景下任务分配和运动规划存在的问题进行了分析, 并使用强化学习与混合优化算法等方法提出了解决思路; 最后对重大装备大型复杂部件制造过程多机器人任务分配和动态规划技术及应用的发展进行了总结与展望.
一元及多元信号分解发展历程与展望
陈启明, 文青松, 郎恂, 谢磊, 苏宏业
当前状态:  doi: 10.16383/j.aas.c220632
[摘要](213) [HTML全文](154)
摘要:
现实世界中所获得的信号大部分都是非平稳和非线性的, 将此类复杂信号分解为多个简单的子信号是重要的信号处理方法. 自1998年Huang提出希尔伯特–黄变换(Hilbert-Huang transform, HHT), 历经20余年的发展, 信号分解已经成为信号处理领域相对独立又具有创新性的重要内容. 特别是近10年来, 多元/多变量/多通道信号分解理论方法方兴未艾, 在诸多领域得到了成功应用. 但目前尚未见到相关综述报道, 因此为了填补这个空缺, 从单变量和多变量两个方面系统综述了国内外学者对主要信号分解方法的研究现状, 对这些方法的时频表达性能进行了分析和比较, 指出了这些分解方法的优势和存在的问题. 最后对信号分解研究进行了总结展望.
基于优先采样模型的离线强化学习
顾扬, 程玉虎, 王雪松
当前状态:  doi: 10.16383/j.aas.c230019
[摘要](176) [HTML全文](79)
摘要:
离线强化学习通过减小分布偏移实现了习得策略向行为策略的逼近, 但离线经验缓存的数据分布往往会直接影响习得策略的质量. 通过优化采样模型来改善强化学习智能体的训练效果, 提出两种离线优先采样模型: 基于时序差分误差的采样模型和基于鞅的采样模型. 基于时序差分误差的采样模型可以使智能体更多地学习值估计不准确的经验数据, 通过估计更准确的值函数来应对可能出现的分布外状态. 基于鞅的采样模型可以使智能体更多地学习对策略优化有利的正样本, 减少负样本对值函数迭代的影响. 进一步, 将所提离线优先采样模型分别与批约束深度Q学习(Batch-constrained deep Q-learning, BCQ)相结合, 提出基于时序差分误差的优先BCQ和基于鞅的优先BCQ. D4RL和Torcs数据集上的实验结果表明: 所提离线优先采样模型可以有针对性地选择有利于值函数估计或策略优化的经验数据, 获得更高的回报.
智能网联电动汽车节能优化控制研究进展与展望
申永鹏, 袁小芳, 赵素娜, 孟步敏, 王耀南
当前状态:  doi: 10.16383/j.aas.c220819
[摘要](263) [HTML全文](105)
摘要:
提升纯电动汽车整车能效、降低百公里耗电量, 是我国新能源汽车产业发展的重大需求. 智能网联背景下, V2X (Vehicle to everything)网联信息以及激光雷达、毫米波雷达、摄像头、定位及导航装置等各类车载传感器, 为智能网联电动汽车(Connected automated electric vehicle, CAEV)提供了全方位的信息交互、共享和状态感知能力, 赋予了其巨大的节能优化潜力. 针对CAEV节能优化控制问题, 首先从动力电池、电机控制器、驱动电机、传动机构、轮胎和驾驶决策六个环节分析了电动汽车的典型损耗特性, 从决策、控制和执行三个层面分析了CAEV的能量转换过程及耦合关系, 以及网联信息对CAEV 的节能影响; 然后, 从决策层车速优化、控制层驱动/制动转矩优化控制和执行层电流矢量优化控制三个方面, 对各层的节能优化问题进行了阐述, 并重点对国内外研究现状进行了归纳分析; 最后, 对决策层、控制层和执行层CAEV节能优化控制的难点以及现有研究工作进行了总结, 并对下一步发展趋势进行了展望.
无人机使能的无线传感网总能耗优化方法
李敏, 包富瑜, 王恒
当前状态:  doi: 10.16383/j.aas.c220914
[摘要](126) [HTML全文](40)
摘要:
为降低无人机(Unmanned aerial vehicle, UAV)使能的无线传感网的能量消耗, 延长网络生命周期, 该文提出一种在地面节点能量预算下系统总能耗优化方法. 首先, 提出地面节点聚类方法, 利用目标函数确定最优簇数, 改进模糊C均值算法构建能量均衡的集群, 采用退避定时器机制根据隶属度和能量值选择各集群的最优簇头, 减少地面节点的能耗. 其次, 根据已选簇头位置, 利用遗传算法规划UAV的飞行轨迹, 减小UAV能耗. 最后, 通过单纯形搜索算法和连续凸逼近算法联合优化簇头发射功率和UAV悬停位置, 减小数据采集时系统的总能耗. 仿真结果表明, 所提方法优于所比较的方案.
基于周期事件驱动的切换系统H跟踪控制
董潇潇, 乔欢
当前状态:  doi: 10.16383/j.aas.c220754
[摘要](125) [HTML全文](43)
摘要:
针对级联非线性切换系统, 提出了基于周期事件驱动机制的H输出跟踪控制策略. 首先, 基于提出的周期事件驱动方案, 设计了积分型控制器, 并将闭环系统转化为时滞切换系统. 其次, 考虑子系统与控制器异步切换的情况, 并给出驻留时间与平均驻留时间满足的关系, 从而得到H输出跟踪控制问题可解的充分条件. 最后, 给出数值仿真验证主要方法的有效性.
基于代价参考粒子滤波器组的多目标检测前跟踪算法
卢锦, 马令坤, 吕春玲, 章为川, SUN Changming
当前状态:  doi: 10.16383/j.aas.c220635
[摘要](219) [HTML全文](61)
摘要:
现有的从图像序列中检测和跟踪低信噪比、时变数量多目标的方法, 将多目标视为一个整体. 因此, 随着目标数量的增加, 会出现算法结构复杂、计算量增大、性能下降等问题. 针对上述问题, 提出一种基于代价参考粒子滤波器组的多目标检测前跟踪(Cost-reference particle filter bank based multi-target track-before-detect, CRFB-MTBD)算法, 将多目标跟踪问题转换为序贯地检测和估计多个单目标的问题. 首先, 采用代价参考粒子滤波器(Cost-reference particle filter, CRPFB)组序贯地估计所有可能单目标状态序列; 其次, 基于欧氏距离合并或删减多个单目标状态, 确定目标数量; 最后, 根据累积代价判断每个目标出现和消失的具体时刻. 仿真实验验证了CRPFB-MTBD在信噪比低至6dB时的优良性能, 与基于传统粒子滤波的多目标检测前跟踪算法(Particle filter based multi-target track-beofre-detect, PF-MTBD)、基于概率假设密度的检测前跟踪算法(Probability hypothesis density based track-before-detect, PHD-TBD)和基于伯努利滤波的检测前跟踪算法(Bernoulli based track-before-detect, Bernoulli-TBD)相比, CRPFB-MTBD的目标状态和数量估计结果最佳, 且平均单次运行时间极短.
隐蔽攻击下信息物理系统的安全输出反馈控制
张淇瑞, 孟思琪, 王兰豪, 刘坤, 代伟
当前状态:  doi: 10.16383/j.aas.c220893
[摘要](295) [HTML全文](205)
摘要:
研究了受到隐蔽攻击的信息物理系统的安全控制问题. 采用Kullback-Leibler(KL)散度描述攻击的隐蔽性, 并设计动态输出反馈控制器使得系统可达集始终保持在安全区域内, 其中可达集定义为系统状态以一定概率属于的集合. 首先, 给出了隐蔽攻击下检测器残差所在范围的一个外椭球近似集. 其次, 根据该近似集和噪声的范围给出了控制器参数与系统椭球形不变可达集的关系. 然后, 通过设计可逆线性变换并构造凸优化问题, 求解安全动态输出控制器参数和相应的不变可达集. 最后, 使用弹簧-质量-阻尼系统进行仿真, 验证了所提控制方法的有效性.
PID控制器参数的优化整定方法
刘宁, 柴天佑
当前状态:  doi: 10.16383/j.aas.c220795
[摘要](563) [HTML全文](266)
摘要:
针对存在临界点的A类被控对象及不存在临界点的B类被控对象, 分别采用其\begin{document}$-180^\circ$\end{document}\begin{document}$-120^\circ$\end{document}相位点的频率和增益提出了PID (Proportional-integral-derivative) 控制器参数的优化整定方法. 基于Tchebyshev多项式和分数阶积分器求取被控对象\begin{document}$-180^\circ$\end{document}\begin{document}$-120^\circ$\end{document}相位点的频率和增益, 建立其积分滞后模型. 采用负载扰动下跟踪误差平方和(Sum of squared error, SSE)最小作为优化指标, 使闭环系统具有强的鲁棒性的最大灵敏度和最大补灵敏度为约束方程, 针对两类被控对象, 分别建立了基于\begin{document}$-180^\circ$\end{document}\begin{document}$-120^\circ$\end{document}相位点频率和增益的PID控制器比例、积分与微分三个参数的优化整定规则. 通过与其他常用PID控制方法的仿真与物理对比实验, 表明所提方法的优越性.
中值互补集合经验模态分解
刘淞华, 何冰冰, 郎恂, 陈启明, 张榆锋, 苏宏业
当前状态:  doi: 10.16383/j.aas.c201031
[摘要](1163) [HTML全文](434)
摘要:
针对经验模态分解(Empirical mode decomposition, EMD)系列方法存在的模态分裂(Mode splitting, MS)问题, 提出中值互补集合经验模态分解(Median complementary ensemble EMD, MCEEMD)算法. 通过概率模型量化互补集合经验模态分解(Complementary ensemble EMD, CEEMD)的MS问题, 证明了使用中值算子替代算术平均算子对抑制MS的有效性. MCEEMD算法首先添加N对互补的白噪声至原信号中, 并经过EMD分解得到2N组固有模态函数(Intrinsic mode functions, IMFs), 然后分别对其中互补相关的IMFs两两取平均得到N组IMFs, 最后使用中值算子处理上述N组IMFs得到输出结果. 对仿真信号与实测信号的分析结果表明, 本文提出的MCEEMD方法不仅有效抑制了CEEMD的MS问题, 而且避免了单一使用中值算子的两个缺点分解完备性差和IMFs中存在毛刺现象.
基于自适应全局定位算法的带钢表面缺陷检测
王延舒, 余建波
当前状态:  doi: 10.16383/j.aas.c210467
[摘要](268) [HTML全文](100)
摘要:
针对热轧带钢表面缺陷检测存在的智能化水平低、检测精度低和检测速度慢等问题, 本文提出了一种基于自适应全局定位网络(Adaptive global localization network, AGLNet)的深度学习缺陷检测算法. 首先, 引入了一种残差网络(Residual network, ResNet)与特征金字塔网络(Feature pyramid network, FPN)集成的特征提取结构, 减少缺陷语义信息在层级传递间的消失; 其次, 提出基于Tree-structure parzen estimation的自适应树型候选框提取网络(Adaptive tree-structure region proposal network, AT-RPN), 无需先验知识的测试积累, 避免了人为调参的训练模; 最后, 引入了全局定位算法(Global localization regression)算法以全局定位的模式在复杂的缺陷检测中实现缺陷更精确定位.本文实现一种快速、准确、更智能化、更适用于实际工业应用的热轧带钢表面缺陷的算法.实验结果表明, AGLNet在NEU-DET热轧带钢表面缺陷数据集上的检测速度保持在11.8fps, 平均精度达到了79.90 %, 优于目前其他深度学习带钢表面缺陷检测算法; 另外该算法还具备较强的泛化能力.
一种面向航空母舰甲板运动状态预估的鲁棒学习模型
王可, 徐明亮, 李亚飞, 姜晓恒, 鲁爱国, 李鉴
当前状态:  doi: 10.16383/j.aas.c210664
[摘要](689) [HTML全文](133)
摘要:
航母甲板在风、浪、流等因素影响下做六自由度不规则运动, 影响舰载机着舰精度. 航母甲板运动预估与补偿是自动着舰系统的重要功能之一, 也是提高舰载机着舰安全性与成功率的关键技术之一. 本文提出一种面向甲板运动预估的鲁棒学习模型, 通过基本构建单元自适应演化出复杂学习系统. 构建单元的训练采用非梯度的伪逆学习策略, 提高了训练效率, 简化了学习控制超参数调优;构建单元的架构设计采用数据驱动的策略, 简化了架构超参数调优;采用图拉普拉斯正则化方法提高了模型的鲁棒性. 通过某型航母在中等海况条件下以典型航速巡航时的仿真实验, 验证了所提方法在甲板纵摇、横摇以及垂荡运动预估问题中的有效性及鲁棒性.
基于ACP理论的微型扑翼飞行器的姿态控制
金龙, 李嘉昌, 常振强, 卢经纬, 程龙
当前状态:  doi: 10.16383/j.aas.c210646
[摘要](927) [HTML全文](367)
摘要:
微型扑翼飞行器(Flapping wing micro aerial vehicle, FWMAV)因飞行效率高、质量轻、耗能低、机动性强等显著优点, 在飞行器研究和应用中占据重要地位. 目前, FWMAV姿态控制成为飞行器控制研究领域的研究热点. 针对FWMAV姿态控制问题, 基于平行智能理论框架提出了一种FWMAV抗扰动姿态控制器. 通过建立人工系统(Artificial systems, A)、计算实验(Computational experiments, C)、平行执行(Parallel execution, P)三个过程, 得到一个能够有效解决FWMAV姿态控制过程中扰动问题的控制器, 并通过理论分析和数值仿真证明了该控制器的有效性.
基于加权锚点的多视图聚类算法
刘溯源, 王思为, 唐厂, 周思航, 王思齐, 刘新旺
当前状态:  doi: 10.16383/j.aas.c220531
[摘要](420) [HTML全文](86)
摘要:
大规模多视图聚类旨在解决传统多视图聚类算法中计算速度慢、空间复杂度高以致无法扩展到大规模数据的问题.其中, 基于锚点的多视图聚类方法通过使用整体数据集合的锚点集构建后者对于前者的重构矩阵, 利用重构矩阵进行聚类, 有效地降低了算法的时间和空间复杂度.然而, 现有的方法忽视了锚点之间的差异, 均等地看待所有锚点, 导致聚类结果受到低质量锚点的限制.为了定位更具有判别性的锚点, 加强高质量锚点对聚类的影响, 提出了一种基于加权锚点的大规模多视图聚类算法(Multi-view Clustering With Weighted Anchors, MVC-WA).通过引入自适应锚点加权机制, 所提方法在统一框架下确定锚点的权重, 进行锚图的构建.同时, 为了增加锚点的多样性, 根据锚点之间的相似度进一步调整锚点的权重.在9个基准数据集上与现有最先进的大规模多视图聚类算法的对比实验结果验证了所提方法的高效性与有效性.
基于时滞测量的复杂网络分布式状态估计研究
滕达, 徐雍, 鲍鸿, 王卓, 鲁仁全
当前状态:  doi: 10.16383/j.aas.c210921
[摘要](255) [HTML全文](58)
摘要:
研究了一类存在一步随机时滞的复杂网络分布式状态估计问题, 采用伯努利随机变量刻画测量值的随机时滞情况. 基于复杂网络模型和不可靠测量值, 分别设计了复杂网络的状态预测器和分布式状态估计器, 基于杨氏不等式消除了节点之间的耦合项, 通过优化杨氏不等式引进的参数, 优化了状态预测协方差. 通过设计估计器增益, 获得了状态估计误差协方差, 同时结合预测误差协方差, 获得了状态估计误差协方差的迭代公式, 并给出了估计误差协方差稳定的充分条件. 最后, 对由小车组成的耦合系统进行数值仿真, 验证了所设计估计器的有效性.
基于自适应动态规划的移动机器人视觉伺服跟踪控制
罗彪, 欧阳志华, 易昕宁, 刘德荣
当前状态:  doi: 10.16383/j.aas.c211230
[摘要](464) [HTML全文](157)
摘要:
针对移动机器人视觉伺服跟踪控制问题, 提出了一种基于自适应动态规划(Adaptive dynamic programming, ADP) 的控制方法. 通过移动机器人上的相机拍摄共面特征点的当前图像、期望图像以及参考图像, 利用单应性技术得到移动机器人当前的位姿信息与期望的位姿信息(即平移量与旋转角度), 从而通过当前与期望的平移旋转之间差值得到系统的开环误差模型. 进而, 针对此系统设计最优控制器, 同时做合适的控制输入变换. 在此基础上设计一个基于ADP的视觉伺服控制方法以保证移动机器人完成轨迹跟踪任务. 为求出最优控制输入, 采用一个评价神经网络近似值函数, 通过不断学习逼近哈密顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman, HJB)方程的解. 与以往不同的是, 由于系统存在时变项, 导致HJB方程也含有时变项, 因此需要设计具有时变权值结构的神经网络近似值函数. 最终证明在所设计的控制方法作用下, 闭环系统是一致最终有界的.
自适应特征融合的多模态实体对齐研究
郭浩, 李欣奕, 唐九阳, 郭延明, 赵翔
当前状态:  doi: 10.16383/j.aas.c210518
[摘要](771) [HTML全文](413)
摘要:
多模态数据间交互式任务的涌现对综合利用不同模态的知识提出了高要求, 多模态知识图谱应运而生, 其通过融合不同模态的知识来满足这类任务的需求. 然而, 现有多模态知识图谱存在图谱知识不完整的问题, 严重阻碍对信息的有效利用. 缓解此问题关键是通过实体对齐方法对图谱进行补全. 当前多模态实体对齐方法以固定权重融合多种模态信息, 在融合过程中忽略了不同模态信息贡献的差异性. 为解决上述问题, 本文设计一套自适应特征融合机制, 根据不同模态数据质量动态融合实体结构信息和视觉信息. 此外, 考虑到视觉信息质量不高、知识图谱之间的结构差异也影响实体对齐的效果, 本文分别设计提升视觉信息有效利用率的视觉特征处理模块以及缓和结构差异性的三元组筛选模块. 在多模态实体对齐任务上的实验结果表明, 本文提出的多模态实体对齐方法的性能优于当前最好的方法.
基于多层注意力和消息传递网络的药物相互作用预测方法
饶晓洁, 张通, 孟献兵, 陈俊龙
当前状态:  doi: 10.16383/j.aas.c220371
[摘要](442) [HTML全文](158)
摘要:
药物相互作用(Drug-drug interaction, DDI)是指不同药物存在抑制或促进等作用. 现有DDI预测方法往往直接利用药物分子特征表示预测DDI, 而忽略药物分子中不同原子对DDI的影响. 为此, 提出基于多层次注意力机制和消息传递神经网络的DDI预测方法. 该方法将DDI建模为通过学习基于序列表示的药物分子特征实现DDI预测的链接预测问题. 首先, 建立基于注意力机制和消息传递神经网络的原子特征网络, 结合提出的基于分子质心的位置编码, 学习不同原子及其相关联化学键的特征, 构建基于图结构的药物分子特征表示; 然后, 设计基于注意力机制的分子特征网络, 并通过监督和对比损失学习, 实现DDI预测; 最后, 通过实验证明该方法的有效性和优越性.
一种基于随机权神经网络的类增量学习与记忆融合方法
李德鹏, 曾志刚
当前状态:  doi: 10.16383/j.aas.c220312
[摘要](257) [HTML全文](153)
摘要:
连续学习多个任务的能力对于通用人工智能的发展至关重要. 现有人工神经网络在单一任务上具有出色表现, 但在开放环境中依次面对不同任务时非常容易发生灾难性遗忘现象, 即联结主义模型在学习新任务时会迅速地忘记旧任务. 为了解决这个问题, 本文将随机权神经网络与生物大脑的相关工作机制联系起来, 提出了一种新的再可塑性启发的随机化网络(Metaplasticity-inspired randomized network, MRNet)用于类增量学习场景, 使得单一模型在不访问旧任务数据的情况下能够从未知的任务序列中学习与记忆融合. 首先, 以前馈方式构造了具有解析解的通用连续学习框架, 用于有效兼容新任务中出现的新类别; 然后, 基于突触可塑性设计了具备记忆功能的权值重要性矩阵, 自适应地调整网络参数以避免发生遗忘; 最后, 所提方法的有效性和高效性通过5个评价指标, 5个基准任务序列和10个比较方法在类增量学习场景中得到验证.
基于有向图的分布式连续时间非光滑耦合约束凸优化分析
刘奕葶, 马铭莙, 付俊
当前状态:  doi: 10.16383/j.aas.c210808
[摘要](194) [HTML全文](48)
摘要:
本文研究了一类分布式优化问题, 其目标是在满足耦合不等式约束和局部可行集约束的情况下使非光滑全局代价函数值最小. 首先, 对原有的分布式连续时间投影算法进行拓展, 结合线性代数理论分析, 我们设计一个适用于强连通加权平衡有向通信网络拓扑图的算法. 其次, 在局部代价函数和耦合不等式约束函数是非光滑凸函数的假设条件下, 利用Moreau-Yosida函数正则化使目标函数和约束函数近似光滑可微. 然后, 根据强连通加权平衡有向图的分布式连续时间投影算法构造李雅普诺夫函数, 证明该算法下的平衡解是分布式优化问题最优解, 并对算法进行收敛性分析. 最后, 通过数值仿真验证了算法的有效性.
基于SCN数据模型的SISO非线性自适应控制
代伟, 张政煊, 杨春雨, 马小平
当前状态:  doi: 10.16383/j.aas.c210174
[摘要](211) [HTML全文](68)
摘要:
针对一类难以建立精确模型的单输入单输出(Single-input single-output, SISO) 非线性离散动态系统, 提出了一种数据驱动模型的自适应控制方法. 所提方法首先设计具有直链与增强结构的随机配置网络(Stochastic configuration network, SCN), 建立了一种可同时表征非线性系统低阶线性部分与高阶非线性项(未建模动态)的数据驱动模型, 并采用增量学习方法与监督机制, 对模型结构与模型参数进行同步更新优化, 保证了数据驱动模型的无限逼近能力, 解决了传统自适应控制采用交替辨识算法存在的建模精度低、模型收敛性无法保证的问题. 进而利用直链部分与增强部分, 分别设计了线性控制器及虚拟未建模动态补偿器, 建立了基于SCN 数据驱动模型的自适应控制新方法, 分析了其稳定性与收敛性, 通过数值仿真实验和采用交替辨识算法的传统自适应控制方法进行对比, 实验结果表明所提方法的有效性.
基于最大最小策略的纵向联邦学习隐私保护方法
李荣昌, 刘涛, 郑海斌, 陈晋音, 刘振广, 纪守领
当前状态:  doi: 10.16383/j.aas.c211233
[摘要](339) [HTML全文](77)
摘要:
纵向联邦学习是一种新兴的分布式机器学习技术, 在保障隐私性的前提下利用分散在各个机构的数据实现机器学习模型的联合训练. 纵向联邦学习被广泛应用于工业互联网金融借贷和医疗诊断等众多领域中, 因此保证其隐私安全性具有重要意义. 本文首先针对纵向联邦学习协议中由于参与方交换的嵌入表示造成的隐私泄露风险, 研究由协作者发起的通用的属性推断攻击. 攻击者利用辅助数据和嵌入表示训练一个攻击模型, 然后利用训练完成的攻击模型窃取参与方的隐私属性. 实验结果表明: 纵向联邦学习在训练、推理阶段产生的嵌入表示容易泄露数据隐私. 为了应对上述隐私泄露风险, 进一步提出一种基于最大最小策略的纵向联邦学习隐私保护方法, 其引入梯度正则组件保证训练过程主任务的预测性能, 同时引入重构组件掩藏参与方嵌入表示中包含的隐私属性信息. 最后, 在钢板缺陷诊断工业场景的实验结果表明: 相比于没有任何防御方法的VFL, 隐私保护方法将攻击推断准确度从95%降到55%以下, 接近于随机猜测的水平, 同时主任务预测准确率仅下降2%.
面向全量测点耦合结构分析与估计的工业过程监测方法
赵健程, 赵春晖
当前状态:  doi: 10.16383/j.aas.c220090
[摘要](404) [HTML全文](151)
摘要:
实际工业场景中, 需要在生产过程中收集大量测点的数据, 从而掌握生产过程运行状态. 传统的过程监测方法通常仅评估运行状态整体的异常与否, 或对运行状态进行分级评估, 这种方式并不会直接定位故障部位, 不利于故障的高效检修. 为此, 提出了一种基于全量测点估计的监测模型, 根据全量测点估计值与实际值的偏差定义监测指标, 从而实现全量测点的分别精准监测. 为了克服原有的基于工况估计的监测方法监测不全面且对测点间耦合关系建模不充分的问题, 提出了多核图卷积网络(Multi-kernel graph convolution network, MKGCN), 通过将全量传感器测点视为一张全量测点图, 显式地对测点间耦合关系进行建模, 从而实现了全量传感器测点的同步工况估计. 此外, 面向在线监测场景, 设计了基于特征逼近的自迭代方法, 从而克服了在异常情况下由于测点间强耦合导致的部分测点估计值异常的问题. 所提出的方法在电厂百万千瓦超超临界机组中引风机的实际数据上进行了验证, 结果显示, 提出的监测方法与其他典型方法相比能够更精准地检测出发生故障的测点.
基于AMOWOA算法的区域综合能源系统运行优化调度
韩永明, 王新鲁, 耿志强, 朱群雄, 毕帅, 张红斌
当前状态:  doi: 10.16383/j.aas.c211146
[摘要](253) [HTML全文](60)
摘要:
如今智能优化算法已广泛应用于工程优化中,在当前多能耦合与互补的能源发展趋势下,以仅考虑系统经济指标的单目标优化模式已经不再适用于目前区域综合能源系统的运行优化调度,需要研究一种多目标运行策略来解决区域综合能源系统的运行优化调度问题.首先综合考虑经济与能源利用两个指标并结合商业住宅区域的特性,以系统日运行收益和一次能源利用率为优化目标构建了商业住宅区域综合能源系统多目标运行优化调度模型.其次由于传统多目标智能优化算法缺乏一种最优解综合评价方法,基于非支配排序以及拥挤度计算的多目标算法框架,提出了一种利用模糊一致矩阵选取全局最优解的多目标鲸鱼优化算法(AMOWOA),并将提出算法对商住区域综合能源系统多目标运行优化调度模型进行求解.最后以华东某商业住宅区域综合能源系统为例进行仿真,验证了该方法的有效性和可行性.
基于事件触发机制的多自主水下航行器协同路径跟踪控制
王浩亮, 柴亚星, 王丹, 刘陆, 王安青, 彭周华
当前状态:  doi: 10.16383/j.aas.c211163
[摘要](394) [HTML全文](256)
摘要:
针对考虑外部海洋环境扰动和内部模型不确定性的多个欠驱动自主水下航行器, 研究了其在通信资源受限和机载能量受限下的协同路径跟踪控制问题. 首先, 针对水声通信信道窄造成的通信资源受限问题, 设计了一种基于事件触发机制的协同通信策略; 其次, 针对模型不确定性和海洋环境扰动问题, 设计了一种基于事件触发机制的线性扩张状态观测器来逼近水下航行器的未知动力学, 并降低了系统采样次数; 最后, 针对机载能量受限问题, 设计了一种基于事件触发机制的动力学控制律, 在保证控制精度的前提下降低了执行机构的动作频次, 从而节省了能量消耗. 应用级联系统稳定性分析方法, 分别证明了闭环系统是输入状态稳定的, 且系统不存在Zeno行为. 仿真结果验证了所提基于事件触发机制的多自主水下航行器协同路径跟踪控制方法的有效性.
基于多目标PSO混合优化的虚拟样本生成
王丹丹, 汤健, 夏恒, 乔俊飞
当前状态:  doi: 10.16383/j.aas.c211091
[摘要](250) [HTML全文](59)
摘要:
产品质量与污染排放浓度等难测参数的实时检测是实现复杂工业过程优化控制的关键因素之一. 受限于检测技术难度、高时间与经济成本等原因, 难测参数的软测量模型建模样本存在数量少、分布稀疏与不平衡等问题, 严重制约了数据驱动模型的泛化性能. 针对以上问题, 提出一种基于多目标粒子群优化混合优化的虚拟样本生成方法, 首先, 设计综合学习粒子群优化算法的种群表征机制, 使其能够同时编码用于映射模型超参数优化的连续变量和用于虚拟样本选择的离散变量; 然后, 定义具有多阶段多目标特性的综合学习粒子群优化算法适应度函数, 使其能够在确保模型泛化性能的同时最小化虚拟样本数量; 最后, 向虚拟样本生成多目标混合优化任务对综合学习粒子群优化算法进行改进, 使其能够适应虚拟样本优选过程的变维特性并提高优化过程的收敛速度. 同时, 首次借鉴度量学习的指标提出用于评价虚拟样本质量的综合评价指标和分布相似指标. 本文采用混凝土抗压强度和超导临界温度基准数据集验证了所提算法的合理性及有效性, 基于工业数据集构建了面向城市固废焚烧过程的二噁英排放浓度的软测量模型, 进一步验证了所提方法.
基于单应性扩散约束的二步网格优化视差图像对齐
陈殷齐, 郑慧诚, 严志伟, 林峻宇
当前状态:  doi: 10.16383/j.aas.c210966
[摘要](156) [HTML全文](66)
摘要:
目前, 在带有视差场景的图像对齐中, 主要难点在某些无法找到足够匹配特征的区域, 这些区域称为匹配特征缺失区域. 现有算法往往忽略匹配特征缺失区域的对齐建模, 而只将有足够匹配特征区域中的部分单应变换系数(如相似性变换系数)传递给匹配特征缺失区域, 或者采用将匹配特征缺失区域转化为有足够匹配特征区域的间接方式, 因此对齐效果仍不理想. 在客观事实上, 位于相同平面的区域应该拥有相同的完整单应变换而非部分变换参数. 由此出发, 利用单应变换系数扩散的思想设计了一个二步网格优化的图像对齐算法. 该方法在第一步网格优化时获得有足够匹配特征区域的单应变换, 再基于提出的单应性扩散约束将这些单应变换系数扩散到邻域网格, 进行第二步网格优化, 在保证优化任务简洁高效的前提下实现单应变换系数的传播与图像对齐. 相较于现有的针对视差场景图像对齐算法, 所提方法在各项指标上都获得了更好的效果.
基于组-信息蒸馏残差网络的轻量级图像超分辨率重建
王云涛, 赵蔺, 刘李漫, 陶文兵
当前状态:  doi: 10.16383/j.aas.c211089
[摘要](353) [HTML全文](352)
摘要:
目前, 基于深度学习的超分辨算法已经取得了很好的性能. 但是这些方法通常具有较大的内存消耗和较高的计算复杂度, 很难应用到低算力或便携式设备上. 为了解决这一问题, 设计了一种轻量级的组-信息蒸馏残差网络用于快速且精确的单图像超分辨率. 具体来说, 提出一个更加有效的组-信息蒸馏模块, 作为网络特征提取基本块. 同时, 引入密集快捷连接对多个基本块进行组合, 构建组-信息蒸馏残差组, 捕获多层级信息和有效重利用特征. 另外, 还提出一个轻量的非对称残差Non-local模块对长距离依赖关系进行建模, 进一步提升超分的性能. 最后, 设计一个高频损失函数去解决像素损失带来图片细节平滑的问题. 大量的实验证明了该算法相较于其他先进方法, 可以在图像超分辨率性能和模型复杂度之间取得更好的平衡, 其在公开测试数据集B100上4倍超分速率达到56FPS, 比残差注意力网络快15倍.
考虑电网线路传输安全的分布式电力市场交易模式研究
李远征, 张虎, 刘江平, 赵勇, 连义成
当前状态:  doi: 10.16383/j.aas.c211244
[摘要](206) [HTML全文](55)
摘要:
分布式电力市场交易模式可以有效缓解传统集中模式下市场主体的隐私安全等问题, 但难以在保障市场主体收益和电力系统安全稳定运行的同时实现社会福利最大化. 因此, 考虑电网线路传输约束, 首先以社会福利最大化为目标构建了集中式交易模型, 并采用拉格朗日乘子法和对偶理论将其等价分解为各市场主体自身利益最大化的分布式交易模型. 在此基础上, 设计了两种适用于不同场景的分布式交易方法, 并构造电网安全成本影响市场主体的决策, 从而保证电网线路传输安全. 最后, 基于算例分析验证了两种方法的有效性.
n比特随机量子系统实时状态估计及其反馈控制
张骄阳, 丛爽, 匡森
当前状态:  doi: 10.16383/j.aas.c210916
[摘要](241) [HTML全文](50)
摘要:
对于连续弱测量过程存在高斯噪声的情况, 基于在线交替方向乘子法推导出一种适用于n比特随机量子系统实时状态估计的算法QSE-OADM; 运用李雅普诺夫方法设计控制律, 实现基于实时量子状态估计的反馈控制, 并证明所提控制律的收敛性. 以2比特随机量子系统为例进行数值仿真实验, 通过与基于QST-OADM算法和OPG-ADMM算法的实时量子状态估计及其反馈控制方案的性能对比, 显示出所提控制方案的优越性.
数字孪生驱动的长距离带式输送机运行优化方法
杨春雨, 卜令超, 陈斌
当前状态:  doi: 10.16383/j.aas.c210979
[摘要](383) [HTML全文](112)
摘要:
长距离带式输送机是矿山、港口等领域运输散装物料的主要工具. 针对长距离带式输送机的安全节能运行问题, 本文研究数字孪生驱动的运行优化方法. 首先, 构建由数字孪生模型、模型同步算法、控制策略和现实带式输送机组成的数字孪生驱动运行优化框架; 然后, 建立数字孪生模型, 包括基于变质量牛顿第二定律和有限元分析法的输送带动力学模型、物料流动态模型和动态能耗模型; 最后, 提出数字孪生驱动的计算决策−仿真评估−优化校正优化决策方法, 优化带式输送机的稳态和暂态运行带速, 形成可行带速设定曲线. 实验表明, 数字孪生驱动的带式输送机运行优化方法可以实现带式输送机安全节能运行. 与传统控制方法相比, 能够根据运行工况实时调速, 提高输送带填充率, 节能13.87%.
面向非独立同分布数据的自适应联邦深度学习算法
张泽辉, 李庆丹, 富瑶, 何宁昕, 高铁杠
当前状态:  doi: 10.16383/j.aas.c201018
[摘要](2188) [HTML全文](1457)
摘要:
近些年, 联邦学习由于能够打破数据壁垒, 实现孤岛数据价值变现, 受到了工业界和学术界的广泛关注. 然而, 在实际工程应用中, 联邦学习存在着数据隐私泄露和模型性能损失的问题. 对此, 首先对这两个问题进行了数学描述与分析. 然后, 提出了一种自适应模型聚合方案, 该方案能够设定各参与者的mini-batch值和自适应调整全局模型聚合间隔, 旨在保证模型精度的同时, 提高联邦学习训练效率. 并且, 混沌系统被首次引入联邦学习领域中, 用于构建一种基于混沌系统和同态加密的混合隐私保护方案, 从而进一步提升系统的隐私保护水平. 理论分析与实验结果表明, 提出的联邦学习算法能够保证参与者的数据隐私安全. 并且, 在非独立同分布数据的场景下, 该算法够在保证模型精度的前提下提高训练效率, 降低系统通信成本, 具备实际工业场景应用的可行性.
多层异构生物网络候选疾病基因识别
丁苍峰, 王君, 张紫芸
当前状态:  doi: 10.16383/j.aas.c210577
[摘要](285) [HTML全文](148)
摘要:
现有大多数用于识别候选疾病基因的随机游走方法通常优先访问高度连接的基因, 而可能与已知疾病有关的不知名或连接性差的基因易被忽略或难以识别. 此外, 这些方法仅访问单个基因网络或各种基因数据的聚合网络, 导致偏差和不完整性. 因此, 设计一种能控制随机游走运动方向和整合多种数据源的候选疾病基因识别方法将是一个迫切需要解决的问题. 为此, 本文首先构建多层网络和多层异构基因网络. 然后, 提出了一种游走于多层和多层异构网络的拓扑偏置随机游走(Biased random walk with restart, BRWR)算法来识别疾病基因. 实验结果表明, 游走于不同类型网络上的识别候选疾病基因的BRWR算法优于现有的算法. 最后, 应用于多层异构网络上的BRWR算法能预测未诊断的新生儿类早衰综合征中涉及的疾病基因.
不确定性环境下维纳模型的随机变分贝叶斯学习
刘切, 李俊豪, 王浩, 曾建学, 柴毅
当前状态:  doi: 10.16383/j.aas.c210925
[摘要](335) [HTML全文](107)
摘要:
多重不确定性环境下的非线性系统辨识是一个开放问题.贝叶斯学习在描述、处理不确定性方面具有显著优势, 已在线性系统辨识方面得到广泛应用, 但在非线性系统辨识的应用较少, 面临概率估计复杂、计算量大等困难.本文针对上述问题, 以典型维纳非线性过程为对象, 提出基于随机变分贝叶斯的非线性系统辨识方法.首先对过程噪声、测量噪声以及参数不确定性进行概率描述;然后利用随机变分贝叶斯方法对模型参数进行后验估计.在估计过程中, 利用随机优化思想, 仅利用部分中间变量概率信息估计模型参数分布的自然梯度期望, 与利用所有中间变量概率信息估计模型参数比较, 显著降低了计算复杂性.该方法是首次在系统辨识领域中的应用.本文利用一个仿真实例和一个维纳模型的Benchmark问题, 证明了该方法在对大规模数据系统辨识时的有效性.
城市固废焚烧过程烟气含氧量自适应预测控制
孙剑, 蒙西, 乔俊飞
当前状态:  doi: 10.16383/j.aas.c210935
[摘要](409) [HTML全文](206)
摘要:
在城市固废焚烧过程中, 烟气含氧量是影响焚烧效果的重要工艺参数. 由于固废焚烧过程的复杂性, 实际应用过程中难以实现烟气含氧量的有效控制. 面向城市固废焚烧过程烟气含氧量控制的实际需求, 文中提出了一种基于数据驱动的烟气含氧量自适应预测控制方法. 首先, 采用自适应模糊C均值 (Fuzzy C-means, FCM) 算法辅助确定径向基函数 (Radial basis function, RBF) 神经网络隐含层神经元个数及初始中心, 建立基于FCM算法的RBF神经网络预测模型, 并在控制过程中通过自适应更新策略在线调节预测模型参数; 然后, 利用梯度下降算法求解控制律, 并基于李亚普诺夫理论分析了所提控制方法的稳定性; 最后, 基于城市固废焚烧厂实际数据, 验证了所提控制方法的有效性.
一种基于条件梯度的加速分布式在线学习算法
吴庆涛, 朱军龙, 葛泉波, 张明川
当前状态:  doi: 10.16383/j.aas.c210830
[摘要](252) [HTML全文](55)
摘要:
由于容易实施, 基于投影梯度的分布式在线优化模型逐渐成为一种主流的在线学习方法. 然而, 在处理大数据应用时, 投影步骤成为了该方法的计算瓶颈. 近年来, 研究者提出了面向凸代价函数的分布式在线条件梯度算法, 其悔界为\begin{document}${\rm O}(T^{3/4})$\end{document}, 其中\begin{document}$T$\end{document}是一个时间范围. 该算法存在两方面的问题, 一是其悔界劣于公认的悔界\begin{document}${\rm O}(\sqrt{T})$\end{document}; 二是没有分析非凸代价函数的收敛性能, 而实际应用中代价函数大部分是非凸函数. 因此, 本文提出了一种基于条件梯度的加速分布式在线学习算法, 使用Frank-Wolfe 步骤替代投影步骤, 避免了昂贵的投影计算. 文中证明了当局部代价函数为凸函数时, 所提算法达到公认的悔界\begin{document}${\rm O}(\sqrt{T})$\end{document}; 当局部代价函数为潜在非凸函数时, 所提算法以速率\begin{document}${\rm O}(\sqrt{T})$\end{document}收敛到平稳点. 最后, 仿真实验验证了所提算法的性能与理论证明的结论.
高超声速飞行器指定时间时变高增益反馈跟踪控制
张康康, 周彬, 蔡光斌, 侯明哲
当前状态:  doi: 10.16383/j.aas.c210895
[摘要](279) [HTML全文](112)
摘要:
研究了高超声速飞行器控制通道存在未知环境干扰时的指定时间跟踪控制问题. 基于高超声速飞行器的输入输出线性化模型, 借助参量 Lyapunov方程的一些性质, 设计一种光滑、有界的时变高增益控制律. 相比于现有的高超声速飞行器有限/固定时间控制方法, 该算法不会出现抖振现象, 同时收敛时间不依赖于初始状态且可以事先设定. 当高超声速飞行器存在未知的有界环境匹配干扰时, 该控制器能使高度和速度在指定时间跟踪上参考信号. 最后仿真结果验证了方法的有效性.
RFNet: 用于三维点云分类的卷积神经网络
单铉洋, 孙战里, 曾志刚
当前状态:  doi: 10.16383/j.aas.c210532
[摘要](694) [HTML全文](266)
摘要:
由于点云的非结构性和无序性, 目前已有的点云分类网络在精度上仍然需要进一步提高. 通过考虑局部结构的构建、全局特征聚合和损失函数改进三个方面, 本文构造了一个有效的点云分类网络. 首先, 针对点云的非结构性,通过学习中心点特征与近邻点特征之间的关系, 为不规则的近邻点分配不同的权重, 以此构建局部结构. 此外,使用注意力的思想, 提出了加权平均池化, 通过自注意力的方式, 学习每个高维特征的注意力分数, 在应对点云无序性的同时, 可以有效地聚合冗余的高维特征. 另外,利用了交叉熵损失与中心损失之间的互补关系, 提出了联合损失, 在增大类间距离的同时减小了类内距离, 进一步提高了网络的分类能力. 本文在合成数据集ModelNet40、ShapeNetCore和真实世界数据集ScanObjectNN上进行了实验, 与目前性能最好的多个网络相比较, 验证了本文整体网络结构的优越性.
异构集成代理辅助的区间多模态粒子群优化算法
季新芳, 张勇, 巩敦卫, 郭一楠, 孙晓燕
当前状态:  doi: 10.16383/j.aas.c210223
[摘要](766) [HTML全文](323)
摘要:
现实生活中的很多黑盒优化问题可归为高计算代价的多模态优化问题, 即昂贵多模态优化问题. 在处理该类问题时, 决策者希望以尽量少的计算代价(即尽量少的真实函数评价次数)找到多个高质量的最优解. 然而, 已有代理辅助的进化优化算法很少考虑问题的多模态属性, 运行一次仅可获得问题的一个最优解. 鉴于此, 研究一种异构集成代理辅助的区间多模态粒子群优化算法. 首先, 借助异构集成的思想构建一个由多个基础代理模型组成的模型池; 随后, 依据待评价粒子与已发现模态之间的匹配关系, 从模型池中自主选择部分基础代理模型进行集成, 并使用集成后的代理模型预测该粒子的适应值. 进一步, 为节约代理模型管理的代价, 设计一种增量式的代理模型管理策略; 为减少代理模型预测误差对算法性能的影响, 首次将区间排序关系引入到进化过程中. 将所提算法与当前流行的5种代理辅助进化优化算法和7 种经典的多模态优化算法进行对比, 在20个测试函数和1个建筑节能实际问题上的结果表明, 所提算法可以在较少计算代价下获得问题的多个高竞争最优解.
基于扩展PI抗扰补偿器的高精度时间同步控制
代学武, 贾志安, 崔东亮, 柴天佑
当前状态:  doi: 10.16383/j.aas.c210676
[摘要](331) [HTML全文](124)
摘要:
高精度时间同步是任务关键型工业网络控制系统的核心支撑技术, 针对工业环境中普遍存在周期性振动等扰动信号导致晶振频率漂移, 影响时间同步精度的问题, 本文基于扩展比例积分(Proportional Integral, \begin{document}$ \mathrm{P}\mathrm{I} $\end{document})观测器, 提出了一种新型的抗扰补偿器结构, 用于消除周期性扰动的影响, 并构建了相应的精细抗干扰反馈控制方法, 用于实现高精度时间同步. 与传统的扰动观测器相比, 所提出的扩展\begin{document}$ \mathrm{P}\mathrm{I} $\end{document}抗扰补偿器克服了传统扰动观测器零点不变局限性, 提出了零点配置方法, 以充分利用闭环系统的传递函数矩阵(Transfer Function Matrix, TFM)在系统零点处降秩的特性, 实现了对于特定频率扰动信号的补偿作用. 并给出了所提出的控制器和抗扰补偿器的稳定性证明和控制器参数的稳定域. 通过基于实测参数的无线网络仿真实验, 验证了在\begin{document}$ 5\mathrm{g} $\end{document}周期性振动干扰下, 本文提出的方法明显优于传统滤波器和补偿器, 达到了同步误差在4 \begin{document}$ \mu s $\end{document}以内, 实现了高精度时间同步.
基于滚动时域强化学习的智能车辆侧向控制算法
张兴龙, 陆阳, 李文璋, 徐昕
当前状态:  doi: 10.16383/j.aas.c210555
[摘要](955) [HTML全文](654)
摘要:
本文针对智能车辆的高精度侧向控制问题, 提出了一种基于滚动时域强化学习(Receding horizon reinforcement learning, RHRL)的侧向控制方法. 车辆的侧向控制量由前馈和反馈两部分构成, 前馈控制量由参考路径的曲率以及动力学模型直接计算得出; 而反馈控制量通过采用滚动时域强化学习算法求解最优跟踪控制问题得到. 本文提出的方法结合滚动时域优化机制, 将无限时域最优控制问题转化为若干有限时域控制问题进行求解. 与已有的有限时域执行器-评价器学习不同, 在每个预测时域采用时间独立型执行器-评价器网络结构学习最优值函数和控制策略. 与模型预测控制(Model predictive control, MPC)方法求解开环控制序列不同, RHRL控制器的输出是一个显式状态反馈控制律, 兼具直接离线部署和在线学习部署的能力. 此外, 本文从理论上证明了RHRL算法在每个预测时域的收敛性, 并分析了闭环系统的稳定性. 在仿真环境中完成了结构化道路下的车辆侧向控制测试, 仿真结果表明提出的RHRL方法在控制性能方面优于预瞄控制器和启发式动态规划算法, 在计算效率方面优于MPC; 与最近流行的软执行器-评价器(Soft actor-critic, SAC)算法和深度确定性策略梯度(Deep deterministic policy gradient, DDPG)算法相比控制性能更好, 且具有更低的样本复杂度和更高的学习效率. 最后, 以红旗E-HS3电动汽车作为实车平台, 在封闭结构化城市测试道路和乡村起伏砂石道路下进行了侧向控制实验. 实验结果显示, RHRL在结构化城市道路中的侧向控制性能优于预瞄控制, 在乡村道路中具有较强的路面适应能力和较好的控制性能.
基于混合数据增强的MSWI过程燃烧状态识别
郭海涛, 汤健, 丁海旭, 乔俊飞
当前状态: