优先发表
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
摘要:
露天矿机器人化采运系统面临复杂特定场景数据不足、极端工况测试困难、现场试验与调试安全风险高、高动态变化环境的感知与建模复杂和全场景物理实验周期长等挑战, 亟需突破提效开采演化机理、高精度全域融合感知、高效率稳定协同控制、高可靠安全群体管控4大科学问题. 通过研究极端环境全域多模感知与变载稳健自适应控制、动态装卸区多机装载协同与多车高效卸载规划、采运系统自主学习建模与虚实融合平行仿真、高适用性工程应用方案, 提出露天矿立足机器人化采运“端边感知、平行控制”的智慧生产模式, 从感控、协同、调度、应用等多层次提出机器人化采运关键理论与技术. 通过技术创新和迭代优化, 实现我国露天矿机器人化采运系统技术自主创新和关键技术自主可控, 确保露天煤矿机器人化运输车的大批量安全高效作业运行, 形成我国露天煤矿迈向高水平智能化的“双十 (10项创新技术、10项机器人化采运标准)、双百 (100台车应用示范, 较有人系统的110%的综合运输运行效率)、双千 (1000 台车容量的监控平台, 1000 小时平均无故障运行时间)”的中国方案, 有力支撑我国矿山智能化绿色开采发展战略.
露天矿机器人化采运系统面临复杂特定场景数据不足、极端工况测试困难、现场试验与调试安全风险高、高动态变化环境的感知与建模复杂和全场景物理实验周期长等挑战, 亟需突破提效开采演化机理、高精度全域融合感知、高效率稳定协同控制、高可靠安全群体管控4大科学问题. 通过研究极端环境全域多模感知与变载稳健自适应控制、动态装卸区多机装载协同与多车高效卸载规划、采运系统自主学习建模与虚实融合平行仿真、高适用性工程应用方案, 提出露天矿立足机器人化采运“端边感知、平行控制”的智慧生产模式, 从感控、协同、调度、应用等多层次提出机器人化采运关键理论与技术. 通过技术创新和迭代优化, 实现我国露天矿机器人化采运系统技术自主创新和关键技术自主可控, 确保露天煤矿机器人化运输车的大批量安全高效作业运行, 形成我国露天煤矿迈向高水平智能化的“双十 (10项创新技术、10项机器人化采运标准)、双百 (100台车应用示范, 较有人系统的110%的综合运输运行效率)、双千 (
摘要:
针对存在扰动的连续时间非线性系统, 设计一种结合混合迭代机制和自适应评判框架的鲁棒控制方法. 通过优化传统值迭代算法, 实现加速学习并放宽预设条件的目标. 引入可调参数确保控制策略在迭代过程中的可容许性, 从而放松加速因子的设置条件. 结合广义策略迭代的思想, 构建新型混合迭代机制, 从而获得更优的收敛特性. 最后, 利用两个仿真实例验证算法性能. 针对线性系统的仿真结果表明, 算法具有较高的收敛精度. 在导弹自动驾驶仪系统仿真中, 相对于值迭代方法, 本文算法不依赖初始可容许控制策略, 同时能使收敛速度提高约49%.
针对存在扰动的连续时间非线性系统, 设计一种结合混合迭代机制和自适应评判框架的鲁棒控制方法. 通过优化传统值迭代算法, 实现加速学习并放宽预设条件的目标. 引入可调参数确保控制策略在迭代过程中的可容许性, 从而放松加速因子的设置条件. 结合广义策略迭代的思想, 构建新型混合迭代机制, 从而获得更优的收敛特性. 最后, 利用两个仿真实例验证算法性能. 针对线性系统的仿真结果表明, 算法具有较高的收敛精度. 在导弹自动驾驶仪系统仿真中, 相对于值迭代方法, 本文算法不依赖初始可容许控制策略, 同时能使收敛速度提高约49%.
摘要:
针对高超声速飞行器在外界干扰与模型不确定性影响下的制导控制难题, 提出一种融合双延迟深度确定性策略梯度与交叉熵方法 (cross-entropy method, CEM) 的进化强化学习框架. 首先, 构建高超声速飞行器的运动模型与制导控制一体化模型; 其次, 将复杂干扰环境下的多约束控制问题转化为强化学习决策优化过程, 依托深度强化学习的无模型数据驱动特性, 建立从状态观测到舵偏角指令的端到端映射机制. 同时, 引入基于CEM的动作空间采样机制, 通过Q值最大化准则筛选精英候选动作集, 利用价值函数引导进化搜索方向, 有效克服传统强化学习探索低效、盲目性强的缺陷, 提升样本利用效率. 最后, 仿真结果表明所提算法能够适应初始高度偏差±300 m、速度偏差±200 m/s及气动参数±40%不确定性等变任务飞行条件, 且在终端控制精度与鲁棒性等核心指标上显著优于传统控制方法.
针对高超声速飞行器在外界干扰与模型不确定性影响下的制导控制难题, 提出一种融合双延迟深度确定性策略梯度与交叉熵方法 (cross-entropy method, CEM) 的进化强化学习框架. 首先, 构建高超声速飞行器的运动模型与制导控制一体化模型; 其次, 将复杂干扰环境下的多约束控制问题转化为强化学习决策优化过程, 依托深度强化学习的无模型数据驱动特性, 建立从状态观测到舵偏角指令的端到端映射机制. 同时, 引入基于CEM的动作空间采样机制, 通过Q值最大化准则筛选精英候选动作集, 利用价值函数引导进化搜索方向, 有效克服传统强化学习探索低效、盲目性强的缺陷, 提升样本利用效率. 最后, 仿真结果表明所提算法能够适应初始高度偏差±300 m、速度偏差±200 m/s及气动参数±40%不确定性等变任务飞行条件, 且在终端控制精度与鲁棒性等核心指标上显著优于传统控制方法.
摘要:
针对目前我国火电企业的配煤掺烧方案制定普遍采用人工经验模式, 导致方案制定效率低、配烧成本非最优的问题, 本文首次系统性开展了面向分段计划负荷的耦合配烧优化模型与硫分约束界调整研究. 首先, 为保证更快速与更精准地制定配烧方案, 通过磨煤机组的切换磨向量建立分段计划负荷与配烧优化模型之间的耦合关系, 实现了以计算机优化模型为主的数字化配烧. 然后, 针对耦合配烧优化模型中的关键环保指标硫分约束, 综合考虑了机组燃煤硫转化效率、脱硫效率与锅炉燃烧等不确定性的影响, 在反演计算硫分约束界的基础上, 基于改进随机配置网络建立了硫分约束界前馈补偿模型. 接下来, 为保证前馈补偿模型的历史训练样本案例数据库的最优性, 通过监测机组的实时生产数据全周期迭代动态更新案例数据库, 进而提升前馈补偿模型的全周期预测精准性. 最后, 基于该模型开发的计算机软件系统运行后, 配烧方案制定时间由原40分钟/次缩减到5分钟/次之内, 显著提升了运行人员的配烧效率; 另外, 在满足带负荷最佳匹配的前提下, 通过优化技术, 掺烧低热值经济煤种的比例明显增加, 相比人工经验制定的配烧方案成本平均下降21元/吨, 取得了良好经济效益.
针对目前我国火电企业的配煤掺烧方案制定普遍采用人工经验模式, 导致方案制定效率低、配烧成本非最优的问题, 本文首次系统性开展了面向分段计划负荷的耦合配烧优化模型与硫分约束界调整研究. 首先, 为保证更快速与更精准地制定配烧方案, 通过磨煤机组的切换磨向量建立分段计划负荷与配烧优化模型之间的耦合关系, 实现了以计算机优化模型为主的数字化配烧. 然后, 针对耦合配烧优化模型中的关键环保指标硫分约束, 综合考虑了机组燃煤硫转化效率、脱硫效率与锅炉燃烧等不确定性的影响, 在反演计算硫分约束界的基础上, 基于改进随机配置网络建立了硫分约束界前馈补偿模型. 接下来, 为保证前馈补偿模型的历史训练样本案例数据库的最优性, 通过监测机组的实时生产数据全周期迭代动态更新案例数据库, 进而提升前馈补偿模型的全周期预测精准性. 最后, 基于该模型开发的计算机软件系统运行后, 配烧方案制定时间由原40分钟/次缩减到5分钟/次之内, 显著提升了运行人员的配烧效率; 另外, 在满足带负荷最佳匹配的前提下, 通过优化技术, 掺烧低热值经济煤种的比例明显增加, 相比人工经验制定的配烧方案成本平均下降21元/吨, 取得了良好经济效益.
摘要:
研究通信拓扑固定下受有界扰动影响的非线性多智能体系统固定时间一致性问题. 针对现有事件触发控制方法存在的收敛时间依赖初值、扰动下触发可靠性低, 控制参数缺乏理论设计依据等挑战, 提出一种动态事件触发固定时间一致性控制方法. 首先, 设计融合非线性增益与双曲正切扰动补偿的固定时间控制器, 在消除抖振的同时保证收敛时间上界严格独立于系统初始状态. 其次, 构造基于动态变量自适应调节的事件触发机制, 显著降低通信频率并严格证明系统不存在Zeno行为. 进一步, 通过建立新型Lyapunov稳定性分析框架, 显式给出收敛时间上界与事件触发间隔下界. 仿真结果表明, 所提方法在保证固定时间收敛性能的同时, 有效实现通信效率的优化提升.
研究通信拓扑固定下受有界扰动影响的非线性多智能体系统固定时间一致性问题. 针对现有事件触发控制方法存在的收敛时间依赖初值、扰动下触发可靠性低, 控制参数缺乏理论设计依据等挑战, 提出一种动态事件触发固定时间一致性控制方法. 首先, 设计融合非线性增益与双曲正切扰动补偿的固定时间控制器, 在消除抖振的同时保证收敛时间上界严格独立于系统初始状态. 其次, 构造基于动态变量自适应调节的事件触发机制, 显著降低通信频率并严格证明系统不存在Zeno行为. 进一步, 通过建立新型Lyapunov稳定性分析框架, 显式给出收敛时间上界与事件触发间隔下界. 仿真结果表明, 所提方法在保证固定时间收敛性能的同时, 有效实现通信效率的优化提升.
摘要:
人群移动是影响城市公共安全及应急管理的重要因素, 如何对其进行高精度的建模仿真和有效干预是亟待解决的问题. 为此, 提出一种物理信息机器学习驱动的微观人群移动建模仿真与干预决策框架. 基于平行智能思想, 该框架构建“数据感知-融合建模-动态仿真-智能干预”四层闭环结构, 形成从建模仿真到策略生成、执行及反馈修正的完整链路. 针对人群的移动仿真与引导决策问题, 分别提出基于物理信息时空图神经网络的导航势能场模型和物理信息多智能体深度确定性策略梯度算法, 有效解决传统方法中模型准确性较差、仿真与干预孤立以及决策依赖人工经验的问题. 最后, 基于真实数据集开展仿真实验验证了所提框架的有效性.
人群移动是影响城市公共安全及应急管理的重要因素, 如何对其进行高精度的建模仿真和有效干预是亟待解决的问题. 为此, 提出一种物理信息机器学习驱动的微观人群移动建模仿真与干预决策框架. 基于平行智能思想, 该框架构建“数据感知-融合建模-动态仿真-智能干预”四层闭环结构, 形成从建模仿真到策略生成、执行及反馈修正的完整链路. 针对人群的移动仿真与引导决策问题, 分别提出基于物理信息时空图神经网络的导航势能场模型和物理信息多智能体深度确定性策略梯度算法, 有效解决传统方法中模型准确性较差、仿真与干预孤立以及决策依赖人工经验的问题. 最后, 基于真实数据集开展仿真实验验证了所提框架的有效性.
摘要:
随着人们对图像画质要求的不断提高, 各类图像细节增强技术不断涌现. 然而, 基于局部滤波器速度较快, 但其细节增强效果往往有限; 全局滤波器效果突出, 但计算开销较大; 深度学习方法高度依赖人工标注数据, 且其缺乏可解释性; 基于残差学习的策略则容易陷入局部最优, 难以充分挖掘潜在的全局最优特征. 针对上述挑战, 提出了一种基于局部分形维数最大化的图像细节增强算法. 研究发现, 图像的分形维数在一定程度上能够有效刻画图像纹理结构, 其空间分布呈现出一定规律: 边缘区域通常具有较高的分形维数, 纹理区域次之, 平坦区域则最低. 基于上述特性, 构建图像纹理特征与分形维数之间的映射关系, 并进一步探讨了分形维数与图像细节层之间的内在关联机制. 该方法在保持整体结构一致性的前提下, 通过提升局部分形维数, 实现了图像细节的有效增强, 进而为图像增强提供了一种具有理论依据的新思路. 大量实验结果表明, 该方法在主观视觉感受和客观评价指标上具有竞争力的表现. 如在BSDS200数据集上进行4倍增强因子的测试中, 所提方法在PSNR和SSIM指标上相较于当前流行方法QWLS分别提升了5.20 dB和0.1456 , 充分展示了其在图像细节增强任务中的优势与算法良好的泛化特性.
随着人们对图像画质要求的不断提高, 各类图像细节增强技术不断涌现. 然而, 基于局部滤波器速度较快, 但其细节增强效果往往有限; 全局滤波器效果突出, 但计算开销较大; 深度学习方法高度依赖人工标注数据, 且其缺乏可解释性; 基于残差学习的策略则容易陷入局部最优, 难以充分挖掘潜在的全局最优特征. 针对上述挑战, 提出了一种基于局部分形维数最大化的图像细节增强算法. 研究发现, 图像的分形维数在一定程度上能够有效刻画图像纹理结构, 其空间分布呈现出一定规律: 边缘区域通常具有较高的分形维数, 纹理区域次之, 平坦区域则最低. 基于上述特性, 构建图像纹理特征与分形维数之间的映射关系, 并进一步探讨了分形维数与图像细节层之间的内在关联机制. 该方法在保持整体结构一致性的前提下, 通过提升局部分形维数, 实现了图像细节的有效增强, 进而为图像增强提供了一种具有理论依据的新思路. 大量实验结果表明, 该方法在主观视觉感受和客观评价指标上具有竞争力的表现. 如在BSDS200数据集上进行4倍增强因子的测试中, 所提方法在PSNR和SSIM指标上相较于当前流行方法QWLS分别提升了5.20 dB和
摘要:
由现有的特征提取器建立的图像特征点匹配集合通常包含大量离群点, 这严重影响了特征匹配的有效性和依赖匹配结果的下游任务的性能. 最近提出的几种离群点去除方法通过估计运动场来利用匹配对的运动一致性, 并使用卷积神经网络(Convolutional neural network, CNN)来减少离群点造成的污染, 以捕获上下文. 然而, CNN在捕捉全局上下文方面的固有缺点, 如过度平滑和感受野的有限和固定大小, 限制了这些方法的性能. 与这些使用卷积神经网络直接估计运动场的方法不同, 本文通过尝试在不使用CNN的情况下估计高质量的运动场. 因此, 提出基于运动过滤和调整的网络, 以减轻在捕捉上下文时离群点的影响. 具体而言, 首先设计一个运动过滤模块, 以迭代地去除离群点并捕获上下文. 然后, 设计一个规则化和调整模块, 该模块先估计初始运动场, 接着通过利用额外的位置信息对其进行调整, 使其更加准确. 在离群点去除和相对姿态估计任务上, 在室内和室外数据集上评估了本文所提出的方法的性能. 实验结果表明, 与现有多种方法相比, 本文所提方法展现出更优的性能.
由现有的特征提取器建立的图像特征点匹配集合通常包含大量离群点, 这严重影响了特征匹配的有效性和依赖匹配结果的下游任务的性能. 最近提出的几种离群点去除方法通过估计运动场来利用匹配对的运动一致性, 并使用卷积神经网络(Convolutional neural network, CNN)来减少离群点造成的污染, 以捕获上下文. 然而, CNN在捕捉全局上下文方面的固有缺点, 如过度平滑和感受野的有限和固定大小, 限制了这些方法的性能. 与这些使用卷积神经网络直接估计运动场的方法不同, 本文通过尝试在不使用CNN的情况下估计高质量的运动场. 因此, 提出基于运动过滤和调整的网络, 以减轻在捕捉上下文时离群点的影响. 具体而言, 首先设计一个运动过滤模块, 以迭代地去除离群点并捕获上下文. 然后, 设计一个规则化和调整模块, 该模块先估计初始运动场, 接着通过利用额外的位置信息对其进行调整, 使其更加准确. 在离群点去除和相对姿态估计任务上, 在室内和室外数据集上评估了本文所提出的方法的性能. 实验结果表明, 与现有多种方法相比, 本文所提方法展现出更优的性能.
摘要:
针对不确定扰动下具有混合相对阶的异构多智能体系统, 提出一种新的分布式自适应扰动抑制控制方法, 实现了切换拓扑下领导者-跟随者输出一致性. 首先, 通过引入局部输出一致性的概念, 将领导者-跟随者全局输出一致性问题转化为相邻智能体局部输出一致性问题; 然后, 针对系统参数和扰动已知的情况, 基于智能体系统控制-扰动相对阶匹配条件, 提出一种基于高阶微分邻居信息的布式标称扰动抑制控制器; 基于此, 针对因混合相对阶差异而导致控制器中的高阶微分邻居信号难以直接获取的问题, 提出基于高阶滑模微分器的精确估计方法, 突破了传统控制设计对系统相对阶一致性的依赖, 解决了固定/切换拓扑下局部-全局输出一致性; 进而, 针对系统参数和扰动不确定的情况, 进行分布式自适应扰动抑制控制器设计, 实现切换拓扑下的领导者-跟随者输出一致性以及期望的扰动补偿. 所设计的控制方法不仅能够在不依赖全局智能体信息及领导者信息的前提下, 确保整个智能体系统的闭环稳定性、实现跟随者对领导者的输出跟踪, 并达到期望的扰动抑制效果. 与常规的自适应一致性控制方案相比, 还具备处理具有混合相对阶特性的异构多智能体系统的能力. 最后, 仿真研究验证所设计控制方案的有效性.
针对不确定扰动下具有混合相对阶的异构多智能体系统, 提出一种新的分布式自适应扰动抑制控制方法, 实现了切换拓扑下领导者-跟随者输出一致性. 首先, 通过引入局部输出一致性的概念, 将领导者-跟随者全局输出一致性问题转化为相邻智能体局部输出一致性问题; 然后, 针对系统参数和扰动已知的情况, 基于智能体系统控制-扰动相对阶匹配条件, 提出一种基于高阶微分邻居信息的布式标称扰动抑制控制器; 基于此, 针对因混合相对阶差异而导致控制器中的高阶微分邻居信号难以直接获取的问题, 提出基于高阶滑模微分器的精确估计方法, 突破了传统控制设计对系统相对阶一致性的依赖, 解决了固定/切换拓扑下局部-全局输出一致性; 进而, 针对系统参数和扰动不确定的情况, 进行分布式自适应扰动抑制控制器设计, 实现切换拓扑下的领导者-跟随者输出一致性以及期望的扰动补偿. 所设计的控制方法不仅能够在不依赖全局智能体信息及领导者信息的前提下, 确保整个智能体系统的闭环稳定性、实现跟随者对领导者的输出跟踪, 并达到期望的扰动抑制效果. 与常规的自适应一致性控制方案相比, 还具备处理具有混合相对阶特性的异构多智能体系统的能力. 最后, 仿真研究验证所设计控制方案的有效性.
摘要:
具身智能系统通过智能体与环境不断交互, 从而提升智能体能力, 受到学术界和产业界的广泛关注. 视觉−语言−动作模型作为一种受到大模型发展启发的机器人通用控制模型, 提高了具身智能系统中智能体与环境交互的能力, 大大扩展了具身智能机器人的应用场景. 本文对具身操作中的视觉−语言−动作模型进行综述. 首先, 详细介绍视觉−语言−动作模型的发展历程. 然后, 对视觉−语言−动作模型架构、训练数据、预训练方法、后训练方法和模型评估5个方面的研究现状进行详细分析. 最后, 针对视觉−语言−动作模型发展过程和落地应用中面临的挑战和未来可能的发展方向进行总结.
具身智能系统通过智能体与环境不断交互, 从而提升智能体能力, 受到学术界和产业界的广泛关注. 视觉−语言−动作模型作为一种受到大模型发展启发的机器人通用控制模型, 提高了具身智能系统中智能体与环境交互的能力, 大大扩展了具身智能机器人的应用场景. 本文对具身操作中的视觉−语言−动作模型进行综述. 首先, 详细介绍视觉−语言−动作模型的发展历程. 然后, 对视觉−语言−动作模型架构、训练数据、预训练方法、后训练方法和模型评估5个方面的研究现状进行详细分析. 最后, 针对视觉−语言−动作模型发展过程和落地应用中面临的挑战和未来可能的发展方向进行总结.
摘要:
随着车联网技术的进步, 由网联人驾车与网联自动车组成的混行车群规模正逐渐增大, 导致混行车群间的协同与交互难度增加, 进而影响混行车群行驶状态的一致性. 为解决此问题, 提出一种云−边−端协同下考虑多车影响的混行车群集中式协同控制方法, 以提高混行车群协同行驶效率. 首先, 为有效处理和分析较大规模混行车群产生的海量异构信息数据, 设计混合交通场景下云−边−端协同架构. 然后, 考虑网联人驾车前方两辆车及紧邻后车状态信息的影响, 以及网联自动车前方所有车辆及紧邻后车状态信息的影响, 分别在云控平台建立基于分子动力学的网联自动车和固定权重的网联人驾车协同行驶模型. 再者, 根据混行车群间动态信息影响关系, 设计基于云−边−端协同架构的混行车群集中式协同控制方法, 并利用稳定性和串稳定性理论获得混行车群协同行驶一致性条件. 最后, 通过对比仿真实验验证了本文所提控制方法的有效性.
随着车联网技术的进步, 由网联人驾车与网联自动车组成的混行车群规模正逐渐增大, 导致混行车群间的协同与交互难度增加, 进而影响混行车群行驶状态的一致性. 为解决此问题, 提出一种云−边−端协同下考虑多车影响的混行车群集中式协同控制方法, 以提高混行车群协同行驶效率. 首先, 为有效处理和分析较大规模混行车群产生的海量异构信息数据, 设计混合交通场景下云−边−端协同架构. 然后, 考虑网联人驾车前方两辆车及紧邻后车状态信息的影响, 以及网联自动车前方所有车辆及紧邻后车状态信息的影响, 分别在云控平台建立基于分子动力学的网联自动车和固定权重的网联人驾车协同行驶模型. 再者, 根据混行车群间动态信息影响关系, 设计基于云−边−端协同架构的混行车群集中式协同控制方法, 并利用稳定性和串稳定性理论获得混行车群协同行驶一致性条件. 最后, 通过对比仿真实验验证了本文所提控制方法的有效性.
摘要:
无人系统正深刻重塑社会生活方式与战争形态. 围绕无人系统动态规划领域, 首先将环境抽象为由节点和边组成的拓扑网络; 其次, 针对异步规划中变步长时间推进的问题, 提出一种新颖的异步规划算法, 即半马尔科夫环境下的部分可观蒙特卡洛树搜索(SPOMCP)算法, 其创新之处在于将拓扑网络转化为具有最简信息表示的子目标图, 并实现基于变步长时间推进机制的策略快速寻优. 通过理论分析, 证明了SPOMCP算法能够生成最优策略, 且计算复杂度与子目标节点数量呈指数相关. 最后仿真实验表明了SPOMCP的性能高于基准算法, 只用不到基准算法89.18 %的计算时间, 得到了高于基准算法的平均回报值.
无人系统正深刻重塑社会生活方式与战争形态. 围绕无人系统动态规划领域, 首先将环境抽象为由节点和边组成的拓扑网络; 其次, 针对异步规划中变步长时间推进的问题, 提出一种新颖的异步规划算法, 即半马尔科夫环境下的部分可观蒙特卡洛树搜索(SPOMCP)算法, 其创新之处在于将拓扑网络转化为具有最简信息表示的子目标图, 并实现基于变步长时间推进机制的策略快速寻优. 通过理论分析, 证明了SPOMCP算法能够生成最优策略, 且计算复杂度与子目标节点数量呈指数相关. 最后仿真实验表明了SPOMCP的性能高于基准算法, 只用不到基准算法89.18 %的计算时间, 得到了高于基准算法的平均回报值.
摘要:
提出一种基于空−海−潜跨域无人平台协同的海上目标探测追踪策略. 首先, 构建无人机−水面艇−潜器协同的海上跨域无人系统; 进一步, 针对海上目标的高机动性以及无人平台自身约束, 采用测度理论解析无人机−水面艇−潜器最佳探测编队队形, 实现目标探测概率最大化; 当探测到目标后, 设计基于逆强化学习的无人机−水面艇−潜器编队控制器, 实现障碍物环境下水面/水下目标的可靠有效追踪. 最后, 通过仿真与实验验证了所提方法的有效性. 结果表明, 所提探测模式可以实现有限时间内移动目标探测概率最大化, 同时所提逆强化学习编队控制器可以在保持队形稳定的基础上, 结合动态避障策略, 实现复杂环境下跨域无人平台安全协同追踪.
提出一种基于空−海−潜跨域无人平台协同的海上目标探测追踪策略. 首先, 构建无人机−水面艇−潜器协同的海上跨域无人系统; 进一步, 针对海上目标的高机动性以及无人平台自身约束, 采用测度理论解析无人机−水面艇−潜器最佳探测编队队形, 实现目标探测概率最大化; 当探测到目标后, 设计基于逆强化学习的无人机−水面艇−潜器编队控制器, 实现障碍物环境下水面/水下目标的可靠有效追踪. 最后, 通过仿真与实验验证了所提方法的有效性. 结果表明, 所提探测模式可以实现有限时间内移动目标探测概率最大化, 同时所提逆强化学习编队控制器可以在保持队形稳定的基础上, 结合动态避障策略, 实现复杂环境下跨域无人平台安全协同追踪.
摘要:
流程工业普遍存在多操作参数强耦合、工艺拓扑复杂和多工序协同难等问题, 导致传统局部优化方法难以满足全局最优运行需求. 针对上述挑战, 提出一种基于图谱理论的流程拓扑结构感知的多智能体强化学习协同优化方法, 以实现复杂拓扑流程工业的多操作参数协同优化. 首先, 构建基于拉普拉斯谱分析的拓扑结构解析框架, 刻画工业过程多操作参数耦合结构关系, 为智能体任务分配与协同决策提供支撑; 然后, 设计融合长短期记忆网络与多头注意机制的时序感知模块, 实现历史状态轨迹中关键时间依赖特征提取; 进一步, 引入多层次空间注意力机制, 面向组织层、变量层及连续控制域实现优化关注度的动态自适应调节; 在此基础上, 构建局部-全局协同的分层强化学习决策架构, 实现多智能体间的协调控制与策略优化. 在连续搅拌釜反应器系统和盐湖化工典型流程的工业数据基础上, 构建了仿真实验以验证所提方法的有效性. 实验结果表明, 所提方法相较于传统方法性能提升41.2%, 展现出更优的收敛性能和策略稳定性, 为流程工业多操作参数协同优化提供了新思路和参考技术路径.
流程工业普遍存在多操作参数强耦合、工艺拓扑复杂和多工序协同难等问题, 导致传统局部优化方法难以满足全局最优运行需求. 针对上述挑战, 提出一种基于图谱理论的流程拓扑结构感知的多智能体强化学习协同优化方法, 以实现复杂拓扑流程工业的多操作参数协同优化. 首先, 构建基于拉普拉斯谱分析的拓扑结构解析框架, 刻画工业过程多操作参数耦合结构关系, 为智能体任务分配与协同决策提供支撑; 然后, 设计融合长短期记忆网络与多头注意机制的时序感知模块, 实现历史状态轨迹中关键时间依赖特征提取; 进一步, 引入多层次空间注意力机制, 面向组织层、变量层及连续控制域实现优化关注度的动态自适应调节; 在此基础上, 构建局部-全局协同的分层强化学习决策架构, 实现多智能体间的协调控制与策略优化. 在连续搅拌釜反应器系统和盐湖化工典型流程的工业数据基础上, 构建了仿真实验以验证所提方法的有效性. 实验结果表明, 所提方法相较于传统方法性能提升41.2%, 展现出更优的收敛性能和策略稳定性, 为流程工业多操作参数协同优化提供了新思路和参考技术路径.
摘要:
随着海洋开发的不断推进, 水下目标追踪作为实现无人集群对作业目标持续接近的基础性技术, 在海上搜救、海洋监测、海底资源勘探等关键应用中发挥着重要作用. 同时, 海上跨域集群通过无人机、无人船与无人潜器等异构平台间的信息交互与自主协同, 能够在复杂海洋环境中实现对水下目标的高效探测与持续追踪, 相比单一水下域集群, 在感知与作业能力的提升等方面具有巨大的潜力. 然而, 当前水下协同追踪技术仍存在感知测量能力不足、跨域协同机制不完善和环境适应性难以兼顾等挑战. 为此, 本文首先针对水下目标追踪的发展趋势进行了分析; 同时, 面向追踪过程中定位、跟踪、传输与规划四个基础模块, 总结了研究难点和挑战, 并梳理了国内外研究进展; 最后, 针对联合设计等新颖的研究理念和前沿需求进行了探讨, 以期为海上跨域集群水下目标追踪技术的发展提供参考.
随着海洋开发的不断推进, 水下目标追踪作为实现无人集群对作业目标持续接近的基础性技术, 在海上搜救、海洋监测、海底资源勘探等关键应用中发挥着重要作用. 同时, 海上跨域集群通过无人机、无人船与无人潜器等异构平台间的信息交互与自主协同, 能够在复杂海洋环境中实现对水下目标的高效探测与持续追踪, 相比单一水下域集群, 在感知与作业能力的提升等方面具有巨大的潜力. 然而, 当前水下协同追踪技术仍存在感知测量能力不足、跨域协同机制不完善和环境适应性难以兼顾等挑战. 为此, 本文首先针对水下目标追踪的发展趋势进行了分析; 同时, 面向追踪过程中定位、跟踪、传输与规划四个基础模块, 总结了研究难点和挑战, 并梳理了国内外研究进展; 最后, 针对联合设计等新颖的研究理念和前沿需求进行了探讨, 以期为海上跨域集群水下目标追踪技术的发展提供参考.
摘要:
针对低空环境下动目标轨迹预测问题, 提出一种知识—数据—模型驱动的动目标轨迹融合预测框架. 基于低空飞行器运动特征构建飞行知识混合专家模型, 通过将多源传感器数据输入至各飞行知识专家模块, 实现目标机动模态的精细化识别, 并使用Mamba模型提取时空关联特征; 设计权值自适应调节机制, 利用注意力机制动态融合多源感知数据, 解决传感器时空异步问题; 采用门控循环单元建模长期时序依赖关系, 根据目标历史飞行数据生成初步预测轨迹; 基于低空目标运动学方程构建物理信息神经网络, 通过动态权衡数据驱动损失与物理约束损失, 矫正数据驱动偏差, 确保预测轨迹满足运动学约束并有效抑制多步预测误差累积. 数值仿真及实验验证结果表明, 所提出的知识—数据—模型驱动的动目标轨迹融合预测方法, 能够有效预测低空目标飞行轨迹.
针对低空环境下动目标轨迹预测问题, 提出一种知识—数据—模型驱动的动目标轨迹融合预测框架. 基于低空飞行器运动特征构建飞行知识混合专家模型, 通过将多源传感器数据输入至各飞行知识专家模块, 实现目标机动模态的精细化识别, 并使用Mamba模型提取时空关联特征; 设计权值自适应调节机制, 利用注意力机制动态融合多源感知数据, 解决传感器时空异步问题; 采用门控循环单元建模长期时序依赖关系, 根据目标历史飞行数据生成初步预测轨迹; 基于低空目标运动学方程构建物理信息神经网络, 通过动态权衡数据驱动损失与物理约束损失, 矫正数据驱动偏差, 确保预测轨迹满足运动学约束并有效抑制多步预测误差累积. 数值仿真及实验验证结果表明, 所提出的知识—数据—模型驱动的动目标轨迹融合预测方法, 能够有效预测低空目标飞行轨迹.
摘要:
研究双网络零和博弈中的分布式优化问题, 两个网络代表两个对立的玩家. 每个网络由一组具有时变损失函数的智能体组成, 智能体通过通信和协作来优化己方网络在博弈中的收益. 考虑到现实优化场景中通信资源受限和信息反馈受限两种通信受限情形, 设计了基于事件触发通信和两点Bandit反馈的分布式在线优化算法, 并采用动态纳什均衡遗憾评估算法的性能. 在某些假设条件下, 建立相对于总博弈次数为次线性的动态纳什均衡遗憾界, 从而验证了算法的有效性. 此外, 将设计的算法拓展为多周期版本并建立次线性的动态纳什均衡遗憾界. 最后, 通过双线性矩阵博弈的仿真算例进一步验证了所设计的两个算法的性能.
研究双网络零和博弈中的分布式优化问题, 两个网络代表两个对立的玩家. 每个网络由一组具有时变损失函数的智能体组成, 智能体通过通信和协作来优化己方网络在博弈中的收益. 考虑到现实优化场景中通信资源受限和信息反馈受限两种通信受限情形, 设计了基于事件触发通信和两点Bandit反馈的分布式在线优化算法, 并采用动态纳什均衡遗憾评估算法的性能. 在某些假设条件下, 建立相对于总博弈次数为次线性的动态纳什均衡遗憾界, 从而验证了算法的有效性. 此外, 将设计的算法拓展为多周期版本并建立次线性的动态纳什均衡遗憾界. 最后, 通过双线性矩阵博弈的仿真算例进一步验证了所设计的两个算法的性能.
摘要:
针对城市空中交通系统,提出一种优化方法以同时确定满足乘客需求的最小系统规模和最佳系统再平衡策略.研究构建了流体模型与多服务器M/M/s排队模型的联合框架,描述乘客、飞行器与电池在站点间迁移、换电及充电过程.在该模型框架下对飞行器和电池数量的适定性进行了证明,并给出了系统供需均衡时的必要条件.在此基础上,通过线性规划求解系统供需均衡下的再平衡分配率与最小机队规模,并计算最优充电站位置、电池数量及电池运输车数量.数值仿真分析了影响系统规模的因素,实例验证证明了所提再平衡方法的有效性.
针对城市空中交通系统,提出一种优化方法以同时确定满足乘客需求的最小系统规模和最佳系统再平衡策略.研究构建了流体模型与多服务器M/M/s排队模型的联合框架,描述乘客、飞行器与电池在站点间迁移、换电及充电过程.在该模型框架下对飞行器和电池数量的适定性进行了证明,并给出了系统供需均衡时的必要条件.在此基础上,通过线性规划求解系统供需均衡下的再平衡分配率与最小机队规模,并计算最优充电站位置、电池数量及电池运输车数量.数值仿真分析了影响系统规模的因素,实例验证证明了所提再平衡方法的有效性.
摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
, 最新更新时间
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
, 最新更新时间
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
, 最新更新时间
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.