优先发表
优先发表栏目展示本刊经同行评议确定正式录用的文章,这些文章目前处在编校过程,尚未确定卷期及页码,但可以根据DOI进行引用。
显示方式:
摘要:
针对高超声速飞行器(Hypersonic flight vehicle, HFV)在未知环境干扰与执行器故障下的跟踪控制问题, 提出一种基于Tube的复合鲁棒模型预测控制方法. 首先, 基于非线性动态逆方法将高超声速飞行器纵向运动模型输入/输出线性化, 并实现了高度与速度控制回路的解耦. 随后, 结合Tube不变集理论推导鲁棒收紧约束, 并显式集成HFV的控制输入及其增量约束, 设计一种复合鲁棒模型预测控制策略. 此外, 还研究了所提方法的递归可行性, 同时基于Lyapunov稳定性理论严格证明控制策略的闭环稳定性. 最后, 仿真实验验证了所提方法的有效性.
针对高超声速飞行器(Hypersonic flight vehicle, HFV)在未知环境干扰与执行器故障下的跟踪控制问题, 提出一种基于Tube的复合鲁棒模型预测控制方法. 首先, 基于非线性动态逆方法将高超声速飞行器纵向运动模型输入/输出线性化, 并实现了高度与速度控制回路的解耦. 随后, 结合Tube不变集理论推导鲁棒收紧约束, 并显式集成HFV的控制输入及其增量约束, 设计一种复合鲁棒模型预测控制策略. 此外, 还研究了所提方法的递归可行性, 同时基于Lyapunov稳定性理论严格证明控制策略的闭环稳定性. 最后, 仿真实验验证了所提方法的有效性.
摘要:
为了提高混合动力飞行器经济性并改善动力系统的动态性能, 提出一种混合动力分层控制的能量管理策略. 首先, 在顶层提出基于改进等效燃油消耗最小化的能量管理策略, 根据发电机组的燃油消耗特性、储能电池组的荷电状态以及等效惩罚因子动态调整发电机组的最优工作曲线, 从而获得最佳的燃油经济性. 在底层提出一种基于电流反馈的改进下垂控制策略, 负责管理电池组的充放电状态和维持直流母线电压的动态平衡, 同时实现飞行器的经济性与动态响应的协同控制, 达到对混合电推进飞行器能量的动态优化管理的目的. 最后, 通过基于RT-LAB的混合动力系统硬件在环实验平台验证该能量管理策略的有效性.
为了提高混合动力飞行器经济性并改善动力系统的动态性能, 提出一种混合动力分层控制的能量管理策略. 首先, 在顶层提出基于改进等效燃油消耗最小化的能量管理策略, 根据发电机组的燃油消耗特性、储能电池组的荷电状态以及等效惩罚因子动态调整发电机组的最优工作曲线, 从而获得最佳的燃油经济性. 在底层提出一种基于电流反馈的改进下垂控制策略, 负责管理电池组的充放电状态和维持直流母线电压的动态平衡, 同时实现飞行器的经济性与动态响应的协同控制, 达到对混合电推进飞行器能量的动态优化管理的目的. 最后, 通过基于RT-LAB的混合动力系统硬件在环实验平台验证该能量管理策略的有效性.
摘要:
针对符号有向图下合作−竞争广义不确定异构多智能体系统的二分输出一致问题, 基于协同鲁棒输出调节原理提出新型分布式控制算法, 使得具有竞争关系和不同动态的两组智能体能够分别跟踪幅值相等、符号相反的外系统输出.首先, 为了实现对不确定系统参数的动态补偿, 引入基于外系统观测器的动态内模补偿器, 进而设计分布式状态反馈控制协议. 区别于传统协同输出调节问题, 通过将二分一致性问题转化为增广闭环广义系统的稳定性问题, 证明了在不依赖广义调节方程精确解的情况下, 提出的控制器能够实现小范围参数摄动下的二分输出跟踪. 其次, 在状态不可获知条件下, 通过重构动态内模补偿器, 设计了分布式二分输出反馈控制协议. 最后, 通过仿真算例证明了所提出的分布式协同控制算法的有效性.
针对符号有向图下合作−竞争广义不确定异构多智能体系统的二分输出一致问题, 基于协同鲁棒输出调节原理提出新型分布式控制算法, 使得具有竞争关系和不同动态的两组智能体能够分别跟踪幅值相等、符号相反的外系统输出.首先, 为了实现对不确定系统参数的动态补偿, 引入基于外系统观测器的动态内模补偿器, 进而设计分布式状态反馈控制协议. 区别于传统协同输出调节问题, 通过将二分一致性问题转化为增广闭环广义系统的稳定性问题, 证明了在不依赖广义调节方程精确解的情况下, 提出的控制器能够实现小范围参数摄动下的二分输出跟踪. 其次, 在状态不可获知条件下, 通过重构动态内模补偿器, 设计了分布式二分输出反馈控制协议. 最后, 通过仿真算例证明了所提出的分布式协同控制算法的有效性.
摘要:
随着可再生能源并网比例的持续提升, 风电、光伏等新能源发电形式对电力系统的稳定性与调度智能化提出更高要求. 源网荷储一体化背景下, 如何高效利用多源异构电力数据实现精准预测与协同分析, 已成为关键问题. 近年来, 深度学习、大数据、大模型等技术推动智能化推断技术取得飞跃式进展. 本文首先结合深度学习技术, 对时间序列数据协同推断共性技术研究现状进行阐述, 重点分析趋势−季节性分解、频域建模、外生变量融合等关键方法, 分析基于不同架构的时间序列模型的研究现状. 其次针对源网荷智能化关键技术进行阐述, 进一步梳理源网荷储系统中智能预测、状态评估与负荷调度等典型场景中的关键技术路径, 并对其具体应用场景进行分析. 最后, 结合日益复杂的电力系统背景, 对数据协同推断技术的发展方向进行展望.
随着可再生能源并网比例的持续提升, 风电、光伏等新能源发电形式对电力系统的稳定性与调度智能化提出更高要求. 源网荷储一体化背景下, 如何高效利用多源异构电力数据实现精准预测与协同分析, 已成为关键问题. 近年来, 深度学习、大数据、大模型等技术推动智能化推断技术取得飞跃式进展. 本文首先结合深度学习技术, 对时间序列数据协同推断共性技术研究现状进行阐述, 重点分析趋势−季节性分解、频域建模、外生变量融合等关键方法, 分析基于不同架构的时间序列模型的研究现状. 其次针对源网荷智能化关键技术进行阐述, 进一步梳理源网荷储系统中智能预测、状态评估与负荷调度等典型场景中的关键技术路径, 并对其具体应用场景进行分析. 最后, 结合日益复杂的电力系统背景, 对数据协同推断技术的发展方向进行展望.
摘要:
在多服务星对失效航天器进行姿态接管控制的在轨服务任务中, 考虑惯量矩阵未知和执行机构饱和的情况, 基于自适应动态规划(ADP)方法提出一种分布式姿态跟踪接管控制策略. 首先, 通过对姿态系统的建模分析, 设计一种含有力矩饱和约束和期望力矩补偿的值函数, 在ADP框架下, 用一组基函数逼近最优值函数, 并得到分布式近似最优姿态跟踪控制策略; 然后, 为避免使用角加速度信息, 分别构建关于惯量参数和权重参数的滤波形式的线性回归模型, 根据并行学习方法、参数一致性算法和离线策略轨迹, 设计惯量参数自适应辨识律和权重更新律; 接着使用李雅普诺夫方法证明姿态跟踪误差、惯量矩阵辨识误差和权重参数估计误差的一致最终有界; 最后, 仿真结果验证了分布式跟踪控制方法在力矩饱和约束下对姿态跟踪和惯量矩阵辨识的有效性.
在多服务星对失效航天器进行姿态接管控制的在轨服务任务中, 考虑惯量矩阵未知和执行机构饱和的情况, 基于自适应动态规划(ADP)方法提出一种分布式姿态跟踪接管控制策略. 首先, 通过对姿态系统的建模分析, 设计一种含有力矩饱和约束和期望力矩补偿的值函数, 在ADP框架下, 用一组基函数逼近最优值函数, 并得到分布式近似最优姿态跟踪控制策略; 然后, 为避免使用角加速度信息, 分别构建关于惯量参数和权重参数的滤波形式的线性回归模型, 根据并行学习方法、参数一致性算法和离线策略轨迹, 设计惯量参数自适应辨识律和权重更新律; 接着使用李雅普诺夫方法证明姿态跟踪误差、惯量矩阵辨识误差和权重参数估计误差的一致最终有界; 最后, 仿真结果验证了分布式跟踪控制方法在力矩饱和约束下对姿态跟踪和惯量矩阵辨识的有效性.
摘要:
科学技术发展是一种动态非线性的复杂演进过程.为了提升技术发展的精准预测, 本文基于大语言模型(Large Language Model, LLM)、图卷积神经网络(Graph Convolutional Networks, GCN)、双向长短期记忆神经网络(Bi-directional Long Short-Term Memory, BiLSTM)以及鲁棒随机配置网络(Robust Stochastic Configuration Networks, RSCN), 提出了一种全新的"结构−内容"时空技术预测模型(Spatiotemporal Technological Forecasting Model with LLM as Representation, STTeFL 模型).首先, 通过结合图卷积神经网络和双向长短期记忆神经网络, 分别捕捉技术网络中的空间依赖关系和时间演化规律, 从而突破了传统预测模型在动态性和结构表征上的局限性, 克服了传统技术预测模型的“伪动态”和“静态”限制; 其次, 引入大语言模型对技术网络中的节点特征和边特征进行双重语义表征, 将预测框架从单一的结构维度扩展至“结构−内容”双维度分析, 显著增强了模型对技术发展信息的理解能力和表征深度. 最后, 通过集成RSCN, 模型能够有效应对极端不均衡数据分布的挑战, 进一步提升了预测的鲁棒性和准确性.本文提出的预测框架在多个指标上均优于当前多种技术预测方法, 为推动技术预测建模和评估未来技术发展轨迹提供了有力的支持.
科学技术发展是一种动态非线性的复杂演进过程.为了提升技术发展的精准预测, 本文基于大语言模型(Large Language Model, LLM)、图卷积神经网络(Graph Convolutional Networks, GCN)、双向长短期记忆神经网络(Bi-directional Long Short-Term Memory, BiLSTM)以及鲁棒随机配置网络(Robust Stochastic Configuration Networks, RSCN), 提出了一种全新的"结构−内容"时空技术预测模型(Spatiotemporal Technological Forecasting Model with LLM as Representation, STTeFL 模型).首先, 通过结合图卷积神经网络和双向长短期记忆神经网络, 分别捕捉技术网络中的空间依赖关系和时间演化规律, 从而突破了传统预测模型在动态性和结构表征上的局限性, 克服了传统技术预测模型的“伪动态”和“静态”限制; 其次, 引入大语言模型对技术网络中的节点特征和边特征进行双重语义表征, 将预测框架从单一的结构维度扩展至“结构−内容”双维度分析, 显著增强了模型对技术发展信息的理解能力和表征深度. 最后, 通过集成RSCN, 模型能够有效应对极端不均衡数据分布的挑战, 进一步提升了预测的鲁棒性和准确性.本文提出的预测框架在多个指标上均优于当前多种技术预测方法, 为推动技术预测建模和评估未来技术发展轨迹提供了有力的支持.
摘要:
近年来, 模型预测控制(MPC)在自动驾驶领域大量应用, 但依然面临车辆动力学非线性建模、实时滚动优化等困难. 基于数据驱动建立车辆动力学模型的MPC通过收集系统的输入输出数据, 直接学习动力学模型, 但依然需要额外处理环节解决实时滚动优化问题. 为此, 提出一种基于随机森林学习车辆动力学模型的方法. 先将车辆动力学模型分解为标称模型和残差模型, 然后利用两层随机森林学习残差模型. 上层用于切换不同线性模型, 下层拟合叶子节点的线性模型. 由于标称模型和残差模型均为线性模型, 滚动优化可直接使用二次规划求解器实时求解. 同时, 基于随机森林的残差模型使用多帧历史状态作为特征输入, 学习得到的残差模型保留动力学系统动态响应的延迟特性, 因此可有效消解延迟影响. 仿真测试和实车实验结果表明, 提出的MPC的跟踪精度和实时性均优于标称MPC和基于高斯过程的MPC, 并对车辆执行机构延迟具有优良的适应性.
近年来, 模型预测控制(MPC)在自动驾驶领域大量应用, 但依然面临车辆动力学非线性建模、实时滚动优化等困难. 基于数据驱动建立车辆动力学模型的MPC通过收集系统的输入输出数据, 直接学习动力学模型, 但依然需要额外处理环节解决实时滚动优化问题. 为此, 提出一种基于随机森林学习车辆动力学模型的方法. 先将车辆动力学模型分解为标称模型和残差模型, 然后利用两层随机森林学习残差模型. 上层用于切换不同线性模型, 下层拟合叶子节点的线性模型. 由于标称模型和残差模型均为线性模型, 滚动优化可直接使用二次规划求解器实时求解. 同时, 基于随机森林的残差模型使用多帧历史状态作为特征输入, 学习得到的残差模型保留动力学系统动态响应的延迟特性, 因此可有效消解延迟影响. 仿真测试和实车实验结果表明, 提出的MPC的跟踪精度和实时性均优于标称MPC和基于高斯过程的MPC, 并对车辆执行机构延迟具有优良的适应性.
摘要:
虽然强化学习近年来取得显著成功, 但策略鲁棒性仍然是其在安全攸关的自动驾驶领域部署的关键瓶颈之一. 一个根本性挑战在于, 许多现实世界中的自动驾驶任务面临难以预测的环境变化和不可避免的感知噪声, 这些不确定性因素可能导致系统执行次优的决策与控制, 甚至引发灾难性后果. 针对上述多源不确定性问题, 提出一种对抗鲁棒强化学习方法, 实现可信端到端控制策略优化. 首先, 构建一个可在线学习的对手模型, 用于同时逼近最坏情况下环境动态扰动与状态观测扰动. 其次, 基于零和博弈建模自动驾驶智能体与环境动态扰动之间的对抗性. 再次, 针对所模拟的多源不确定性, 提出鲁棒约束演员-评论家算法, 在连续动作空间下实现策略累计奖赏最大化的同时, 有效约束环境动态扰动与状态观测扰动对所学端到端控制策略的影响. 最后, 所提出的方案在不同的场景、交通流及扰动条件下进行评估, 并与三种代表性的方法进行对比分析, 验证了该方法在复杂工况和对抗环境中的有效性与鲁棒性.
虽然强化学习近年来取得显著成功, 但策略鲁棒性仍然是其在安全攸关的自动驾驶领域部署的关键瓶颈之一. 一个根本性挑战在于, 许多现实世界中的自动驾驶任务面临难以预测的环境变化和不可避免的感知噪声, 这些不确定性因素可能导致系统执行次优的决策与控制, 甚至引发灾难性后果. 针对上述多源不确定性问题, 提出一种对抗鲁棒强化学习方法, 实现可信端到端控制策略优化. 首先, 构建一个可在线学习的对手模型, 用于同时逼近最坏情况下环境动态扰动与状态观测扰动. 其次, 基于零和博弈建模自动驾驶智能体与环境动态扰动之间的对抗性. 再次, 针对所模拟的多源不确定性, 提出鲁棒约束演员-评论家算法, 在连续动作空间下实现策略累计奖赏最大化的同时, 有效约束环境动态扰动与状态观测扰动对所学端到端控制策略的影响. 最后, 所提出的方案在不同的场景、交通流及扰动条件下进行评估, 并与三种代表性的方法进行对比分析, 验证了该方法在复杂工况和对抗环境中的有效性与鲁棒性.
, 最新更新时间
, doi: 10.16383/j.aas.c230210
摘要:
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电辅助消纳可再生能源的能力对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助消纳能力, 根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 详细阐述了基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力, 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈和非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标等. 根据以上分析分别给出了下一步的研究方向.
增加可再生能源在电网中的占比, 使能源结构更合理, 是加快能源转型实现低碳可持续发展的有效途径. 电网中占主导地位的火电辅助消纳可再生能源的能力对提高可再生能源在电网中的占比起到重要作用. 为了提高火电机组辅助消纳能力, 根据当前系统控制方案, 分析了影响机组灵活性与调峰深度的因素, 包括机炉协调、局部反馈策略下的锅炉控制、系统稳态工作点的规划等. 详细阐述了基于补偿方案的协调策略限制了机组对具有随机性和间歇性的可再生能源的补偿能力, 局部反馈策略下的锅炉控制只是实现了等效热效应的反馈和非额定工况下的稳态工作点关系到辅助可再生能源消纳的能耗和排放指标等. 根据以上分析分别给出了下一步的研究方向.
摘要:
大模型工业垂域化是通用智能迈向专业化应用的必然趋势, 更是驱动工业智能化转型的核心引擎. 然而, 大模型在工业领域应用, 面临难以洞察工业时序数据内涵、难以嵌入工业物理化学规律、难以确保模型输出可信度、难以解决复杂工业问题等挑战. 针对上述瓶颈, 提出工业垂域具身智控大模型构建范式: 创新性引入时序数据元模型化方法, 将工业时序数据转换为代码语义, 提升大模型对时序数据的理解与推理能力; 借助元模型构建工业规律知识图谱, 并将其嵌入大模型生成过程, 以确定性科学原理抑制生成随机性; 构建数字孪生与实物伴生的双轨验证平台, 通过虚实具身反馈机制, 实时强化学习, 优化模型输出可信度; 设计融合知识图谱规则评分与虚实验证专家评分的混合奖励函数, 结合自适应学习与长度正则化策略, 克服大模型解决复杂问题时“趋易畏难”倾向; 最终形成一个集垂域适配、具身控制、可信验证、具身反馈于一体的四层闭环架构. 应用于有色冶金领域, 构建了首个有色冶金具身智控大模型, 实验验证了该范式的有效性, 为大模型从实验室走向工业现场, 架起了从技术到落地的桥梁.
大模型工业垂域化是通用智能迈向专业化应用的必然趋势, 更是驱动工业智能化转型的核心引擎. 然而, 大模型在工业领域应用, 面临难以洞察工业时序数据内涵、难以嵌入工业物理化学规律、难以确保模型输出可信度、难以解决复杂工业问题等挑战. 针对上述瓶颈, 提出工业垂域具身智控大模型构建范式: 创新性引入时序数据元模型化方法, 将工业时序数据转换为代码语义, 提升大模型对时序数据的理解与推理能力; 借助元模型构建工业规律知识图谱, 并将其嵌入大模型生成过程, 以确定性科学原理抑制生成随机性; 构建数字孪生与实物伴生的双轨验证平台, 通过虚实具身反馈机制, 实时强化学习, 优化模型输出可信度; 设计融合知识图谱规则评分与虚实验证专家评分的混合奖励函数, 结合自适应学习与长度正则化策略, 克服大模型解决复杂问题时“趋易畏难”倾向; 最终形成一个集垂域适配、具身控制、可信验证、具身反馈于一体的四层闭环架构. 应用于有色冶金领域, 构建了首个有色冶金具身智控大模型, 实验验证了该范式的有效性, 为大模型从实验室走向工业现场, 架起了从技术到落地的桥梁.
摘要:
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
近年来, 视频扩散模型在相机可控的图像到视频生成任务中取得了突破性进展. 然而, 现有方法在维持3D空间结构一致性方面仍面临显著挑战, 其生成视频普遍存在空间结构模糊化、多视角下物体形态畸变等缺陷, 这些问题严重制约了生成视频的视觉可信度. 为解决这一问题, 提出在视频扩散模型的训练和推理阶段均引入额外的3D空间先验信息, 以增强生成视频的空间结构一致性. 具体而言, 在模型训练阶段, 设计基于视角形变映射的条件嵌入方法(Warp-Injection), 通过进行逐帧视角形变映射与图像补全构建具备高度空间一致性的参考帧序列, 并将其作为结构先验条件嵌入扩散模型的训练过程. 在推理阶段, 首先提出初始噪声空间几何校正策略(Warp-Init): 对条件图像加噪进行首帧初始化, 此后通过迭代式视角形变映射构建符合3D一致性约束的初始噪声序列. 在此基础上, 进一步在去噪过程中引入基于视角形变先验的能量函数引导策略(Warp-Guidance), 通过减小生成帧与视角形变映射后的预期目标视频之间的距离来实现对视频3D空间一致性的校正. 在标准RealEstate10K数据集上的实验结果表明, 相较于当前最优模型, 本文方法在FVD指标上取得18.03的显著优化, 同时将3D结构估计的失败率(COLMAP error rate) 降低至5.20%. 可视化分析进一步证明, 本文方法能有效维持生成视频的3D空间结构一致性.
摘要:
虚假数据注入攻击行为严重威胁电力信息物理系统的安稳运行. 然而, 针对虚假数据注入攻击的现有检测未充分考虑海量量测数据的不平衡性和网络拓扑的关联性, 导致检测方法广泛存在定位性能差的问题, 提出一种基于样本过滤-标签聚合极端树集成的电网虚假数据注入攻击定位检测方法. 所提方法在基于深度学习的卷积神经网络中引入交叉验证思想, 用于过滤海量量测数据中代表性弱、重复率高的不平衡样本; 通过利用标签聚合将关联的网络拓扑融入到极端树中, 并在与各节点状态对应的所有极端树上进行集成, 继而加权输出得到各节点状态的最终检测概率, 以实现对受攻击位置的精确定位. 在IEEE-14、IEEE-57系统上进行大量仿真, 验证了所提方法的有效性, 且与多种已有定位检测方法进行充分对比, 验证其在准确率、精度、召回率、F1值和AUC值上具备更优性.
虚假数据注入攻击行为严重威胁电力信息物理系统的安稳运行. 然而, 针对虚假数据注入攻击的现有检测未充分考虑海量量测数据的不平衡性和网络拓扑的关联性, 导致检测方法广泛存在定位性能差的问题, 提出一种基于样本过滤-标签聚合极端树集成的电网虚假数据注入攻击定位检测方法. 所提方法在基于深度学习的卷积神经网络中引入交叉验证思想, 用于过滤海量量测数据中代表性弱、重复率高的不平衡样本; 通过利用标签聚合将关联的网络拓扑融入到极端树中, 并在与各节点状态对应的所有极端树上进行集成, 继而加权输出得到各节点状态的最终检测概率, 以实现对受攻击位置的精确定位. 在IEEE-14、IEEE-57系统上进行大量仿真, 验证了所提方法的有效性, 且与多种已有定位检测方法进行充分对比, 验证其在准确率、精度、召回率、F1值和AUC值上具备更优性.
摘要:
参考目标跟踪(Referring multi-object tracking, RMOT)是一项利用语言与视觉模态数据进行目标定位与跟踪的任务, 旨在根据语言提示在视频帧中精准识别并持续跟踪指定目标. 尽管现有RMOT方法在该领域取得了一定进展, 但针对语言表述概念粒度的建模仍较为有限, 导致模型在处理复杂语言描述时存在语义解析不足的问题. 为此, 提出基于语义概念关联的参考多目标跟踪方法SCATrack), 通过引入共享语义概念(Sharing semantic concept, SSC)和语义概念辅助生成(Semantic concept generation, SCG)模块, 以提升模型对语言表述的深层理解能力, 从而增强跟踪任务的持续性与鲁棒性. 具体而言, SSC模块对语言表述进行语义概念划分, 使模型能够有效区分相同语义的不同表达方式, 以及不同语义间的相似表达方式, 从而提升多粒度输入条件下的目标辨别能力. SCG模块则采用特征遮蔽与生成机制, 引导模型学习多粒度语言概念的表征信息, 增强其对复杂语言描述的鲁棒性和辨别能力. 在两个广泛使用的基准数据集上的实验结果表明, 所提出的SCATrack显著提升RMOT任务的跟踪性能, 验证了方法的有效性与优越性.
参考目标跟踪(Referring multi-object tracking, RMOT)是一项利用语言与视觉模态数据进行目标定位与跟踪的任务, 旨在根据语言提示在视频帧中精准识别并持续跟踪指定目标. 尽管现有RMOT方法在该领域取得了一定进展, 但针对语言表述概念粒度的建模仍较为有限, 导致模型在处理复杂语言描述时存在语义解析不足的问题. 为此, 提出基于语义概念关联的参考多目标跟踪方法SCATrack), 通过引入共享语义概念(Sharing semantic concept, SSC)和语义概念辅助生成(Semantic concept generation, SCG)模块, 以提升模型对语言表述的深层理解能力, 从而增强跟踪任务的持续性与鲁棒性. 具体而言, SSC模块对语言表述进行语义概念划分, 使模型能够有效区分相同语义的不同表达方式, 以及不同语义间的相似表达方式, 从而提升多粒度输入条件下的目标辨别能力. SCG模块则采用特征遮蔽与生成机制, 引导模型学习多粒度语言概念的表征信息, 增强其对复杂语言描述的鲁棒性和辨别能力. 在两个广泛使用的基准数据集上的实验结果表明, 所提出的SCATrack显著提升RMOT任务的跟踪性能, 验证了方法的有效性与优越性.
摘要:
深度修复旨在解决三维重建过程中深度图的缺失、噪声和遮挡问题. 然而, 由于深度图来源的多样性和异质性, 现有的深度修复方法难以对复杂场景结构及未知类型深度缺陷实现有效修复. 针对上述问题, 不同于现有方法单纯从提升算法鲁棒性的角度进行研究, 从深度缺陷数据集构建的逆向视角出发, 构造一种真实缺陷采样仿真数据集RDSS, 并在此基础上提出一种基于深度语义扩散的深度图修复模型DR-Net. RDSS数据集通过对真实缺陷的采集与建模, 结合同质化形变拓展和异质化交叉组合, 能够对多种复杂场景中的深度缺陷进行形式化仿真, 有效提升深度缺陷的多样性和场景的覆盖性. 设计的深度图修复网络DR-Net基于U型网络结构, 利用反向透射模块实现高分辨率细节保持的同时, 通过深度语义扩散模块传播图像中的深度语义信息, 进而有效提升修复性能. 为验证RDSS数据集的有效性及DR-Net模型的鲁棒性, 从数据集的可用性和网络模型的有效性两个方面进行分析. 实验结果表明: 以RDSS数据集为基准训练数据集, 可实现在其他数据集中深度图的有效修复. 此外, 与最先进的模型设计类修复方法SDFilter和数据驱动类修复方法G2相比, DR-Net模型在RDSS、NYU Depth V2和KITTI三类数据集上的均方根误差指标分别平均下降24.85%和29.54%, 验证了DR-Net模型的有效性和先进性.
深度修复旨在解决三维重建过程中深度图的缺失、噪声和遮挡问题. 然而, 由于深度图来源的多样性和异质性, 现有的深度修复方法难以对复杂场景结构及未知类型深度缺陷实现有效修复. 针对上述问题, 不同于现有方法单纯从提升算法鲁棒性的角度进行研究, 从深度缺陷数据集构建的逆向视角出发, 构造一种真实缺陷采样仿真数据集RDSS, 并在此基础上提出一种基于深度语义扩散的深度图修复模型DR-Net. RDSS数据集通过对真实缺陷的采集与建模, 结合同质化形变拓展和异质化交叉组合, 能够对多种复杂场景中的深度缺陷进行形式化仿真, 有效提升深度缺陷的多样性和场景的覆盖性. 设计的深度图修复网络DR-Net基于U型网络结构, 利用反向透射模块实现高分辨率细节保持的同时, 通过深度语义扩散模块传播图像中的深度语义信息, 进而有效提升修复性能. 为验证RDSS数据集的有效性及DR-Net模型的鲁棒性, 从数据集的可用性和网络模型的有效性两个方面进行分析. 实验结果表明: 以RDSS数据集为基准训练数据集, 可实现在其他数据集中深度图的有效修复. 此外, 与最先进的模型设计类修复方法SDFilter和数据驱动类修复方法G2相比, DR-Net模型在RDSS、NYU Depth V2和KITTI三类数据集上的均方根误差指标分别平均下降24.85%和29.54%, 验证了DR-Net模型的有效性和先进性.
摘要:
研究存在未知系统动力学和输入时滞的乘性噪声系统线性二次最优控制问题. 当系统动力学完全已知时, 可以通过离线求解Riccati-ZXL方程获得最优反馈策略. 而当系统动力学不完全已知时, 离线求解Riccati-ZXL方程不再可行. 为此, 拟设计一种值迭代(value iteration, VI)算法来求解Riccati-ZXL方程, 该算法仅依赖可量测的状态和输入信息, 而不要求完全的系统动力学. 与策略迭代(policy iteration, PI)算法不同, 该算法消除了对初始策略稳定性的要求, 具有更强的适应性. 最后, 通过一个例子验证了所提算法的有效性.
研究存在未知系统动力学和输入时滞的乘性噪声系统线性二次最优控制问题. 当系统动力学完全已知时, 可以通过离线求解Riccati-ZXL方程获得最优反馈策略. 而当系统动力学不完全已知时, 离线求解Riccati-ZXL方程不再可行. 为此, 拟设计一种值迭代(value iteration, VI)算法来求解Riccati-ZXL方程, 该算法仅依赖可量测的状态和输入信息, 而不要求完全的系统动力学. 与策略迭代(policy iteration, PI)算法不同, 该算法消除了对初始策略稳定性的要求, 具有更强的适应性. 最后, 通过一个例子验证了所提算法的有效性.
摘要:
故障检测与诊断技术是保证复杂装备或工业过程正常运行的技术支撑和有效手段, 独立成分分析(Independent component analysis, ICA)作为一种典型的多元统计过程监测(Multivariate statistical process monitoring, MSPM)方法, 可充分挖掘数据的高阶统计信息. 传统ICA方法在预处理阶段采用主成分分析(Principle component analysis, PCA)进行白化和降维, 但PCA的静态性质导致ICA在动态过程监测中的效果不太理想. 为解决这一问题, 提出一种独立慢特征分析(Independent-slow feature analysis, ISFA)建模方法. ISFA以原始观测矩阵和白化矩阵为自变量构造双目标优化函数, 基于牛顿迭代法求解目标函数, 使用网格搜索优化权重系数, 利用指数加权移动平均(Exponentially weighted moving average, EWMA)修正统计量并构建综合检测指标; 最后, 利用数值仿真和电动伺服机构实验验证所提方法的有效性.
故障检测与诊断技术是保证复杂装备或工业过程正常运行的技术支撑和有效手段, 独立成分分析(Independent component analysis, ICA)作为一种典型的多元统计过程监测(Multivariate statistical process monitoring, MSPM)方法, 可充分挖掘数据的高阶统计信息. 传统ICA方法在预处理阶段采用主成分分析(Principle component analysis, PCA)进行白化和降维, 但PCA的静态性质导致ICA在动态过程监测中的效果不太理想. 为解决这一问题, 提出一种独立慢特征分析(Independent-slow feature analysis, ISFA)建模方法. ISFA以原始观测矩阵和白化矩阵为自变量构造双目标优化函数, 基于牛顿迭代法求解目标函数, 使用网格搜索优化权重系数, 利用指数加权移动平均(Exponentially weighted moving average, EWMA)修正统计量并构建综合检测指标; 最后, 利用数值仿真和电动伺服机构实验验证所提方法的有效性.
摘要:
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
近年来, 大语言模型研究取得了突破性进展. 本文针对大模型分布式训练中通信开销高、算力利用率低的问题, 提出了一种基于Adam-mini优化器的单比特通信压缩算法——单比特Adam-mini. 该算法通过减少二阶动量参数, 使得能够以较小的通信代价精确计算全局二阶动量, 从而简化了通信误差补偿机制的设计. 单比特Adam-mini不仅避免了现有单比特Adam算法中通信开销较大的预热阶段, 还具备可证明的线性加速性质, 确保了分布式训练的高效性. 实验结果表明, 该算法在多种任务上表现优异, 并且可以兼容稀疏压缩器, 为大模型训练提供了更高效的解决方案.
摘要:
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
大语言模型因其强大的生成和理解能力受到广泛关注, 但在获取实时信息和执行复杂计算上仍存在局限性. 为使其更好地响应用户需求, 赋予大语言模型工具使用能力成为当下的研究热点. 首先, 明确大语言模型工具使用的基本概念, 并按照时间顺序梳理工具使用的发展脉络. 随后, 总结与工具使用相关的数据集和技术方法, 并分析其在智能体和具身智能等领域的应用. 最后, 梳理大语言模型工具使用领域未来的研究重点与发展方向.
摘要:
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
以深度学习为代表的机器学习方法已经在多个领域取得显著进展, 然而大多方法局限于静态场景, 难以像人类一样在开放世界的动态场景中不断学习新知识, 同时保持已经学过的知识. 为解决该挑战, 持续学习受到越来越多的关注. 现有的持续学习方法大致可以分为两类, 即传统的非预训练模型持续学习方法以及大模型时代下逐步演进的预训练模型持续学习方法. 本文旨在对这两类方法的研究进展进行详细的综述, 主要从四个层面对比非预训练模型和预训练模型方法的异同点, 即数据层面、模型层面、损失/优化层面以及理论层面. 着重分析从应用非预训练模型的方法发展到应用预训练模型的方法的技术变化, 并分析出现此类差异的内在本质. 最后, 总结并展望未来持续学习发展的趋势.
, 最新更新时间
, doi: 10.16383/j.aas.c190277
摘要:
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
首先, 通过分析黑体温度控制系统的物理模型, 推演出黑体传递函数的表达式.推演过程中得知黑体易受环境温度和空气散热的影响, 所以黑体温度控制系统是个非线性时变系统.结合实验黑体的阶跃响应数据, 采用阶跃响应法对传递函数进行近似计算, 得出黑体温控系统的传递函数是极点在左半轴的二阶系统, 该系统等效于二阶低通滤波器.经过低通滤波器的信号, 会滤除高频部分, 当用继电器法进行参数自整定时, 仅需计算能量较大的基波信号.通过对基波信号进行比较, 得出继电器法的整定公式, 并参照Ziegler-Nichols整定法则计算出PID参数.同时, 本文针对黑体加热器具有双路输出的特点, 提出了一种双路动态输出法, 通过理论分析了该方法可以消除环境对黑体温度的影响.对于环境温度变化较大的, 采用继电器法PID参数自整定的方式来消除; 对于黑体运行过程中环境温度变化较小的, 采用双路动态输出法来减少影响.最后, 结合实验数据, 引入性能指标, 验证了本文所述方法对黑体的温度控制性能有一定的提升.
, 最新更新时间
, doi: 10.16383/j.aas.c200007
摘要:
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
仿人智能控制是现代智能控制理论之一, 利用分层递阶的控制结构与多控制模态为强非线性、大迟滞、难建模问题提供了切实可行的解决方案, 近些年来发展迅速并且得到学术界的持续关注, 但缺乏对该理论研究进展系统性的总结. 本文通过系统的梳理仿人智能控制的理论基础和发展脉络, 将其划分为三代控制模型, 分别从每一代控制模型的算法描述、研究进展与应用进展三个角度进行综述, 同时, 结合当前的研究进展讨论仿人智能控制在控制模型、结构功能、参数校正方面进一步研究的方向.
, 最新更新时间
, doi: 10.16383/j.aas.2020.c200033
摘要:
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.
深度神经网络在解决复杂问题方面取得了惊人的成功, 广泛应用于生活中各个领域, 但是最近的研究表明, 深度神经网络容易受到精心设计的对抗样本的攻击, 导致网络模型输出错误的预测结果, 这对于深度学习网络的安全性是一种极大的挑战. 对抗攻击是深度神经网络发展过程中必须克服的一大障碍, 设计一种高效且能够防御多种对抗攻击算法, 且具有强鲁棒性的防御模型是有效推动对抗攻击防御的方向之一, 探究能否利用对抗性攻击来训练网络分类器从而提高其鲁棒性具有重要意义. 本文将生成对抗网络(Generative adversarial networks, GAN)和现有的攻击算法结合, 提出一种基于生成对抗网络的对抗攻击防御模型(AC-DefGAN), 利用对抗攻击算法生成攻击样本作为GAN的训练样本, 同时在网络中加入条件约束来稳定模型的训练过程, 利用分类器对生成器所生成样本的分类来指导GAN的训练过程, 通过自定义分类器需要防御的攻击算法来生成对抗样本以完成判别器的训练, 从而得到能够防御多种对抗攻击的分类器. 通过在MNIST、CIFAR-10和ImageNet数据集上进行实验, 证明训练完成后, AC-DefGAN可以直接对原始样本和对抗样本进行正确分类, 对各类对抗攻击算法达到很好的防御效果, 且比已有方法防御效果好、鲁棒性强.