2022年 第48卷 第2期
2022, 48(2): 315-334.
doi: 10.16383/j.aas.c210033
摘要:
作为机器人技能学习中的一个重要分支, 模仿学习近年来在机器人系统中得到了广泛的应用. 模仿学习能够将人类的技能以一种相对直接的方式迁移到机器人系统中, 其思路是先从少量示教样本中提取相应的运动特征, 然后将该特征泛化到新的情形. 本文针对机器人运动轨迹的模仿学习进行综述. 首先详细解释模仿学习中的技能泛化、收敛性和外插等基本问题; 其次从原理上对动态运动基元、概率运动基元和核化运动基元等主要的模仿学习算法进行介绍; 然后深入地讨论模仿学习中姿态和刚度矩阵的学习问题、协同和不确定性预测的问题以及人...
作为机器人技能学习中的一个重要分支, 模仿学习近年来在机器人系统中得到了广泛的应用. 模仿学习能够将人类的技能以一种相对直接的方式迁移到机器人系统中, 其思路是先从少量示教样本中提取相应的运动特征, 然后将该特征泛化到新的情形. 本文针对机器人运动轨迹的模仿学习进行综述. 首先详细解释模仿学习中的技能泛化、收敛性和外插等基本问题; 其次从原理上对动态运动基元、概率运动基元和核化运动基元等主要的模仿学习算法进行介绍; 然后深入地讨论模仿学习中姿态和刚度矩阵的学习问题、协同和不确定性预测的问题以及人...
2022, 48(2): 335-350.
doi: 10.16383/j.aas.c200745
摘要:
癫痫是一种由脑部神经元阵发性异常超同步电活动导致的慢性非传染性疾病, 也是全球最常见的神经系统疾病之一. 基于EEG的癫痫自动检测是指通过机器学习、分布检验、相关性分析和时频分析等数据分析方法, 对癫痫发作阶段的EEG信号进行自动识别的研究问题, 能够为癫痫诊疗与评估提供客观参考依据, 从而减轻医生工作负担并提高治疗效率, 因此具有十分重要的理论意义与实际应用价值. 本文详细介绍基于EEG的癫痫自动识别整体框架, 以及对应于各个步骤所涉及的典型方法. 针对核心模块, 即特征提取与分类器选择, 进...
癫痫是一种由脑部神经元阵发性异常超同步电活动导致的慢性非传染性疾病, 也是全球最常见的神经系统疾病之一. 基于EEG的癫痫自动检测是指通过机器学习、分布检验、相关性分析和时频分析等数据分析方法, 对癫痫发作阶段的EEG信号进行自动识别的研究问题, 能够为癫痫诊疗与评估提供客观参考依据, 从而减轻医生工作负担并提高治疗效率, 因此具有十分重要的理论意义与实际应用价值. 本文详细介绍基于EEG的癫痫自动识别整体框架, 以及对应于各个步骤所涉及的典型方法. 针对核心模块, 即特征提取与分类器选择, 进...
2022, 48(2): 351-374.
doi: 10.16383/j.aas.c210096
摘要:
在大数据时代下, 以高效自主隐式特征提取能力闻名的深度学习引发了新一代人工智能的热潮, 然而其背后黑箱不可解释的“捷径学习”现象成为制约其进一步发展的关键性瓶颈问题. 解耦表征学习通过探索大数据内部蕴含的物理机制和逻辑关系复杂性, 从数据生成的角度解耦数据内部多层次、多尺度的潜在生成因子, 促使深度网络模型学会像人类一样对数据进行自主智能感知, 逐渐成为新一代基于复杂性的可解释深度学习领域内重要研究方向, 具有重大的理论意义和应用价值. 本文系统地综述了解耦表征学习的研究进展, 对当前解耦表征学...
在大数据时代下, 以高效自主隐式特征提取能力闻名的深度学习引发了新一代人工智能的热潮, 然而其背后黑箱不可解释的“捷径学习”现象成为制约其进一步发展的关键性瓶颈问题. 解耦表征学习通过探索大数据内部蕴含的物理机制和逻辑关系复杂性, 从数据生成的角度解耦数据内部多层次、多尺度的潜在生成因子, 促使深度网络模型学会像人类一样对数据进行自主智能感知, 逐渐成为新一代基于复杂性的可解释深度学习领域内重要研究方向, 具有重大的理论意义和应用价值. 本文系统地综述了解耦表征学习的研究进展, 对当前解耦表征学...
2022, 48(2): 375-397.
doi: 10.16383/j.aas.c200662
摘要:
视频标题生成与描述是使用自然语言对视频进行总结与重新表达. 由于视频与语言之间存在异构特性, 其数据处理过程较为复杂. 本文主要对基于“编码−解码” 架构的模型做了详细阐述, 以视频特征编码与使用方式为依据, 将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法, 并对各类模型进行了归纳与总结. 最后, 对当前存在的问题及可能趋势进行了总结与展望, 指出需要生成融合情感、逻辑等信息的结构化语段, 并在模型优化、数据集构建、评价指标等方面进行更为深入...
视频标题生成与描述是使用自然语言对视频进行总结与重新表达. 由于视频与语言之间存在异构特性, 其数据处理过程较为复杂. 本文主要对基于“编码−解码” 架构的模型做了详细阐述, 以视频特征编码与使用方式为依据, 将其分为基于视觉特征均值/最大值的方法、基于视频序列记忆建模的方法、基于三维卷积特征的方法及混合方法, 并对各类模型进行了归纳与总结. 最后, 对当前存在的问题及可能趋势进行了总结与展望, 指出需要生成融合情感、逻辑等信息的结构化语段, 并在模型优化、数据集构建、评价指标等方面进行更为深入...
2022, 48(2): 398-407.
doi: 10.16383/j.aas.c210035
摘要:
近年来, 变分自编码器(Variational auto-encoder, VAE)模型由于在概率数据描述和特征提取能力等方面的优越性, 受到了学术界和工业界的广泛关注, 并被引入到工业过程监测、诊断和软测量建模等应用中. 然而, 传统基于VAE的软测量方法使用高斯分布作为潜在变量的分布, 限制了其对复杂工业过程数据, 尤其是多模态数据的建模能力. 为了解决这一问题, 本论文提出了一种混合变分自编码器回归模型(Mixture variational autoencoder regression,...
近年来, 变分自编码器(Variational auto-encoder, VAE)模型由于在概率数据描述和特征提取能力等方面的优越性, 受到了学术界和工业界的广泛关注, 并被引入到工业过程监测、诊断和软测量建模等应用中. 然而, 传统基于VAE的软测量方法使用高斯分布作为潜在变量的分布, 限制了其对复杂工业过程数据, 尤其是多模态数据的建模能力. 为了解决这一问题, 本论文提出了一种混合变分自编码器回归模型(Mixture variational autoencoder regression,...
2022, 48(2): 408-417.
doi: 10.16383/j.aas.c200897
摘要:
基于视频图像的视觉行人再识别是指利用计算机视觉技术关联非重叠域摄像头网络下的相同行人, 在视频安防和商业客流分析中具有重要应用. 目前视觉行人再识别技术已经取得了相当不错的进展, 但依旧面临很多挑战, 比如摄像机的拍摄视角不同、遮挡现象和光照变化等所导致的行人表观变化和匹配不准确问题. 为了克服单纯视觉匹配困难问题, 本文提出一种结合行人表观特征跟行人时空共现模式的行人再识别方法. 所提方法利用目标行人的邻域行人分布信息来辅助行人相似度计算, 有效地利用时空上下文信息来加强视觉行人再识别. 在行...
基于视频图像的视觉行人再识别是指利用计算机视觉技术关联非重叠域摄像头网络下的相同行人, 在视频安防和商业客流分析中具有重要应用. 目前视觉行人再识别技术已经取得了相当不错的进展, 但依旧面临很多挑战, 比如摄像机的拍摄视角不同、遮挡现象和光照变化等所导致的行人表观变化和匹配不准确问题. 为了克服单纯视觉匹配困难问题, 本文提出一种结合行人表观特征跟行人时空共现模式的行人再识别方法. 所提方法利用目标行人的邻域行人分布信息来辅助行人相似度计算, 有效地利用时空上下文信息来加强视觉行人再识别. 在行...
2022, 48(2): 418-433.
doi: 10.16383/j.aas.c200195
摘要:
针对电厂目前普遍采用PI-PI串级控制器调节锅炉主蒸汽温度系统, 不能有效克服惯性、时滞和参数时变等问题的影响, 本文提出了一种理想GPC (Generalized predictive control)-PI串级控制器. 首先, 该理想串级控制器不仅能抑制一次和二次扰动, 而且外环GPC通过对主蒸汽温度的多步预测, 并结合滚动优化技术能有效克服主蒸汽温度系统的惯性和时滞问题. 另外, 针对主蒸汽温度系统参数时变的特性, 该理想控制器采用了T-S (Takagi-Sugeno)型模糊神经网络(F...
针对电厂目前普遍采用PI-PI串级控制器调节锅炉主蒸汽温度系统, 不能有效克服惯性、时滞和参数时变等问题的影响, 本文提出了一种理想GPC (Generalized predictive control)-PI串级控制器. 首先, 该理想串级控制器不仅能抑制一次和二次扰动, 而且外环GPC通过对主蒸汽温度的多步预测, 并结合滚动优化技术能有效克服主蒸汽温度系统的惯性和时滞问题. 另外, 针对主蒸汽温度系统参数时变的特性, 该理想控制器采用了T-S (Takagi-Sugeno)型模糊神经网络(F...
2022, 48(2): 434-443.
doi: 10.16383/j.aas.c190858
摘要:
针对扑翼飞行中的周期性和时标不一现象, 以及扑翼飞行实际控制中的问题, 本文基于奇异摄动理论, 提出了一种针对扑翼周期系统的稳定性分析方法. 具体而言, 首先建立了扑翼飞行器的多刚体模型, 为后文对翅翼动力学的奇异摄动分析铺平道路; 其次, 对多刚体模型进行简化, 抽象出扑翼飞行动力学的核心问题, 并针对实际控制中的问题, 提出了利用奇异摄动理论分析扑翼飞行周期稳定性的方法, 指出了其相对于其他方法的优越性; 最后, 在自制的四自由度扑翼飞行器完成了真实的飞行实验, 验证了所提方法的有效性.
针对扑翼飞行中的周期性和时标不一现象, 以及扑翼飞行实际控制中的问题, 本文基于奇异摄动理论, 提出了一种针对扑翼周期系统的稳定性分析方法. 具体而言, 首先建立了扑翼飞行器的多刚体模型, 为后文对翅翼动力学的奇异摄动分析铺平道路; 其次, 对多刚体模型进行简化, 抽象出扑翼飞行动力学的核心问题, 并针对实际控制中的问题, 提出了利用奇异摄动理论分析扑翼飞行周期稳定性的方法, 指出了其相对于其他方法的优越性; 最后, 在自制的四自由度扑翼飞行器完成了真实的飞行实验, 验证了所提方法的有效性.
2022, 48(2): 444-459.
doi: 10.16383/j.aas.c190698
摘要:
随着大规模定制的市场需求日趋显著, 赛如生产系统(Seru production system, SPS)应运而生, 逐渐成为研究和应用领域的热点. 本文针对带有资源冲突的Seru在线并行调度问题进行研究, 即需要在有限的空间位置上安排随动态需求而构建的若干Seru, 以总加权完工时间最小为目标, 决策Seru的构建顺序及时间. 先基于平均延迟最短加权处理时间(Average delayed shortest weighted processing time, AD-SWPT)算法, 针对其竞争...
随着大规模定制的市场需求日趋显著, 赛如生产系统(Seru production system, SPS)应运而生, 逐渐成为研究和应用领域的热点. 本文针对带有资源冲突的Seru在线并行调度问题进行研究, 即需要在有限的空间位置上安排随动态需求而构建的若干Seru, 以总加权完工时间最小为目标, 决策Seru的构建顺序及时间. 先基于平均延迟最短加权处理时间(Average delayed shortest weighted processing time, AD-SWPT)算法, 针对其竞争...
2022, 48(2): 460-469.
doi: 10.16383/j.aas.c210029
摘要:
复杂场景分割是自动驾驶领域智能感知的重要任务, 对稳定性和高效性都有较高的要求. 由于一般的场景分割方法主要针对可见光图像, 分割效果非常依赖于图像获取时的光线与气候条件, 且大多数方法只关注分割性能, 忽略了计算资源. 本文提出一种基于可见光与红外热图像的轻量级双模分割网络(DMSNet), 通过提取并融合两种模态图像的特征得到最终分割结果. 考虑到不同模态特征空间存在较大差异, 直接融合将降低对特征的利用率, 本文提出了双路特征空间自适应(DPFSA)模块, 该模块能够自动学习特征间的差异从...
复杂场景分割是自动驾驶领域智能感知的重要任务, 对稳定性和高效性都有较高的要求. 由于一般的场景分割方法主要针对可见光图像, 分割效果非常依赖于图像获取时的光线与气候条件, 且大多数方法只关注分割性能, 忽略了计算资源. 本文提出一种基于可见光与红外热图像的轻量级双模分割网络(DMSNet), 通过提取并融合两种模态图像的特征得到最终分割结果. 考虑到不同模态特征空间存在较大差异, 直接融合将降低对特征的利用率, 本文提出了双路特征空间自适应(DPFSA)模块, 该模块能够自动学习特征间的差异从...
2022, 48(2): 470-478.
doi: 10.16383/j.aas.c190630
摘要:
运用数据挖掘技术进行铁路事故类型预测及成因分析, 对于建立铁路事故预警机制具有重要意义. 为此, 本文提出一种基于梯度提升决策树(Grandient boosting decision tree, GBDT)的铁路事故类型预测及成因分析算法. 针对铁路事故记录数据缺失的问题, 提出一种基于属性分布概率的补全算法, 最大程度保持原有数据分布, 从而降低数据缺失对事故类型预测造成的影响. 针对铁路事故记录数据类别失衡的问题, 提出一种集成的GBDT模型, 完成对事故类型的鲁棒性预测. 在此基础上, ...
运用数据挖掘技术进行铁路事故类型预测及成因分析, 对于建立铁路事故预警机制具有重要意义. 为此, 本文提出一种基于梯度提升决策树(Grandient boosting decision tree, GBDT)的铁路事故类型预测及成因分析算法. 针对铁路事故记录数据缺失的问题, 提出一种基于属性分布概率的补全算法, 最大程度保持原有数据分布, 从而降低数据缺失对事故类型预测造成的影响. 针对铁路事故记录数据类别失衡的问题, 提出一种集成的GBDT模型, 完成对事故类型的鲁棒性预测. 在此基础上, ...
2022, 48(2): 479-491.
doi: 10.16383/j.aas.c210015
摘要:
含多类型分布式电源的微电网已经成为了未来电力系统的重要发展方向, 其中风能和光能在降低化石能源消耗和二氧化碳排放等方面有着极大优势, 考虑二者之间强互补性的协同调度已被广泛研究. 但风/光协同调度的微电网多关注分钟级的调度或优化问题而非风/光波动下秒级的实时电流按容量比例精准分担, 简称电流均衡, 而精准电流均衡有助于可再生能源的高比例消纳. 因此, 本文提出了基于自适应动态规划的微电网电流均衡和电压恢复控制策略. 首先, 构建包含风电整流型电能变换器和光电升压型电能变换器的广义风光拓扑同胚升压...
含多类型分布式电源的微电网已经成为了未来电力系统的重要发展方向, 其中风能和光能在降低化石能源消耗和二氧化碳排放等方面有着极大优势, 考虑二者之间强互补性的协同调度已被广泛研究. 但风/光协同调度的微电网多关注分钟级的调度或优化问题而非风/光波动下秒级的实时电流按容量比例精准分担, 简称电流均衡, 而精准电流均衡有助于可再生能源的高比例消纳. 因此, 本文提出了基于自适应动态规划的微电网电流均衡和电压恢复控制策略. 首先, 构建包含风电整流型电能变换器和光电升压型电能变换器的广义风光拓扑同胚升压...
2022, 48(2): 492-503.
doi: 10.16383/j.aas.c210612
摘要:
针对当前高速铁路运营过程中存在的运输需求与运力资源不匹配现象, 面向负载均衡原理研究了路网条件下运能可适配的高速铁路旅客列车开行方案优化与评估方法. 首先, 针对路网条件下列车开行方案优化, 构建以提升经济效益、社会效益和网络负载均衡为目标的非线性混合整数规划模型, 并设计基于遗传算法和粒子群算法的两阶段混合搜索求解算法. 在此基础上, 考虑开行列车在高速铁路网中的抗干扰能力, 建立了面向网络化运营场景的开行方案综合评估指标体系, 揭示了故障场景下高速铁路网络性能的演化规律. 最后, 以实际高速...
针对当前高速铁路运营过程中存在的运输需求与运力资源不匹配现象, 面向负载均衡原理研究了路网条件下运能可适配的高速铁路旅客列车开行方案优化与评估方法. 首先, 针对路网条件下列车开行方案优化, 构建以提升经济效益、社会效益和网络负载均衡为目标的非线性混合整数规划模型, 并设计基于遗传算法和粒子群算法的两阶段混合搜索求解算法. 在此基础上, 考虑开行列车在高速铁路网中的抗干扰能力, 建立了面向网络化运营场景的开行方案综合评估指标体系, 揭示了故障场景下高速铁路网络性能的演化规律. 最后, 以实际高速...
2022, 48(2): 504-514.
doi: 10.16383/j.aas.c190747
摘要:
近年来, 基于深度学习的脑功能连接分类方法已成为一个研究热点. 为了进一步提高脑功能连接的分类准确率, 获得与疾病相关的鉴别性特征, 本文提出了一种基于原型学习与深度特征融合的脑功能连接分类方法. 该方法首先使用栈式自编码器从脑功能连接中提取从低层次到高层次的深度特征; 然后利用原型学习在自编码器的各隐层中提取表示样本类别信息的距离特征; 最后采用深度特征融合策略将这些距离特征融合, 并将该融合特征用于脑功能连接的类别标签预测. 在ABIDE数据集上的实验结果表明, 与其他同类方法相比, 该方法...
近年来, 基于深度学习的脑功能连接分类方法已成为一个研究热点. 为了进一步提高脑功能连接的分类准确率, 获得与疾病相关的鉴别性特征, 本文提出了一种基于原型学习与深度特征融合的脑功能连接分类方法. 该方法首先使用栈式自编码器从脑功能连接中提取从低层次到高层次的深度特征; 然后利用原型学习在自编码器的各隐层中提取表示样本类别信息的距离特征; 最后采用深度特征融合策略将这些距离特征融合, 并将该融合特征用于脑功能连接的类别标签预测. 在ABIDE数据集上的实验结果表明, 与其他同类方法相比, 该方法...
2022, 48(2): 515-530.
doi: 10.16383/j.aas.c190621
摘要:
迭代学习模型预测控制(Iterative learning model predictive control, ILMPC)具备较强的批次学习能力及突出的时域跟踪性能, 在批次过程控制中发挥了重要作用. 然而对于具有强非线性的快动态批次过程, 传统的迭代学习模型预测控制很难实现计算效率与跟踪精度之间的平衡, 这给其应用带来了挑战. 对此本文提出一种高效迭代学习预测函数控制策略, 将原非线性系统沿参考轨迹线性化得到二维跟踪误差预测模型, 并在控制器设计中补偿所产生的线性化误差, 构造优化目标函数为...
迭代学习模型预测控制(Iterative learning model predictive control, ILMPC)具备较强的批次学习能力及突出的时域跟踪性能, 在批次过程控制中发挥了重要作用. 然而对于具有强非线性的快动态批次过程, 传统的迭代学习模型预测控制很难实现计算效率与跟踪精度之间的平衡, 这给其应用带来了挑战. 对此本文提出一种高效迭代学习预测函数控制策略, 将原非线性系统沿参考轨迹线性化得到二维跟踪误差预测模型, 并在控制器设计中补偿所产生的线性化误差, 构造优化目标函数为...
2022, 48(2): 531-538.
doi: 10.16383/j.aas.c190645
摘要:
通过对目前现有的肺癌检测技术研究, 发现大部分研究人员主要针对肺癌(Computed tomography, CT)影像进行研究, 忽略了电子病历所隐藏的肺癌信息, 本文提出一种基于图像与文本相结合的肺癌分类方法, 从现有的基于深度学习的肺癌图像分类出发, 引入了电子病历信息, 使用Multi-head attention以及(Bi-directional long short-term memory, Bi-LSTM)对文本建模. 实验结果证明, 将电子病历信息引入到图像分类模型之后, 对模型...
通过对目前现有的肺癌检测技术研究, 发现大部分研究人员主要针对肺癌(Computed tomography, CT)影像进行研究, 忽略了电子病历所隐藏的肺癌信息, 本文提出一种基于图像与文本相结合的肺癌分类方法, 从现有的基于深度学习的肺癌图像分类出发, 引入了电子病历信息, 使用Multi-head attention以及(Bi-directional long short-term memory, Bi-LSTM)对文本建模. 实验结果证明, 将电子病历信息引入到图像分类模型之后, 对模型...
2022, 48(2): 539-553.
doi: 10.16383/j.aas.c210057
摘要:
针对退化过程呈现两阶段特征的一类随机退化设备, 现有剩余寿命预测方法不适用于测量间隔分布不均匀、监测数据的测量频率与历史数据频率不一致的情况, 并且忽略了自适应漂移的可变性. 鉴于此, 提出了一种新的考虑个体差异性的两阶段自适应Wiener过程剩余寿命预测模型与方法. 首先, 基于自适应Wiener过程分阶段构建随机退化模型, 在首达时间意义下推导出寿命和剩余寿命解析式. 然后, 结合Kalman滤波技术和期望最大化算法进行参数自适应更新, 同时利用赤池信息准则实现退化模型变点的辨识. 最后, ...
针对退化过程呈现两阶段特征的一类随机退化设备, 现有剩余寿命预测方法不适用于测量间隔分布不均匀、监测数据的测量频率与历史数据频率不一致的情况, 并且忽略了自适应漂移的可变性. 鉴于此, 提出了一种新的考虑个体差异性的两阶段自适应Wiener过程剩余寿命预测模型与方法. 首先, 基于自适应Wiener过程分阶段构建随机退化模型, 在首达时间意义下推导出寿命和剩余寿命解析式. 然后, 结合Kalman滤波技术和期望最大化算法进行参数自适应更新, 同时利用赤池信息准则实现退化模型变点的辨识. 最后, ...
2022, 48(2): 554-563.
doi: 10.16383/j.aas.c190433
摘要:
为提高神经网络对语音信号时域波形的直接处理能力, 提出了一种基于RefineNet的端到端语音增强方法. 本文构建了一个时频分析神经网络, 模拟语音信号处理中的短时傅里叶变换, 利用RefineNet网络学习含噪语音到纯净语音的特征映射. 在模型训练阶段, 用多目标联合优化的训练策略将语音增强的评价指标短时客观可懂度(Short-time objective intelligibility, STOI)与信源失真比(Source to distortion ratio, SDR)融入到训练的损失...
为提高神经网络对语音信号时域波形的直接处理能力, 提出了一种基于RefineNet的端到端语音增强方法. 本文构建了一个时频分析神经网络, 模拟语音信号处理中的短时傅里叶变换, 利用RefineNet网络学习含噪语音到纯净语音的特征映射. 在模型训练阶段, 用多目标联合优化的训练策略将语音增强的评价指标短时客观可懂度(Short-time objective intelligibility, STOI)与信源失真比(Source to distortion ratio, SDR)融入到训练的损失...
2022, 48(2): 564-571.
doi: 10.16383/j.aas.c190763
摘要:
行人重识别旨在跨监控设备下检索出特定的行人目标. 由于不同的行人可能具有相似的外观, 因此要求行人重识别模型能够捕捉到充足的细粒度特征. 本文提出一种融合属性特征的行人重识别的深度网络方法, 将行人重识别和属性识别集成在分类网络中, 进行端到端的多任务学习. 此外, 对于每张输入图片, 网络自适应地生成对应于每个属性的权重, 并将所有属性的特征以加权求和的方式结合起来, 与全局特征一起用于行人重识别任务. 全局特征关注行人的整体外观, 而属性特征关注细节区域, 两者相互补充可以对行人进行更全面的...
行人重识别旨在跨监控设备下检索出特定的行人目标. 由于不同的行人可能具有相似的外观, 因此要求行人重识别模型能够捕捉到充足的细粒度特征. 本文提出一种融合属性特征的行人重识别的深度网络方法, 将行人重识别和属性识别集成在分类网络中, 进行端到端的多任务学习. 此外, 对于每张输入图片, 网络自适应地生成对应于每个属性的权重, 并将所有属性的特征以加权求和的方式结合起来, 与全局特征一起用于行人重识别任务. 全局特征关注行人的整体外观, 而属性特征关注细节区域, 两者相互补充可以对行人进行更全面的...
2022, 48(2): 572-581.
doi: 10.16383/j.aas.c190879
摘要:
针对未知但有界扰动下约束非线性系统, 提出一种新的鲁棒经济模型预测控制(Economic model predictive control, EMPC)策略, 保证闭环系统对扰动输入具有输入到状态稳定性(Input-to-state stability, ISS). 基于微分对策原理, 分别优化经济目标函数和关于最优经济平衡点的鲁棒稳定性目标函数, 其中经济最优性与鲁棒稳定性是具有冲突的两个控制目标. 利用鲁棒稳定性目标最优值函数构造EMPC优化的隐式收缩约束, 建立鲁棒EMPC的递推可行性和闭...
针对未知但有界扰动下约束非线性系统, 提出一种新的鲁棒经济模型预测控制(Economic model predictive control, EMPC)策略, 保证闭环系统对扰动输入具有输入到状态稳定性(Input-to-state stability, ISS). 基于微分对策原理, 分别优化经济目标函数和关于最优经济平衡点的鲁棒稳定性目标函数, 其中经济最优性与鲁棒稳定性是具有冲突的两个控制目标. 利用鲁棒稳定性目标最优值函数构造EMPC优化的隐式收缩约束, 建立鲁棒EMPC的递推可行性和闭...
2022, 48(2): 582-593.
doi: 10.16383/j.aas.c190412
摘要:
阈值法分割在光学遥感图像分析中被得到广泛的应用, 然而传统阈值法也存在诸多局限性, 如对噪声敏感, 需人为设定类别数, 计算复杂度高等. 针对传统阈值法的局限性, 提出一种基于局部空间信息的可变类模糊阈值光学遥感图像分割方法. 首先, 以图像光谱的一阶矩为初始类中心, 利用二分法原理和区域间最大相似度准则来快速确定类别数及其中心. 然后, 通过岭形模糊隶属函数计算各像素点对不同类的隶属程度, 同时考虑到像素点的隶属度局部空间信息, 在隶属度域中定义一个模糊加权滤波器对各类的隶属度矩阵进行滤波, ...
阈值法分割在光学遥感图像分析中被得到广泛的应用, 然而传统阈值法也存在诸多局限性, 如对噪声敏感, 需人为设定类别数, 计算复杂度高等. 针对传统阈值法的局限性, 提出一种基于局部空间信息的可变类模糊阈值光学遥感图像分割方法. 首先, 以图像光谱的一阶矩为初始类中心, 利用二分法原理和区域间最大相似度准则来快速确定类别数及其中心. 然后, 通过岭形模糊隶属函数计算各像素点对不同类的隶属程度, 同时考虑到像素点的隶属度局部空间信息, 在隶属度域中定义一个模糊加权滤波器对各类的隶属度矩阵进行滤波, ...
2022, 48(2): 594-607.
doi: 10.16383/j.aas.c190539
摘要:
机器学习在视频质量评价(Video quality assessment, VQA)模型回归方面具有较大的优势, 能够较大地提高构建模型的精度. 基于此, 设计了合理的多层BP神经网络, 并以提取的失真视频的内容特征、编解码失真特征、传输失真特征及其视觉感知效应特征参数为输入, 通过构建的数据库中的样本对其进行训练学习, 构建了一个无参考VQA模型. 在模型构建中, 首先采用图像的亮度和色度及其视觉感知、图像的灰度梯度期望值、图像的模糊程度、局部对比度、运动矢量及其视觉感知、场景切换特征、比特率...
机器学习在视频质量评价(Video quality assessment, VQA)模型回归方面具有较大的优势, 能够较大地提高构建模型的精度. 基于此, 设计了合理的多层BP神经网络, 并以提取的失真视频的内容特征、编解码失真特征、传输失真特征及其视觉感知效应特征参数为输入, 通过构建的数据库中的样本对其进行训练学习, 构建了一个无参考VQA模型. 在模型构建中, 首先采用图像的亮度和色度及其视觉感知、图像的灰度梯度期望值、图像的模糊程度、局部对比度、运动矢量及其视觉感知、场景切换特征、比特率...
2022, 48(2): 608-614.
doi: 10.16383/j.aas.c190633
摘要:
为了促进智能新零售在线下业务场景的发展, 提高作为销售关键信息价格牌的识别精度. 本文对价格牌识别问题进行研究, 有效地提高了价格牌的识别精度, 并解决小数点定位不准确的难题. 通过深度卷积神经网络提取价格牌的深度语义表达特征, 将提取到的特征图送入多任务循环网络层进行编码, 然后根据解码网络设计的注意力机制解码出价格数字, 最后将多个分支的结果整合并输出完整价格. 本文所提出的方法能够非常有效地提高线下零售场景价格牌的识别精度, 并解决了一些领域难题如小数点的定位问题, 此外, 为了验证本文方...
为了促进智能新零售在线下业务场景的发展, 提高作为销售关键信息价格牌的识别精度. 本文对价格牌识别问题进行研究, 有效地提高了价格牌的识别精度, 并解决小数点定位不准确的难题. 通过深度卷积神经网络提取价格牌的深度语义表达特征, 将提取到的特征图送入多任务循环网络层进行编码, 然后根据解码网络设计的注意力机制解码出价格数字, 最后将多个分支的结果整合并输出完整价格. 本文所提出的方法能够非常有效地提高线下零售场景价格牌的识别精度, 并解决了一些领域难题如小数点的定位问题, 此外, 为了验证本文方...
2022, 48(2): 615-626.
doi: 10.16383/j.aas.c190619
摘要:
本文根据元胞自动机模型划分方法, 将二维图像分解为2×2矩阵单元结构. 提出了几种逻辑运算式, 用以分类由黑白二值点构成的2×2矩阵图形. 通过CNN神经网络的多层结构形式, 分析了金字塔结构逻辑在相似的组合形式下, 对二值图形边缘检测和池化的功能. 通过同步脉冲形式能将灰度图像, 分解为多个时间维度的二值图形, 方便多层金字塔逻辑运算处理. 分析了如何采用延时继电器使金字塔结构逻辑具有记忆的特性. 讨论了3×3输入金字塔模型, 在不规律脉冲情况下, 通过逻辑运算对线性交点检测的可能.
本文根据元胞自动机模型划分方法, 将二维图像分解为2×2矩阵单元结构. 提出了几种逻辑运算式, 用以分类由黑白二值点构成的2×2矩阵图形. 通过CNN神经网络的多层结构形式, 分析了金字塔结构逻辑在相似的组合形式下, 对二值图形边缘检测和池化的功能. 通过同步脉冲形式能将灰度图像, 分解为多个时间维度的二值图形, 方便多层金字塔逻辑运算处理. 分析了如何采用延时继电器使金字塔结构逻辑具有记忆的特性. 讨论了3×3输入金字塔模型, 在不规律脉冲情况下, 通过逻辑运算对线性交点检测的可能.