2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

高阶马尔科夫随机场及其在场景理解中的应用

余淼 胡占义

徐森, 皋军, 花小朋, 李先锋, 徐静. 一种改进的自适应聚类集成选择方法. 自动化学报, 2018, 44(11): 2103-2112. doi: 10.16383/j.aas.2018.c170376
引用本文: 余淼, 胡占义. 高阶马尔科夫随机场及其在场景理解中的应用. 自动化学报, 2015, 41(7): 1213-1234. doi: 10.16383/j.aas.2015.c140684
XU Sen, GAO Jun, HUA Xiao-Peng, LI Xian-Feng, XU Jing. An Improved Adaptive Cluster Ensemble Selection Approach. ACTA AUTOMATICA SINICA, 2018, 44(11): 2103-2112. doi: 10.16383/j.aas.2018.c170376
Citation: YU Miao, HU Zhan-Yi. Higher-order Markov Random Fields and Their Applications in Scene Understanding. ACTA AUTOMATICA SINICA, 2015, 41(7): 1213-1234. doi: 10.16383/j.aas.2015.c140684

高阶马尔科夫随机场及其在场景理解中的应用

doi: 10.16383/j.aas.2015.c140684
基金项目: 

国家高技术研究发展计划(863计划) (2013AA122301), 国家自然科学基金(61273280, 61333015)资助

详细信息
    作者简介:

    余淼中原工学院讲师, 中国科学院自动化研究所博士研究生. 分别于2004 年和2007 获得西南交通大学管理学学士和工学硕士学位. 主要研究方向为场景理解和三维重建.E-mail: myu@nlpr.ia.ac.cn

Higher-order Markov Random Fields and Their Applications in Scene Understanding

Funds: 

Supported by National High Technology Research and Development Program of China (863 Program) (2013AA122301) and National Natural Science Foundation of China (61273280, 61333015)

  • 摘要: 与传统的一阶马尔科夫随机场(Markov random field, MRF)相比, 高阶马尔科夫随机场能够表达更加复杂的定性和统计性先验信息, 在模型的表达能力上具有更大的优势. 但高阶马尔科夫随机场对应的能量函数优化问题更为复杂. 同时其模型参数数目的爆炸式增长使得选择合适的模型参数也成为了一个非常困难的问题. 近年来, 学术界在高阶马尔科夫随机场的能量模型的建模、优化和参数学习三个方面进行了深入的探索, 取得了很多有意义的成果. 本文首先从这三个方面总结和介绍了目前在高阶马尔科夫随机场研究上取得的主要成果, 然后介绍了高阶马尔科夫随机场在图像理解和三维场景理解中的应用现状.
  • 技术创新是社会经济发展的核心驱动力.继以物联网、云计算、大数据和移动互联网为代表的信息技术之后, 以深度学习为代表的人工智能技术蓬勃发展, 被公认是社会经济发展的新动能和新引擎, 有望在农业生产、工业制造、经济金融、社会管理等众多领域产生颠覆性变革.生成式对抗网络(Generative adversarial networks, GAN)作为一种新的生成式模型, 已成为深度学习与人工智能技术的新热点, 在图像与视觉计算、语音语言处理、信息安全等领域中展现出巨大的应用和发展前景.

    生成式对抗网络GAN是由Goodfellow等[1]在2014年提出的一种生成式模型.其核心思想来源于博弈论中的二人零和博弈.基本的GAN模型在结构上由一个生成器(Generator)和一个判别器(Discriminator)组成, 如图 1所示.从某个概率分布$p_{z}$ (例如高斯分布)中采样随机变量$z$, 作为生成器$G$的输入, 经过$G$的非线性映射, 输出信号$G(z)$.取决于$G$的结构和计算复杂性, 从$z$到$G(z)$一般经过高度复杂的非线性变换, 使得随机变量$G(z)$具备拟合高度复杂分布的能力.不失一般性, 将$G(z)$称为生成数据(或伪数据), 相应地将来自物理世界的数据$x$称为真实数据.判别器$D$以$G(z)$或$x$为输入, 通过计算其属于真实数据的概率, 判断输入数据是来自于真实数据还是生成数据.由于$G$和$D$一般采用高度非线性并且可微的深度神经网络结构, 因而均可以采用端对端学习策略进行训练.具体而言, 在训练$G$和$D$时, 采用对抗学习策略, 使二者的训练目标相反. $D$的目标是最大化对数似然函数以判断$G(z)$和$x$的来源, 将$G(z)$判断为生成数据, 将$x$判断为真实数据.与之相对的是, $G$的目标是最小化对数似然函数, 使$G(z)$的分布$p_{g}$逼近真实数据$x$的分布$p_{\rm data}$.不断迭代此对抗训练过程, 交替更新判别器$D$和生成器$G$的参数, 使$D$和$G$的性能不断提高; 当达到平衡状态时, 则认为$G(z)$学习到了真实数据$x$的分布空间, 此时$G(z)$和$x$在分布上不具有差异性, 判别器$D$无法对数据来源做出正确的判断.

    图 1  GAN的基本结构和计算流程
    Fig. 1  Basic structure and computation procedure of GAN

    Goodfellow等[1]从理论上证明了当GAN模型收敛时, 生成数据具有和真实数据相同的分布.但是在实践中, GAN的收敛性和生成数据的多样性通常难以保证[2].主要存在两个问题:生成器梯度消失和模式坍塌(Mode collapse).梯度消失是指由于生成器$G$和判别器$D$的训练不平衡, 判别器$D$的性能很好, 对生成数据$G(z)$和真实数据$x$能够做出完美的分类, 那么$D$对应的误差损失将很小, 进而反向传播到$G$的梯度值很小, 使得生成器$G$不能得到有效的训练.模式坍塌是指对于任意随机变量$z$, 生成器$G$仅能拟合真实数据分布$p_{\rm data}$的部分模式, 虽然$G(z)$与真实数据$x$在判别器$D$难以区分, 但是生成器$G$无法生成丰富多样的数据.

    为了解决GAN模型存在的问题, 国内外学者提出了许多衍生模型[3].例如, Arjovsky等[4]提出了Wasserstein GAN, 用Earth-mover距离代替Jensen-Shannon散度, 来度量生成数据分布与真实数据分布之间的差异, 在很大程度上缓解了梯度消失和模式坍塌问题. 图 2显示了arXiv上GAN论文数量(以Generative adversarial networks、Generative adversarial nets和Adversarial learning为关键词检索得到)的变化趋势, 反映了GAN的研究热度变化.可以看出, Goodfellow等提出GAN后的两年内, 相关论文的数量并不多, 但是从2016年下半年开始, 论文数量快速增长.

    图 2  arXiv上GAN论文数量的变化趋势
    Fig. 2  Trend of the number of GAN papers published on arXiv

    另外, 有许多衍生模型是从应用的角度提出的.例如, 图像到图像转换具有广泛的应用, Zhu等[5]提出了CycleGAN, 它包括两个生成器和两个判别器, 在对抗损失的基础上增加了循环一致性损失, 用于训练非配对的图像到图像转换模型.目前, GAN已经被广泛应用于计算机视觉、语音语言处理、信息安全等领域. 图 3显示了arXiv上GAN论文所属的学科领域.可以看出, 论文最多的学科领域是计算机视觉(cs.CV), 说明GAN目前主要用于图像处理与计算机视觉; 其次是机器学习(cs.LG和stat.ML)、计算与语言(cs.CL)、人工智能(cs.AI)、语音(cs.SD)、语音处理(eess.AS)、机器人(cs.RO)、密码与安全(cs.CR)、多媒体(cs.MM)等.

    图 3  arXiv上GAN论文所属的TOP 10学科领域
    Fig. 3  Top 10 subject categories of the GAN papers published on arXiv

    GAN的初始目的是基于大量的无标记数据无监督地学习生成器$G$, 具备生成各种形态(图像、语音、语言等)数据的能力.随着研究的深入与发展, 以生成图像为例, GAN能够生成百万级分辨率的高清图像[6].实际上, GAN生成数据并不是无标记真实数据的单纯复现, 而是具备一定的数据内插和外插作用, 可以作为一种数据增广方式, 结合其他数据更好地训练各种学习模型.进而, 通过在生成器的输入同时包括随机变量$z$和隐码$c$并最大化生成图像与隐码$c$的互信息, InfoGAN能够揭示复杂数据中隐含的分布规律, 实现数据的解释化表达[7].因而, GAN不仅可以用于探索复杂数据的潜在规律, 还能够生成高质量的生成样本以作为真实数据的有效补充, 为学习智能模型提供了新的视角和数据基础.

    对于条件GAN模型, 生成网络的输入往往被定义为样本的类别甚至其他形式(模态)的数据.到目前为止, 已经研究了根据文本描述生成图像[8], 进行交互式图像编辑[9], 从低分辨率图像生成高分辨率图像[10], 预测视频的未来帧[11], 将仿真图像转换为真实风格的图像[12], 实现通用的图像到图像转换[5], 对真实图像的光照和天气条件进行变换[13], 从二维图像生成物体的三维模型等[14].数据形式(模态)的转换可以进一步带来不同模态之间数据的可复用、模型和知识的迁移, 创造更高水平的智能.例如, SimGAN能够将仿真图像转换为更具真实感的图像, 同时保持仿真图像的标注信息不变, 利用转换后的图像数据来训练视线估计和手势估计模型, 使模型精度得到大幅提升[12].

    更进一步, 由于GAN引入了对抗学习机制, 在训练生成器产生更高质量数据的过程中, 本身就会创造新的智能.例如, 将语义分割卷积神经网络作为GAN的生成器, 用判别器来判断分割图是来自分割网络还是来自真实标注, 可以引入更高阶的一致性约束, 提高语义分割的精度[15]; 在本专刊中, 郑文博等撰写的"基于贝叶斯生成对抗网络的背景消减算法"利用GAN的对抗学习机制来训练背景消减神经网络, 将一批输入图像直接转换成一批前景/背景分割结果, 在公共测试集上取得了良好的性能; MalGAN能够主动生成具有对抗性的病毒代码样本, 攻击黑盒病毒检测模型, 有利于提高反病毒软件的性能[16].总之, GAN在对抗样本、数据增广、迁移学习和创造智能等方面都展现出巨大的潜力, 已成为当前的深度学习与人工智能研究中关注的热点.

    GAN作为一种有效的生成数据和创造智能的模型, 与平行智能密切相关[17].平行智能强调虚实互动, 其载体是基于ACP (Artificial systems, computational experiments, and parallel execution)的平行系统[18].利用人工系统来建模和表示实际系统, 通过计算实验来分析和评估各种计算模型, 借助平行执行来引导实际系统向着理想的目标状态逼近.平行智能包括平行视觉、平行学习等分支.

    平行视觉[19-20]是ACP理论在视觉计算领域的推广.平行视觉利用人工场景来模拟和表示复杂挑战的实际场景, 使采集和标注大规模多样性的图像数据集成为可能, 通过计算实验进行视觉算法的设计与评估, 最后借助平行执行来在线优化视觉系统, 实现对复杂环境的感知与理解.利用GAN的半监督/无监督学习能力, 能够生成大规模、多样性的图像数据[12-13], 有利于对视觉模型进行充分的训练与评估, 提高视觉模型在复杂场景下的运行可靠性.平行学习[21]是一个新型的机器学习理论框架.首先从原始数据中选取特定的"小数据", 输入到软件定义的人工系统中, 并由人工系统产生大量新的数据; 然后这些人工数据和特定的原始小数据一起构成解决复杂问题所需要学习的"大数据"集合, 通过计算实验和平行执行来设计优化机器学习模型, 得到应用于某些具体场景或任务的"精准知识". GAN能够生成大量新的数据, 作为训练数据的一部分, 提高机器学习模型的性能.简言之, 可以把GAN看作真与假的平行, 把平行智能看作虚与实的平行. GAN必将促进平行智能理论的发展!

    为促进我国生成式对抗网络(GAN)相关理论、方法、技术与应用研究的开展, 及时反映我国学者在相关领域的最新研究进展, 我们特组织本专刊, 针对GAN的基础理论与方法、结构优化和训练稳定性、对抗机制以及在各领域的应用等重要问题, 面向国内研究者征文.本专刊共收到38篇稿件.经过同行评议, 我们录用了其中的13篇稿件, 研究内容涉及GAN的新结构、因果关系抽取、多视图学习与重构、低秩图像生成等基础研究; GAN在图像识别、人脸表情识别、背景消减等计算机视觉领域的应用基础研究; 以及在语言模型数据增强、自能源混合建模与参数辨识、原油总氢物性预测等其他领域的应用基础研究.

    首先, 林懿伦等撰写的综述文章"人工智能研究的新前线:生成式对抗网络"概括了GAN的基本思想, 对近年来相关的理论与应用研究进行了梳理, 总结了常见的GAN网络结构与训练方法、博弈形式和集成方法, 并对一些应用场景进行了介绍.在此基础上, 对GAN发展的内在逻辑进行了归纳总结.

    针对GAN的生成模型学习效率低、判别模型易出现梯度消失等问题, 王功明等撰写的"一种能量函数意义下的生成式对抗网络"提出一种能量函数意义下基于重构误差的生成式对抗网络(Energy reconstruction error GAN, E-REGAN).将自适应深度信念网络作为生成模型, 来加快学习速度; 将自适应深度自编码器作为判别模型, 用重构误差作为能量函数来表征判别模型的性能, 能量越小表示GAN学习过程越趋近于纳什均衡的平衡点.在MNIST和CIFAR-10数据集上的实验结果表明, 与同类模型相比, E-REGAN在学习速度和数据生成能力两方面都有较大提高.

    GAN的学习目标是完整拟合真实样本的分布, 然而在实践中, 真实样本分布的复杂程度难以预计, 容易发生模式坍塌.为了提高无监督条件下的GAN生成能力, 减少模式坍塌, 张龙等撰写的"协作式生成对抗网络"强调不同模式之间既有差异又有联系, 提出一种新的协作式生成网络结构.通过构建多个生成模型, 在它们之间引入协作机制, 使得生成模型在训练过程中能够相互学习, 提高模型对真实数据的拟合能力.实验表明, 该模型在二维图像生成方面有显著的效果, 协作机制可以加快模型收敛速度, 提高训练效率, 还能消除损失函数噪声, 在三维模型生成方面也产生了一定的效果.通过调整模型参数, 能够有效抑制模式坍塌.

    因果关系是一种重要的关系类型, 在事件预测、情景生成、问答、文本蕴涵等许多任务中具有重要的应用价值.现有的因果关系抽取方法大多需要繁琐的特征选择, 并且严重依赖知识库.为此, 冯冲等撰写的"融合对抗学习的因果关系抽取"利用GAN的对抗学习特性, 将带注意力机制的双向门控循环单元神经网络与对抗学习相融合, 在因果关系增强模型中引入因果关系解释语句.通过重新定义生成模型和判别模型, 基本的因果关系抽取网络能够与判别网络形成对抗, 进而从因果关系解释信息中获得高区分度的特征.实验结果验证了该方法的有效性和优越性.

    综合多个甚至所有的角度往往有助于对事物的全面和深入理解, 然而在实际应用中, 完整视图数据会导致巨大的获取成本.为了从已有视图构建事物的完整视图, 孙亮等撰写的"基于生成对抗网络的多视图学习与重构算法"提出一种基于GAN的多视图学习与重构算法, 利用已知单一视图, 通过生成模型构建其他视图.提出新型表征学习算法, 将同一实例的任意视图都能映射到相同的表征向量, 并保证其包含实例的完整重构信息.为构建给定事物的多种视图, 提出基于GAN的重构算法, 在生成模型中加入表征信息, 保证了生成视图数据与源视图相匹配.实验表明该算法取得了很好的视图重构性能.

    低秩纹理模型是图像处理领域中的一个重要纹理模型, 借助于纹理的低秩性可以对受到各种变换干扰的图像进行校正.针对低秩图像校正问题, 赵树阳等撰写的"基于生成对抗网络的低秩图像生成方法"提出了一种由原始图像直接生成低秩图像的生成式对抗网络(Low-rank generative adversarial network, LR-GAN).该方法将传统的无监督学习的低秩纹理映射算法(Transform invariant low-rank textures, TILT)作为引导加入到网络中来辅助判别器, 使网络整体达到无监督学习的效果, 并且使低秩对抗对在生成器和判别器上都能够学习到低秩表示.为了保证生成的图像既有较高的质量又有相对较低的秩, 同时考虑到低秩约束条件下优化问题的不易解决, 在经过一定阶段的TILT引导后, 设计并加入了低秩梯度滤波层来逼近网络的低秩最优解.实验表明, LR-GAN取得了很好的低秩图像生成效果.

    在漫画绘制的过程中, 按草稿绘制出线条干净的线稿是一个很重要的环节.现有的草图简化方法具有一定的线条简化能力, 但是由于草图绘制方式的多样性以及画面复杂凌乱程度的不同, 这些方法的适用范围和效果有限.为此, 卢倩雯等撰写的"基于生成对抗网络的漫画草稿图简化"提出一种基于GAN的草图简化方法, 将条件随机场和最小二乘生成对抗网络相结合, 搭建草图简化的深度卷积神经网络模型, 通过生成器和判别器之间的零和博弈与条件约束, 得到更加接近于真实线稿的简化图.

    深度卷积生成对抗网络在传统GAN的基础上引入卷积神经网络作为模型骨架结构, 条件生成对抗网络在GAN的基础上扩展为条件模型.唐贤伦等撰写的"基于条件深度卷积生成对抗网络的图像识别方法"结合深度卷积生成对抗网络和条件生成对抗网络的优点, 建立了条件深度卷积生成对抗网络模型.利用卷积神经网络强大的特征提取和表达能力, 加以条件辅助生成样本, 将此结构优化改进后, 应用于MNIST、CIFAR-10等图像识别任务中, 有效提高了识别准确率.

    让机器能够识别人的表情, 是人机交互的关键.在自然交流中, 人的情绪表达往往伴随着丰富的头部姿态和肢体动作, 使得提取有效的表情特征非常困难.现有的表情识别方法大多基于通用的人脸特征表示和识别算法, 很少考虑表情识别和身份识别的差异, 使得算法不够鲁棒.为此, 姚乃明等撰写的"基于生成式对抗网络的鲁棒人脸表情识别"提出一种对人脸局部遮挡图像进行用户无关表情识别的方法.该方法包括一个基于Wasserstein GAN的人脸图像生成网络, 能够为图像中的遮挡区域生成上下文一致的补全图像; 还包括一个表情识别网络, 在表情识别和身份识别任务之间建立对抗关系, 提取用户无关的表情特征并推断表情类型.该方法在公共数据集上取得了较高的表情识别准确率.

    背景消减是计算机视觉领域的一个重要研究方向.实际环境中存在的光照变化、阴影、背景运动等因素对背景消减提出了严重挑战.为此, 郑文博等撰写的"基于贝叶斯生成对抗网络的背景消减算法"提出一种基于GAN的背景消减算法.首先利用中值滤波算法进行背景数据的获取, 然后基于贝叶斯GAN建立背景消减模型, 采用深度卷积神经网络构建贝叶斯GAN的生成器和判别器, 利用GAN的对抗学习机制来进行模型训练.训练后的生成器能够将每个像素分类为前景或背景, 有效解决了光照变化、非静止背景、鬼影(Ghost)等问题.

    基于最大似然估计(Maximum likelihood estimation, MLE)的语言模型数据增强方法存在暴露偏差问题, 无法生成具有长时语义信息的采样数据.为此, 张一珂等撰写的"基于对抗训练策略的语言模型数据增强技术"提出一种基于对抗训练策略的语言模型数据增强方法, 通过一个卷积神经网络判别模型判断生成数据的真伪, 引导递归神经网络生成模型学习真实数据的分布.语言模型的数据增强问题实质上是离散序列的生成问题.为了将判别模型的误差通过反向传播算法回传到生成模型, 该方法将离散序列生成问题表示为强化学习问题, 利用判别模型的输出作为奖励对生成模型进行优化, 采用蒙特卡洛搜索算法对生成序列的中间状态进行评价.实验表明, 在有限文本数据条件下, 随着训练数据量的增加, 该方法可以降低识别字错误率, 优于基于MLE的数据增强方法.

    自能源是能源互联网的子单元, 旨在实现能量间的双向传输及灵活转换.由于自能源在不同工况下的运行特性存在很大差异, 现有方法不能对其进行精确的参数辨识.为此, 孙秋野等撰写的"基于GAN技术的自能源混合建模与参数辨识方法"提出了一种基于GAN的数据和机理混合驱动方法, 对自能源模型进行参数辨识.将GAN模型中训练数据与专家经验结合, 进行模糊分类, 解决了自能源在不同工况下的模型切换问题.通过应用含策略梯度反馈的GAN技术对模型进行训练, 解决了自能源中输出序列离散的问题.仿真实验结果表明, 提出的模型具有较高的辨识精度和更好的推广性, 能够有效地拟合系统在不同工况下的状态变化.

    针对原油物性的回归预测问题, 郑念祖等撰写的"基于Regression GAN的原油总氢物性预测方法"提出一种回归生成对抗网络(Regression GAN, RGAN)结构, 该结构在传统GAN的生成模型和判别模型的基础上增加了一个回归模型.通过判别模型与生成模型之间的对抗学习, 使得判别模型提取了原油物性核磁共振氢谱谱图的一系列潜在特征.回归模型和判别模型共享首层潜在特征, 即样本空间的浅层表达, 有利于提高回归模型的预测精度及稳定性.通过在生成模型增加互信息约束, 并采用回归模型的均方误差损失函数来估计互信息下界, 使得生成模型产生更加接近于真实的样本.实验结果表明, RGAN有效提高了原油总氢物性的预测精度及稳定性.

    本专刊的顺利完成, 离不开作者、审稿专家和《自动化学报》编辑们的大力支持与协助.我们在此表示诚挚的感谢, 并希望本专刊对我国生成式对抗网络与人工智能领域的研究起到积极的促进作用.

  • [1] Li S Z. Markov Random Field Modeling in Image Analysis. London: Springer, 2009.
    [2] Blake A, Kohli P, Rother C. Markov Random Fields for Vision and Image Processing. Cambridge: MIT Press, 2011.
    [3] Blake A, Kohli P, Rother C [Author], Xie Zhao [Translator]. Markov Random Fields for Vision and Image Processing. Beijing: Science Press, 2014.(Blake A, Kohli P, Rother C [著], 谢昭 [译]. Markov随机场在视觉和图像处理中的应用. 北京: 科学出版社, 2014.)
    [4] Boykov Y, Veksler O, Zabih R. Fast approximate energy minimization via graph cuts. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(11): 1222-1239
    [5] Kolmogorov V, Zabin R. What energy functions can be minimized via graph cuts? IEEE Transactions on Pattern Analysis and Machine Intelligence, 2004, 26(2): 147-159
    [6] Felzenszwalb P F, Huttenlocher D P. Efficient belief propagation for early vision. International Journal of Computer Vision, 2006, 70(1): 41-54
    [7] Weiss Y, Freeman W T. On the optimality of solutions of the max-product belief-propagation algorithm in arbitrary graphs. IEEE Transactions on Information Theory, 2001, 47(2): 736-744
    [8] Murphy K P, Weiss Y, Jordan M I. Loopy belief propagation for approximate inference: an empirical study. In: Proceedings of the 15th Conference on Uncertainty in Artificial Intelligence. Morgan Kaufmann Publishers Inc., 1999. 467-475
    [9] Wainwright M J, Jaakkola T S, Willsky A S. Map estimation via agreement on trees: message-passing and linear programming. IEEE Transactions on Information Theory, 2005, 51(11): 3697-3717
    [10] Kolmogorov V. Convergent tree-reweighted message passing for energy minimization. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2006, 28(10): 1568-1583
    [11] Kolmogorov V, Wainwright M J. On the optimality of tree-reweighted max-product message-passing. In: Proceedings of the 21st Conference on Uncertainty in Artificial Intelligence. 2012.
    [12] Wainwright M J, Jordan M I. Graphical models, exponential families, and variational inference. Foundations and Trends in Machine Learning, 2008, 1(1-2): 1-305
    [13] Szeliski R, Zabih R, Scharstein D, Veksler O, Kolmogorov V, Agarwala A, Tappen M, Rother C. A comparative study of energy minimization methods for Markov random fields with smoothness-based priors. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008, 30(6): 1068-1080
    [14] Koller D, Friedman N. Probabilistic Graphical Models: Principles and Techniques. Cambridge: MIT Press, 2009.
    [15] Bishop C. Pattern Recognition and Machine Learning. New York: Springer, 2006.
    [16] Jordan M I, Ghahramani Z, Jaakkola T S, Saul L K. An introduction to variational methods for graphical models. Machine Learning, 1999, 37(2): 183-233
    [17] Lauritzen S L. Graphical Models. Oxford: Oxford University Press, 1996.
    [18] Besag J. Spatial interaction and the statistical analysis of lattice systems. Journal of the Royal Statistical Society. Series B (Methodological), 1974, 36(2): 192-236
    [19] Loeliger H A. An introduction to factor graphs. IEEE Signal Processing Magazine, 2004, 21(1): 28-41
    [20] Kschischang F R, Frey B J, Loeliger H A. Factor graphs and the sum-product algorithm. IEEE Transactions on Information Theory, 2001, 47(2): 498-519
    [21] Szeliski R, Zabih R, Scharstein D, Veksler O, Kolmogorov V, Agarwala A, Tappen M, Rother C. A comparative study of energy minimization methods for Markov random fields. In: Proceedings of the 9th European Conference on Computer Vision, Computer Vision-ECCV 2006. Graz, Austria: Springer, 2006. 16-29
    [22] Greig D M, Porteous B T, Seheult A H. Exact maximum a posteriori estimation for binary images. Journal of the Royal Statistical Society. Series B (Methodological), 1989, 51(2): 271-279
    [23] Tappen M F, Freeman W T. Comparison of graph cuts with belief propagation for stereo, using identical MRF parameters. In: Proceedings of the 9th IEEE International Conference on Computer Vision, 2003. Nice, France: IEEE, 2003. 900-906
    [24] Woodford O J, Torr P H S, Reid I D, Fitzgibbon A W. Global stereo reconstruction under second order smoothness priors. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2008). Anchorage, AK: IEEE, 2008. 1-8
    [25] Vicente S, Kolmogorov V, Rother C. Graph cut based image segmentation with connectivity priors. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2008). Anchorage, AK: IEEE, 2008. 1-8
    [26] Nowozin S, Lampert C H. Global connectivity potentials for random field models. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition(CVPR 2009). Miami, FL: IEEE, 2009. 818-825
    [27] Bleyer M, Rother C, Kohli P, Scharstein D, Sinha S. Object stereo ---joint stereo matching and object segmentation. In: Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI: IEEE, 2011. 3081-3088
    [28] Lempitsky V, Kohli P, Rother C, Sharp T. Image segmentation with a bounding box prior. In: Proceedings of the 12th IEEE International Conference on Computer Vision. Kyoto: IEEE, 2009. 277-284
    [29] Kohli P, Kumar M P, Torr P H S. P3 & beyond: move making algorithms for solving higher order functions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(9): 1645-1656
    [30] Kohli P, Kumar M P, Torr P H S. P3 & beyond: solving energies with higher order cliques. In: Proceedings of the 2007 IEEE Conference on Computer Vision and Pattern Recognition (CVPR'07). Minneapolis, MN: IEEE, 2007. 1-8
    [31] Kohli P, Ladický L, Torr P H S. Robust higher order potentials for enforcing label consistency. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2008). Anchorage, AK: IEEE, 2008. 1-8
    [32] Kohli P, Ladický L, Torr P H S. Robust higher order potentials for enforcing label consistency. International Journal of Computer Vision, 2009, 82(3): 302-324
    [33] Ladický L, Russell C, Kohli P, Torr P H S. Associative hierarchical random fields. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(6): 1056-1077
    [34] Ladický L, Russell C, Kohli P, Torr P H S. Associative hierarchical CRFs for object class image segmentation. In: Proceedings of the 12th IEEE International Conference on Computer Vision. Kyoto: IEEE, 2009. 739-746
    [35] Rother C, Kohli P, Feng W, Jia J Y. Minimizing sparse higher order energy functions of discrete variables. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition(CVPR 2009). Miami, FL: IEEE, 2009. 1382-1389
    [36] Komodakis N, Paragios N. Beyond pairwise energies: efficient optimization for higher-order MRFs. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2009). Miami, FL: IEEE, 2009. 2985-2992
    [37] Boix X, Gonfaus J M, van de Weijer J, Bagdanov A D, Serrat J, González J. Harmony potentials. International Journal of Computer Vision, 2012, 96(1): 83-102
    [38] Gonfaus J M, Boix X, Van de Weijer J, Bagdanov A D, Serrat J, Gonzalez J. Harmony potentials for joint classification and segmentation. In: Proceedings of the 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). San Francisco, CA: IEEE, 2010. 3280-3287
    [39] Ladický L, Russell C, Kohli P, Torr P H S. Graph cut based inference with co-occurrence statistics. In: Proceedings of the 11th European Conference on Computer Vision, Computer Vision-ECCV 2010. Heraklion, Crete, Greece: Springer, 2010. 239-253
    [40] Ladický L, Russell C, Kohli P, Torr P H S. Inference methods for CRFs with co-occurrence statistics. International Journal of Computer Vision, 2013, 103(2): 213-225
    [41] Werner T. High-arity interactions, polyhedral relaxations, and cutting plane algorithm for soft constraint optimisation (MAP-MRF). In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2008). Anchorage, AK: IEEE, 2008. 1-8
    [42] Lim Y, Jung K, Kohli P. Energy minimization under constraints on label counts. In: Proceedings of the 11th European Conference on Computer Vision, Computer Vision-ECCV 2010. Heraklion, Crete, Greece: Springer, 2010. 535-551
    [43] Delong A, Osokin A, Isack H N, Boykov Y. Fast approximate energy minimization with label costs. In: Proceedings of the 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). San Francisco, CA: IEEE, 2010. 2173-2180
    [44] Delong A, Osokin A, Isack H N, Boykov Y. Fast approximate energy minimization with label costs. International Journal of Computer Vision, 2012, 96(1): 1-27
    [45] Shekhovtsov, Kohli P, Rother C. Curvature prior for mrf-based segmentation and shape inpainting. In: Proceedings of the Joint 34th DAGM and 36th OAGM, Pattern Recognition, Lecture Notes in Computer Science Volume 7476. Berlin Heidelberg: Springer, 2012. 41-51
    [46] Woodford O, Torr P, Reid I, Fitzgibbon A. Global stereo reconstruction under second-order smoothness priors. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009, 31(12): 2115-2128
    [47] Silberman N, Hoiem D, Kohli P, Fergus R. Indoor segmentation and support inference from RGBD images. In: Proceedings of the 12th European Conference on Computer Vision, Computer Vision-ECCV 2012. Florence, Italy: Springer, 2012. 746-760
    [48] Ladický L, Sturgess P, Russell C, Sengupta S, Bastanlar Y, Clocksin W, Torr P H S. Joint optimization for object class segmentation and dense stereo reconstruction. International Journal of Computer Vision, 2012, 100(2): 122-133
    [49] Kim B S, Sun M, Kohli P, Savarese S. Relating things and stuff by high-order potential modeling. In: Proceedings of the 2012 Computer Vision-ECCV. Workshops and Demonstrations. Berlin, Heidelberg: Springer, 2012. 293-304
    [50] Sun M, Kim B S, Kohli P, Savarese S. Relating things and stuff via object property interactions. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2014, 36(7): 1370-1383
    [51] Ladický L, Sturgess P, Alahari K, Russell C, Torr P H S. What, where and how many? Combining object detectors and CRFs. In: Proceedings of the 11th European Conference on Computer Vision, Computer Vision-ECCV 2010. Heraklion, Crete, Greece: Springer, 2010. 424-437
    [52] Brostow G J, Shotton J, Fauqueur J, Cipolla R. Segmentation and recognition using structure from motion point clouds. In: Proceedings of the 10th European Conference on Computer Vision, Computer Vision-ECCV 2008. Marseille, France: Springer, 2008. 44-57
    [53] Floros G, Leibe B. Joint 2d-3d temporally consistent semantic segmentation of street scenes. In: Proceedings of the 2012 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI: IEEE, 2012. 2823-2830
    [54] Shotton J, Winn J, Rother C, Criminisi A. Textonboost for image understanding: multi-class object recognition and segmentation by jointly modeling texture, layout, and context. International Journal of Computer Vision, 2009, 81(1): 2-23
    [55] Shotton J, Winn J, Rother C, Criminisi A. Textonboost: joint appearance, shape and context modeling for multi-class object recognition and segmentation. In: Proceedings of the 9th European Conference on Computer Vision, Computer Vision-ECCV 2006. Graz, Austria: Springer, 2006. 1-15
    [56] Chris R, L'ubor L, Pushmeet K, Philip HS T. Exact and approximate inference in associative hierarchical networks using graph cuts. arXiv preprint arXiv: 1203.3512, 2012.
    [57] Russell C, Ladický L, Kohli P, Torr P H S. Exact and approximate inference in associative hierarchical networks using graph cuts. In: UAI. AUAI Press, 2010. 501-508
    [58] Kohli P, Kumar M P. Energy minimization for linear envelope MRFs. In: Proceedings of the 2010 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). San Francisco, CA: IEEE, 2010. 1863-1870
    [59] Gould S. Max-margin learning for lower linear envelope potentials in binary Markov random fields. In: Proceedings of the 28th International Conference on Machine Learning (ICML-11). Omnipress, 2011. 193-200
    [60] Lempitsky V, Rother C, Blake A. LogCut-efficient graph cut optimization for Markov random fields. In: Proceedings of the 11th IEEE International Conference on Computer Vision (ICCV 2007). Rio de Janeiro: IEEE, 2007. 1-8
    [61] Lempitsky V, Rother C, Roth S, Blake A. Fusion moves for Markov random field optimization. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(8): 1392-1405
    [62] Werner T. Revisiting the linear programming relaxation approach to gibbs energy minimization and weighted constraint satisfaction. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(8): 1474-1488
    [63] Kolmogorov V, Rother C. Minimizing nonsubmodular functions with graph cuts ---a review. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(7): 1274-1279
    [64] Boros E, Hammer P L. Pseudo-boolean optimization. Discrete Applied Mathematics, 2002, 123(1-3): 155-225
    [65] Boros E, Hammer P L, Tavares G. Preprocessing of Unconstrained Quadratic Binary Optimization. Technical Report RRR 10-2006, RUTCOR, 2006.
    [66] Rother C, Kolmogorov V, Lempitsky V, Szummer M. Optimizing binary MRFs via extended roof duality. In: Proceedings of the 2007 IEEE Conference on Computer Vision and Pattern Recognition (CVPR'07). Minneapolis, MN: IEEE, 2007. 1-8
    [67] Rosenberg I G. Reduction of bivalent maximization to the quadratic case. Cahiers du Centre d'Etudes de Recherche Opérationnelle, 1975, 17: 71-74
    [68] Ishikawa H. Higher-order clique reduction in binary graph cut. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2009). Miami, FL: IEEE, 2009. 2993-3000
    [69] Ishikawa H. Transformation of general binary MRF minimization to the first-order case. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(6): 1234-1249
    [70] Freedman D, Drineas P. Energy minimization via graph cuts: settling what is possible. In: Proceedings of the 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2005). San Diego, CA, USA: IEEE, 2005. 939-946
    [71] Gallagher A C, Batra D, Parikh D. Inference for order reduction in Markov random fields. In: Proceedings of the 2011 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI: IEEE, 2011. 1857-1864
    [72] Fix A, Gruber A, Boros E, Zabih R. A graph cut algorithm for higher-order Markov random fields. In: Proceedings of the 2011 IEEE International Conference on Computer Vision (ICCV). Barcelona: IEEE, 2011. 1020-1027
    [73] Pearl J. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. San Mateo: Morgan Kaufmann, 1988.
    [74] Lan X Y, Roth S, Huttenlocher D, Black M J. Efficient belief propagation with learned higher-order Markov random fields. In: Proceedings of the 9th European Conference on Computer Vision, Computer Vision-ECCV 2006. Graz, Austria: Springer, 2006. 269-282
    [75] Potetz B. Efficient belief propagation for vision using linear constraint nodes. In: Proceedings of the 2007 IEEE Conference on Computer Vision and Pattern Recognition (CVPR'07). Minneapolis, MN: IEEE, 2007. 1-8
    [76] Potetz B, Lee T S. Efficient belief propagation for higher-order cliques using linear constraint nodes. Computer Vision and Image Understanding, 2008, 112(1): 39-54
    [77] Tarlow D, Givoni I E, Zemel R S. Hop-map: efficient message passing with high order potentials. In: Proceedings of the 13th Conference on Artificial Intelligence and Statistics. 2010. 812-819
    [78] McAuley J J, Caetano T S. Faster algorithms for max-product message-passing. The Journal of Machine Learning Research, 2011, 12: 1349-1388
    [79] Felzenszwalb P F, McAuley J J. Fast inference with min-sum matrix product. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(12): 2549-2554
    [80] Komodakis N, Tziritas G, Paragios N. Fast, approximately optimal solutions for single and dynamic MRFs. In: Proceedings of the 2007 IEEE Conference on Computer Vision and Pattern Recognition (CVPR'07). Minneapolis, MN: IEEE, 2007. 1-8
    [81] Bertsekas D P. Nonlinear Programming (2nd Edition). Belmont, Mass: Athena Scientific, 1999.
    [82] Vazirani V V. Approximation Algorithms. Berlin, Heidelberg: Springer, 2001.
    [83] Kovalevsky V A, Koval V K. A diffusion algorithm for decreasing energy of max-sum labeling problem. Glushkov Institute of Cybernetics, Kiev, USSR, 1975.
    [84] Werner T. A linear programming approach to max-sum problem: a review. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2007, 29(7): 1165-1179
    [85] Komodakis N, Paragios N, Tziritas G. MRF optimization via dual decomposition: message-passing revisited. In: Proceedings of the 11th IEEE International Conference on Computer Vision (ICCV 2007). Rio de Janeiro: IEEE, 2007. 1-8
    [86] Komodakis N, Paragios N, Tziritas G. MRF energy minimization and beyond via dual decomposition. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2011, 33(3): 531-552
    [87] Swoboda P, Savchynskyy B, Kappes J H, Schnörr C. Partial optimality by pruning for map-inference with general graphical models. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition, CVPR'14. Washington D.C., USA: IEEE Computer Society, 2014. 1170-1177
    [88] Komodakis N, Paragios N. Beyond loose Lp-relaxations: optimizing MRFs by repairing cycles. In: Proceedings of the 10th European Conference on Computer Vision, Computer Vision-ECCV 2008. Marseille, France: Springer, 2008. 806-820
    [89] Kumar M P, Torr P H S. Efficiently solving convex relaxations for map estimation. In: Proceedings of the 25th International Conference on Machine Learning. New York: ACM, 2008. 680-687
    [90] Sontag D, Jaakkola Y S. New outer bounds on the marginal polytope. In: Proceedings of the 2007 Advances in Neural Information Processing Systems. Cambridge, MA: MIT Press, 2007. 1393-1400
    [91] Sontag D, Meltzer T, Globerson A, Jaakkola T S, Weiss Y. Tightening LP relaxations for MAP using message passing. In: Proceedings of the 24th Conference on Uncertainty in Artificial Intelligence. 2012.
    [92] Andres B, Kappes J H, Köthe U, Schnörr C, Hamprecht F A. An empirical comparison of inference algorithms for graphical models with higher order factors using openGM. In: Proceedings of the 32nd DAGM Symposium, Pattern Recognition. Darmstadt, Germany: Springer, 2010. 353-362
    [93] Kappes J H, Andres B, Hamprecht F A, Schnorr C, Nowozin S, Batra D, Kim S, Kausler B X, Lellmann J, Komodakis N, Rother C. A comparative study of modern inference techniques for discrete energy minimization problems. In: Proceedings of the 2013 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Portland, OR: IEEE, 2013. 1328-1335
    [94] Andres B, Beier T, Kappes J H. Opengm: A C++ library for discrete graphical models. arXiv Preprint arXiv: 1206. 0111, 2012.
    [95] Scharstein D, Chris P. Learning conditional random fields for stereo. In: Proceedings of the 2007 IEEE Conference on Computer Vision and Pattern Recognition (CVPR'07). Minneapolis, MN: IEEE, 2007. 1-8
    [96] Taskar B, Guestrin C, Roller D. Max-margin Markov networks. Advances in Neural Information Processing Systems, 2004, 16: 25
    [97] Finley T, Joachims T. Training structural SVMs when exact inference is intractable. In: Proceedings of the 25th International Conference on Machine Learning. New York: ACM, 2008. 304-311
    [98] Li Y P, Huttenlocher D P. Learning for stereo vision using the structured support vector machine. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2008). Anchorage, AK: IEEE, 2008. 1-8
    [99] Tsochantaridis I, Hofmann T, Joachims T, Altun Y. Support vector machine learning for interdependent and structured output spaces. In: Proceedings of the 21st International Conference on Machine Learning. New York: ACM, 2004. 104
    [100] Yang L, Meer P, Foran D J. Multiple class segmentation using a unified framework over mean-shift patches. In: Proceedings of the 2007 IEEE Conference on Computer Vision and Pattern Recognition (CVPR'07). Minneapolis, MN: IEEE, 2007. 1-8
    [101] Pantofaru C, Schmid C, Hebert M. Object recognition by integrating multiple image segmentations. In: Proceedings of the 10th European Conference on Computer Vision, Computer Vision-ECCV 2008. Marseille, France: Springer, 2008. 481-494
    [102] Russell B C, Freeman W T, Efros A A, Sivic J, Zisserman A. Using multiple segmentations to discover objects and their extent in image collections. In: Proceedings of the 2006 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. New York, USA: IEEE, 2006. 1605-1614
    [103] Comaniciu D, Meer P. Mean shift: a robust approach toward feature space analysis. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002, 24(5): 603-619
    [104] Torralba A, Murphy K P, Freeman W T. Sharing features: efficient boosting procedures for multiclass object detection. In: Proceedings of the 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR 2004). Washington D.C., USA: IEEE, 2004. II-762-II-769
    [105] Boykov Y Y, Jolly M P. Interactive graph cuts for optimal boundary & region segmentation of objects in N-D images. In: Proceedings of the 8th IEEE International Conference on Computer Vision (ICCV 2001). Vancouver, BC: IEEE, 2001. 105-112
    [106] Felzenszwalb P F, Girshick R B, McAllester D, Ramanan D. Object detection with discriminatively trained part-based models. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2010, 32(9): 1627-1645
    [107] Maji S, Malik J. Object detection using a max-margin Hough transform. In: Proceedings of the 2009 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2009). Miami, FL: IEEE, 2009. 1038-1045
    [108] Larlus D, Jurie F. Combining appearance models and Markov random fields for category level object segmentation. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2008). Anchorage, AK: IEEE, 2008. 1-7
    [109] Hoiem D, Efros A A, Hebert M. Closing the loop in scene interpretation. In: Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition (CVPR 2008). Anchorage, AK: IEEE, 2008. 1-8
    [110] Li C C, Kowdle A, Saxena A, Chen T. Towards holistic scene understanding: feedback enabled cascaded classification models. In: Proceedings of the 2010 Advances in Neural Information Processing Systems. 2010. 1351-1359
    [111] Gould S, Gao T S, Koller D. Region-based segmentation and object detection. In: Proceeding of the 2009 Advances in Neural Information Processing Systems. 2009. 655-663
    [112] Wojek C, Schiele B. A dynamic conditional random field model for joint labeling of object and scene classes. In: Proceedings of the 10th European Conference on Computer Vision, Computer Vision-ECCV 2008. Marseille, France: Springer, 2008. 733-747
    [113] Everingham M, Van Gool L, Williams C K I, Winn J, Zisserman A. The pascal visual object classes (VOC) challenge. International Journal of Computer Vision, 2010, 88(2): 303-338
    [114] Yao J, Fidler S, Urtasun R. Describing the scene as a whole: joint object detection, scene classification and semantic segmentation. In: Proceedings of the 2012 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Providence, RI: IEEE, 2012. 702-709
    [115] Sturgess P, Alahari K, Ladický L, Torr P H S. Combining appearance and structure from motion features for road scene understanding. In: Proceedings of the 2009 British Machine Vision Association (BMVC 2009).
    [116] Roig G, Boix X, Ben Shitrit H, Fua P. Conditional random fields for multi-camera object detection. In: Proceedings of the 2011 IEEE International Conference on Computer Vision (ICCV). Barcelona: IEEE, 2011. 563-570
  • 期刊类型引用(38)

    1. 汤健,郭海涛,夏恒,王鼎,乔俊飞. 面向工业过程的图像生成及其应用研究综述. 自动化学报. 2024(02): 211-240 . 本站查看
    2. 王程昱,凌青,闫文君. 基于DCGAN的雷达辐射源信号个体识别算法. 测控技术. 2024(07): 17-22+64 . 百度学术
    3. 秦建军. 大数据技术与生成式人工智能技术的结合应用. 信息与电脑(理论版). 2024(10): 88-90 . 百度学术
    4. 李剑锋,柏雪,赵春财,钱朋超,王洪涛,徐伟风. 融合生成对抗网络和难例挖掘的产品质量预测模型. 计算机集成制造系统. 2024(10): 3698-3707 . 百度学术
    5. 刘月,罗李思,莫永华. 生成式人工智能在教育领域的研究热点与趋势分析. 广西开放大学学报. 2024(05): 22-27 . 百度学术
    6. 王嘉奇,周茂君. 科技艺术创作与传播行为辨析:从自然模仿到人工创造力. 艺术传播研究. 2023(01): 103-113 . 百度学术
    7. 蔡常雨,莫文昊,王万国,张英强,郭鹏天. 基于生成对抗数据增殖的输电设备可视缺陷检测技术研究. 电力信息与通信技术. 2023(09): 38-43 . 百度学术
    8. 赵祥模,赵玉钰,景首才,惠飞,刘建蓓. 面向自动驾驶测试的危险变道场景泛化生成. 自动化学报. 2023(10): 2211-2223 . 本站查看
    9. 史亚,张文博,朱明哲,王磊,徐胜军. 雷达辐射源个体识别综述. 电子与信息学报. 2022(06): 2216-2229 . 百度学术
    10. 薛昊天,王晨. 基于GAN的僵尸网络流量检测研究. 电子设计工程. 2022(17): 146-149 . 百度学术
    11. 王飞跃,金征宇,苟超,沈甜雨,郑文博,王建功,胡振华,张志成,王晓,田捷. 基于ACP方法的平行医学图像智能分析及其应用. 中华放射学杂志. 2021(03): 309-315 . 百度学术
    12. 王彦秋,冯英伟. 基于大数据的人脸识别方法. 现代电子技术. 2021(07): 87-90 . 百度学术
    13. 尹玉婷,肖秦琨. 基于深度卷积生成对抗网络的图像生成. 计算机技术与发展. 2021(04): 86-92 . 百度学术
    14. 顾永涛,徐泽禹,盛庆博,张卫,李炜,谭嘉,李知艺. 基于生成对抗网络的光伏出力区间预测方法. 哈尔滨理工大学学报. 2021(02): 100-109 . 百度学术
    15. 吴杰,段锦,董锁芹,李英超. DFM-GAN网络在跨年龄模拟的人脸识别技术研究. 计算机工程与应用. 2021(10): 117-124 . 百度学术
    16. 郑晶,吴志祥,李德伟,邢立文. 基于生成对抗网络的微地震数据去噪方法. 实验室研究与探索. 2021(05): 18-21 . 百度学术
    17. 丁斌,夏雪,梁雪峰. 基于深度生成对抗网络的海杂波数据增强方法. 电子与信息学报. 2021(07): 1985-1991 . 百度学术
    18. 张方言,赵梦,周弈志,胥婧雯,李海清,程思奇,吴俊峰,于红. 基于ResNet50和迁移学习的红鳍东方鲀病鱼检测方法. 渔业现代化. 2021(04): 51-60 . 百度学术
    19. 高靖宇. 基于深度网络的行人识别方法研究. 信息与电脑(理论版). 2021(14): 47-49 . 百度学术
    20. 肖进胜,周景龙,雷俊锋,李亮,丁玲,杜治一. 面向图像场景转换的改进型生成对抗网络. 软件学报. 2021(09): 2755-2768 . 百度学术
    21. 孔锐,黄钢. 基于条件约束的胶囊生成对抗网络. 自动化学报. 2020(01): 94-107 . 本站查看
    22. 付晓,沈远彤,李宏伟,程晓梅. 基于半监督编码生成对抗网络的图像分类模型. 自动化学报. 2020(03): 531-539 . 本站查看
    23. 刘锦峰. 基于卷积神经网络的学生课堂面部表情识别研究. 高教学刊. 2020(07): 67-69 . 百度学术
    24. 李鑫,焦斌,林蔚天. 基于条件信息卷积生成对抗网络的图像识别. 计算机工程与应用. 2020(14): 191-198 . 百度学术
    25. 马波,蔡伟东,赵大力. 基于GAN样本生成技术的智能诊断方法. 振动与冲击. 2020(18): 153-160 . 百度学术
    26. 张志峰,JANET David. 基于熵函数的流水车间小批生产信息量测度. 自动化学报. 2020(10): 2221-2228 . 本站查看
    27. 王铭,王庆霞,戈增文,吴喜如,周虎. 基于生成对抗网络的缸盖表面缺陷识别. 制造业自动化. 2020(11): 96-102 . 百度学术
    28. 颜贝,张礼,张建林,徐智勇. 基于残差结构的对抗式网络图像生成方法. 激光与光电子学进展. 2020(18): 310-317 . 百度学术
    29. 沈杰,瞿遂春,任福继,邱爱兵,徐杨. 基于SGAN的中文问答生成研究. 计算机应用与软件. 2019(02): 194-199 . 百度学术
    30. 罗佳,黄晋英. 生成式对抗网络研究综述. 仪器仪表学报. 2019(03): 74-84 . 百度学术
    31. 李博嘉,张仰森,陈若愚. 一种可指定分布的海量数据生成方法. 计算机科学. 2019(08): 56-63 . 百度学术
    32. 朱哲良,邓璐娟. 基于物联网的金融数据动态安全存管系统设计. 现代电子技术. 2019(16): 58-61+66 . 百度学术
    33. 晏涛,邓赵红,王骏,蒋亦樟,詹千熠,周志昉. 数字媒体技术专业机器视觉类课程的建设与探索. 工业和信息化教育. 2019(09): 46-51+66 . 百度学术
    34. 王昊海,刘远志. GAN:AI时代艺术创作的新媒介. 美与时代(上). 2019(12): 80-84 . 百度学术
    35. 袁培森,吴茂盛,翟肇裕,杨承林,徐焕良. 基于GAN网络的菌菇表型数据生成研究. 农业机械学报. 2019(12): 231-239 . 百度学术
    36. 杨林瑶,陈思远,王晓,张俊,王成红. 数字孪生与平行系统:发展现状、对比及展望. 自动化学报. 2019(11): 2001-2031 . 本站查看
    37. 蔡元萃,杜红艳,王欣. 基于生成对抗网络的网络安全态势感知平台. 信息技术与网络安全. 2019(08): 1-5 . 百度学术
    38. 罗佳,黄晋英,马健程. 基于TTUR的C-DCGAN机械故障诊断模型稳定训练方法. 振动.测试与诊断. 2022(04): 733-740+827 . 百度学术

    其他类型引用(49)

  • 加载中
计量
  • 文章访问数:  3324
  • HTML全文浏览量:  231
  • PDF下载量:  1692
  • 被引次数: 87
出版历程
  • 收稿日期:  2014-09-24
  • 修回日期:  2015-03-20
  • 刊出日期:  2015-07-20

目录

/

返回文章
返回