2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于标签集相关性学习的大规模网络图像在线标注

田枫 沈旭昆

田枫, 沈旭昆. 基于标签集相关性学习的大规模网络图像在线标注. 自动化学报, 2014, 40(8): 1635-1643. doi: 10.3724/SP.J.1004.2014.01635
引用本文: 田枫, 沈旭昆. 基于标签集相关性学习的大规模网络图像在线标注. 自动化学报, 2014, 40(8): 1635-1643. doi: 10.3724/SP.J.1004.2014.01635
TIAN Feng, SHEN Xu-Kun. Large Scale Web Image Online Annotation by Learning Label Set Relevance. ACTA AUTOMATICA SINICA, 2014, 40(8): 1635-1643. doi: 10.3724/SP.J.1004.2014.01635
Citation: TIAN Feng, SHEN Xu-Kun. Large Scale Web Image Online Annotation by Learning Label Set Relevance. ACTA AUTOMATICA SINICA, 2014, 40(8): 1635-1643. doi: 10.3724/SP.J.1004.2014.01635

基于标签集相关性学习的大规模网络图像在线标注

doi: 10.3724/SP.J.1004.2014.01635
基金项目: 

国家高技术研究发展计划(863计划)(2009AA012103),国家自然科学基金(60533070),东北石油大学青年科学基金(2013NQ120)资助

详细信息
    作者简介:

    沈旭昆 北京航空航天大学计算机学院教授. 主要研究方向为虚拟现实与可视化,计算机视觉,多媒体内容管理.E-mail:xkshen@buaa.edu.cn

    通讯作者:

    田枫东 北石油大学计算机与信息技术学院副教授. 2014 年获得北京航空航天大学博士学位. 主要研究方向为跨媒体理解和多媒体数据挖掘. E-mail:tianfeng80@gmail.com

Large Scale Web Image Online Annotation by Learning Label Set Relevance

Funds: 

Supported by National High Technology Research and Development Program of China (863 Program) (2009AA012103), National Natural Science Foundation of China (60533070), and Youth Foundation of Northeast Petroleum University (2013NQ1 20)

  • 摘要: 传统的网络图像标注方法忽视了标签集整体相关性对标注结果的影响,导致标签集整体相关性缺乏和语义冗余. 为了解决上述问题,提出了一种基于标签集相关性学习的大规模网络图像在线语义标注方法. 给出了标签集对图像相关性和标签集内部相关性的概率估计算法,将上述约束形成一个优化问题,采用贪心搜索策略获取近似最优解,找到能合理地平衡上述因素的标签集,并针对大规模图像集和概念集进行了优化. 真实环境下大规模网络图像集上的测试表明,相比于目前的代表性网络图像标注方法,该方法获得的标签集能够更好的描述图像语义,性能提升明显.
  • [1] Zhang D S, Islam M M, Lu G J. A review on automatic image annotation techniques. Pattern Recognition, 2012, 45(1): 346-362
    [2] [2] Wang M, Ni B B, Hua X S, Chua T S. Assistive tagging: a survey of multimedia tagging with human-computer joint exploration. ACM Computing Surveys, 2012, 44(4): 1-24
    [3] [3] Wang X J, Zhang L, Li X R, Ma W Y. Annotating images by mining image search results. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2008, 30(11): 1919-1932
    [4] [4] Liu D, Hua X C, Yang L J. Tag ranking. In: Proceedings of the 2009 International World Wide Web Conference. New York, USA: ACM, 2009. 351-360
    [5] [5] Li X R, Snoek C G M, Worring M. Learning social tag relevance by neighbor voting. IEEE Transactions on Multimedia, 2009, 11(7): 1310-1322
    [6] [6] Jin Y, Khan L, Prabhakaran B. Knowledge based image annotation refinement. Journal of Signal Processing Systems, 2010, 58(3): 387-406
    [7] [7] Wang H, Huang H, Chris H Q D. Image annotation using bi-relational graph of images and semantic labels. In: Proceedings of the 2001 IEEE Conference on Computer Vision and Pattern Recognition. New York, USA: IEEE, 2011. 793-800
    [8] [8] Yang Y, Wu F, Nie F P, Shen H T, Zhuang Y, Hauptmann A G. Web and personal image annotation by mining label correlation with relaxed visual graph embedding. IEEE Transactions on Image Processing, 2012, 21(3): 1339-1351
    [9] [9] Chua T S, Tang J H, Hong R C, Li H J, Luo Z P, Zheng Y T. NUS-WIDE: A real-world web image database from National University of Singapore. In: Proceedings of the 2009 ACM Conference on Image and Video Retrieval. New York, USA: ACM, 2009. 1-9
    [10] Huiskes M J, Lew M S. The MIR Flickr retrieval evaluation. In: Proceedings of the 2008 ACM International Conference on Multimedia Information Retrieval. New York, USA: ACM, 2008. 39-43
  • 加载中
计量
  • 文章访问数:  1841
  • HTML全文浏览量:  47
  • PDF下载量:  1051
  • 被引次数: 0
出版历程
  • 收稿日期:  2012-12-03
  • 修回日期:  2013-08-13
  • 刊出日期:  2014-08-20

目录

    /

    返回文章
    返回