潘文雯 赵洲 俞俊 吴飞

潘文雯, 赵洲, 俞俊, 吴飞. 基于文本引导的注意力图像转发预测排序网络. 自动化学报, 2021, 47(11): 2547−2556 doi: 10.16383/j.aas.c200629
Pan Wen-Wen, Zhao Zhou, Yu Jun, Wu Fei. Textually guided ranking network for attentional image retweet modeling. Acta Automatica Sinica, 2021, 47(11): 2547−2556 doi: 10.16383/j.aas.c200629
基金项目: 国家重点研发计划(2018AAA0100603), 浙江省自然基金(LR19F020006), 国家自然科学基金项目(61836002, U1611461, 61751209)资助

    潘文雯:浙江大学计算机科学博士研究生. 主要研究方向为机器学习和自然语言处理. E-mail: wenwenpan@zju.edu.cn

    赵洲:浙江大学计算机科学与技术学院副教授. 主要研究方向为机器学习和数据挖掘. 本文通信作者.E-mail: zhaozhou@zju.edu.cn

    俞俊:杭州电子科技大学计算机科学与技术学院教授. 主要研究领域为计算机动画图像处理, 机器学习. E-mail: yujun@hdu.edu.cn

    吴飞:浙江大学求是特聘教授. 主要研究方向为人工智能, 多媒体分析与检索和统计学习理论.E-mail: wufei@cs.zju.edu.cn

Textually Guided Ranking Network for Attentional Image Retweet Modeling

Funds: Support by National Key R&D Program of China (2018AAA0100603), Zhejiang Natural Science Foundation (LR19F020006), National Natural Science Foundation of China (61836002, U1611461, 61751209)
More Information
    Author Bio:

    PAN Wen-Wen Ph. D. candidate in computer science at Zhejiang University. Her research interest covers machine learning and natural language processing

    ZHAO Zhou Associate professor at the College of Computer Science and Technology, Zhejiang University. His research interest covers machine learning and data mining. Corresponding author of this paper

    YU Jun Professor at the School of Computer Science and Technology, Hangzhou Dianzi University. His research interest covers computer animation image processing, machine learning

    WU Fei Qiushi distinguished professor at Zhejiang University. His research interest covers artificial intelligence, multimedia analysis and retrieval, and statistical learning theory

  • 摘要: 转发预测在社交媒体网站(Social media sites, SMS)中是一个很有挑战性的问题. 本文研究了SMS中的图像转发预测问题, 预测用户再次转发图像推特的图像共享行为. 与现有的研究不同, 本文首先提出异构图像转发建模网络(Image retweet modeling, IRM), 所利用的是用户之前转发图像推特中的相关内容、之后在SMS中的联系和被转发者的偏好三方面的内容. 在此基础上, 提出文本引导的多模态神经网络, 构建新型多方面注意力排序网络学习框架, 从而学习预测任务中的联合图像推特表征和用户偏好表征. 在Twitter的大规模数据集上进行的大量实验表明, 我们的方法较之现有的解决方案而言取得了更好的效果.
  • 图  1  图像推特行为示例

    Fig.  1  An example of image retweet behavior

    图  2  用于图像转发预测的注意多方面排序网络学习纵览

    Fig.  2  The overview of textually guided ranking network for attentional image retweet modeling

    图  3  文本引导的多模融合网络

    Fig.  3  Textually guided multi-modal fusion network

    图  4  AMNL+ 在图像转发预测任务中的实验结果

    Fig.  4  Experimental results of AMNL+ on the image retweet prediction task

    图  5  随着Epoch客观价值和运行时间的变化

    Fig.  5  Objective value and running time versus the number of epochs

    表  1  不同方法的Precision@1结果

    Table  1  Experimental results on precision@1 of different approaches

    60 %70 %80 %
    表  2  不同方法的Precision@3结果

    Table  2  Experimental results on precision@3 of different approaches

    60 %70 %80 %
    表  3  不同方法的AUC结果

    Table  3  Experimental results on AUC of different approaches

    60 %70 %80 %
    表  4  用80 %的数据进行训练, 消融实验的实验结果

    Table  4  Experimental results with different modalities and components using 80 % of the data for training

图(5) / 表(4)
