王县县 禹龙 田生伟 王瑞锦

王县县, 禹龙, 田生伟, 王瑞锦. 独立RNN和胶囊网络的维吾尔语事件缺失元素填充.自动化学报, 2021, 47(4): 903-912 doi: 10.16383/j.aas.c180655
Wang Xian-Xian, Yu Long, Tian Sheng-Wei, Wang Rui-Jin. Missing argument fllling of uyghur event based on independent recurrent neural network and capsule network. Acta Automatica Sinica, 2021, 47(4): 903-912 doi: 10.16383/j.aas.c180655
doi: 10.16383/j.aas.c180655

国家自然科学基金 61662074

国家自然科学基金 61962057

国家自然科学基金 61563051

国家自然科学基金重点项目 U2003208

自治区重大科技项目 2020A03004-4


    王县县  新疆大学硕士研究生. 主要研究方向为自然语言处理. E-mail: sjzwangxianxian@163.com

    田生伟  新疆大学教授. 主要研究方向为自然语言处理. E-mail: tianshengwei@163.com

    王瑞锦  电子科技大学讲师. 主要研究方向为量子通信安全, 大数据分析及安全. E-mail: wrj8882003@163.com


    禹龙  新疆大学教授. 主要研究方向为计算机智能技术与计算机网络. 本文通信作者. E-mail: yul_xju@163.com

Missing Argument Filling of Uyghur Event Based on Independent Recurrent Neural Network and Capsule Network


National Natural Science Foundation of China 61662074

National Natural Science Foundation of China 61962057

National Natural Science Foundation of China 61563051

The Key Project of National Natural Science Foundation of China U2003208

Major science and Technology Projects in the Autonomous Region 2020A03004-4

    WANG Xian-Xian  Master student at Xinjiang University. His main research interest is natural language processing

    TIAN Sheng-Wei  Professor at Xinjiang University. His research interest covers natural language processing and computer intelligence technology

    WANG Rui-Jin  Lecturer at University of Electronic Science and Technology of China. His research interest covers quantum communication security, big data analysis and security

    Corresponding author: YU Long  Professor at Xinjiang University. Her research interest covers computer intelligence technology andcomputer networks. Corresponding author of this paper
  • 摘要: 提出了注意力机制独立循环神经网络和胶囊网络并行的维吾尔语事件缺失元素填充模型(Att IndRNN CapsNet).首先, 抽取18项事件和事件元素的内部特征, 作为结合注意力机制的独立循环神经网络模型的输入, 进一步获取高阶特征; 同时, 引入词嵌入技术将事件触发词和候选元素映射为词向量, 通过胶囊网络挖掘事件和事件元素的上下文语义特征; 然后, 将两种特征融合, 作为分类器的输入, 进而完成事件缺失元素的填充. 实验结果表明, 该方法用于维吾尔语事件缺失元素填充准确率为86.94 %, 召回率为84.14 %, 衡量模型整体性能的F1值为85.52 %, 从而证明了该方法在维吾尔语事件缺失元素填充上的有效性.
  • 图  1  模型结构图

    Fig.  1  Model structure

    图  2  模型对比图

    Fig.  2  Comparison between our model and other models

    表  1  事件句1中的元素

    Table  1  Arguments in event sentence 1

    元素 对应内容 译文
    Time-Arg 2017年1月1日时间11时左右
    Place-Arg 南京雨花西路和共青团路交叉口
    Suffer-Arg 母亲
    Tool-Arg 一辆货车
    表  2  事件句2中的元素

    Table  2  Arguments in event sentence 2

    元素 对应内容 译文
    Agent-Arg 过路人
    Artifact-Arg 女子怀里9个月的婴儿
    Destination-Arg 南京市第一医院
    表  3  模型最优参数表

    Table  3  Optimal parameters

    lr 0.005
    lrdr 0.1
    bs 16
    ep 50
    dr 0.3
    opt adam
    表  4  不同样本对实验性能的影响(%)

    Table  4  Hyper parameters of experiment (%)

    样本种类 P R F1
    样本1 85.76 80.6 83.1
    样本2 86.94 84.14 85.52
    表  5  本文模型与其他模型实验性能对比(%)

    Table  5  Comparison between our model and other models (%)

    模型 P R F1
    IndRNN 77.6 81.06 79.29
    CapsNet 79.51 85.84 82.55
    Att_IndRNN 78.13 82.54 80.27
    Att_CapsNet 81.63 84.74 83.16
    IndRNN_CapsNet 84.17 81.02 82.56
    Att_IndRNN_CapsNet 86.94 84.14 85.52
    表  6  词向量对实验性能的影响(%)

    Table  6  Influence of word vector dimension (%)

    维度 P R F1
    10 78.3 83.58 80.85
    30 81.44 84.27 82.83
    50 86.94 84.14 85.52
    100 84.45 83.55 84
    150 80.17 80.09 81.12
    表  7  不同种类特征对实验性能的影响(%)

    Table  7  Influence of different kinds of features

    特征 P R F1
    语义特征A 77.84 81.92 79.83
    语义特征B 78.85 83.66 81.18
    规则特征 74.66 77.87 76.23
    语义特征A +规则特征 81.17 86.44 83.72
    语义特征B +规则特征 86.94 84.14 85.52
    表  8  独立特征与融合特征对实验性能的影响(%)

    Table  8  Influence of independent features and fusion features (%)

    模型 P R F1
    Att_IndRNNh+w_CapsNeth+w 82.7 83.61 83.15
    Att_IndRNNw_CapsNeth 76.6 86.87 81.41
    Att_IndRNNh_CapsNetw 86.94 84.14 85.52
    表  9  独立循环神经网络层数对实验性能的影响(%)

    Table  9  Influence of the number of IndRNN (%)

    层数 P R F1
    1 81.89 83.96 82.96
    2 86.94 84.14 85.52
    3 82.56 81.38 81.96
图(2) / 表(9)
