


  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘


赵红 钟杨清 金杰 邹林华

赵红, 钟杨清, 金杰, 邹林华. 基于自适应原型特征类矫正的小样本学习方法. 自动化学报, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c240312
Zhao Hong, Zhong Yang-Qing, Jin Jie, Zou Lin-Hua. Few-shot learning based on class rectification via adaptive prototype features. Acta Automatica Sinica, xxxx, xx(x): x−xx doi: 10.16383/j.aas.c240312
doi: 10.16383/j.aas.c240312
基金项目: 国家自然科学基金 (62376114)资助

    赵红:闽南师范大学计算机学院教授. 2019年获得天津大学博士学位. 主要研究方向为粒计算, 小样本学习及分层分类. 本文通信作者. E-mail: hongzhaocn@163.com

    钟杨清:闽南师范大学计算机学院硕士研究生. 主要研究方向为小样本学习. E-mail: yangqingzhong0@163.com

    金杰:闽南师范大学计算机学院硕士研究生. 主要研究方向为机器学习和粒度计算中的少样本学习和分层分类应用. E-mail: kimjee@126.com

    邹林华:闽南师范大学计算机学院硕士研究生. 主要研究方向为机器学习和粒度计算中的少样本学习和分层分类应用. E-mail: zlh1836065471@163.com

Few-shot Learning Based on Class Rectification via Adaptive Prototype Features

Funds: Supported by National Natural Science Foundation of China (62376114)
    ZHAO Hong Professor at the School of Computer Science, Minnan Normal University. She received her Ph.D. degree from Tianjin University in 2019. Her research interest covers granular computing, few-shot learning, and data mining for hierarchical classification. Corresponding author of this paper

    ZHONG Yang-Qing Master student at the School of Computer Science, Minnan Normal University. Her research interest covers few-shot learning

    JIN Jie Master student at the School of Computer Science, Minnan Normal University. His research interest covers few-shot learning and hierarchical classification application in machine learning and granular computing

    ZOU Lin-Hua Master student at the School of Computer Science, Minnan Normal University. His research interest covers few-shot learning and hierarchical classification application in machine learning and granular computing

  • 摘要: 针对小样本学习过程上样本数量不足导致的性能下降问题, 基于原型网络的小样本学习方法通过实现查询样本与支持样本原型特征间的距离度量, 从而达到很好的分类性能. 然而, 这种方法直接将支持集样本均值视为类原型, 在一定程度上加剧了对样本数量稀少情况下的敏感性. 针对此问题, 提出了基于自适应原型特征类矫正的小样本学习方法(Few-shot learning based on class rectification via adaptive prototype features, CRAPF), 通过自适应生成原型特征来缓解模型对数据细微变化的过度响应, 并同步实现类边界的精细化调整. 首先, 使用卷积网络构建自适应原型特征生成模块, 该模块采用非线性映射获取更为稳健的原型特征, 有助于减弱异常值对原型构建的影响. 其次, 通过对原型生成过程的优化, 提升了不同类间原型表示的区分度, 进而强化了原型特征对于类别表征的整体效能. 最后, 在3个广泛使用的基准数据集上的实验结果显示, 该方法提升了小样本学习任务的表现. 例如, 在5类5样本设置下, CRAPF在MiniImageNet和CIFAR-FS上的准确率比其他模型至少提高了2.06% 和2.30%.
  • 图  1  固定原型和自适应原型生成示例 (5类5样本)

    Fig.  1  Examples of fixed prototype and adaptive prototype generation (5-way-5-shot)

    图  2  基于5类5样本的模型框架图

    Fig.  2  Model framework based on 5-way-5-shot

    图  3  自适应原型特征生成模块

    Fig.  3  Adaptive prototype feature generation module

    图  4  数据集部分代表性图像

    Fig.  4  Representative images in the datasets

    图  5  在不同数据集上自适应原型和预训练模块在CRAPF中的性能比较

    Fig.  5  Performance comparison of adaptive prototype and pre-training module on different datasets in CRAPF

    图  6  应用不同NK样本策略的性能比较

    Fig.  6  Performance comparison using different N-way-K-shot strategies

    图  7  CRAPF的可视化

    Fig.  7  Visualization of CRAPF

    表  1  实验数据集

    Table  1  Experimental datasets

    数据集 样本数量 训练/验证/测试类别数量 图片大小
    MiniImageNet 60 000 64/16/20 84$ \times $84像素
    CIFAR-FS 60 000 64/16/20 32$ \times $32像素
    FC100 60 000 60/20/20 32$ \times $32像素
    表  2  应用不同$ N $类$ K $样本策略的性能比较 (%)

    Table  2  Performance comparison using different $ N $-way-$ K $-shot strategies (%)

    数据集 $ N $类$ K $样本 ProtoNet CRAPF
    CIFAR-FS 5类5样本 75.68 85.11
    5类10样本 81.17 87.34
    10类5样本 68.18 74.30
    FC100 5类5样本 50.96 54.56
    5类10样本 57.20 59.13
    10类5样本 36.69 37.89
    表  3  应用不同网络的实验结果 (%)

    Table  3  Experimental results using different networks (%)

    网络 数据集 ProtoNet CRAPF
    ResNet12 MiniImageNet 72.08 77.08
    CIFAR-FS 75.68 85.11
    FC100 50.96 54.56
    ResNet18 MiniImageNet 73.68 74.40
    CIFAR-FS 72.83 84.93
    FC100 47.50 53.33
    表  4  MiniImageNet数据集上的对比实验结果 (%)

    Table  4  Comparative experimental results on the MiniImageNet dataset(%)

    模型 网络 5类1样本 5类5样本
    TEAM ResNet18 60.07 75.90
    TransCNAPS ResNet18 55.60 73.10
    MTUNet ResNet18 58.13 75.02
    IPN ResNet10 56.18 74.60
    ProtoNet* ResNet12 53.42 72.08
    TADAM ResNet12 58.50 76.70
    SSR ResNet12 68.10 76.90
    MDM-Net ResNet12 59.88 76.60
    CRAPF* ResNet12 59.38 77.08
    表  5  CIFAR-FS数据集上的对比实验结果 (%)

    Table  5  Comparative experimental results on the CIFAR-FS dataset (%)

    模型 网络 5类1样本 5类5样本
    ProtoNet* ResNet12 56.86 75.68
    Shot-Free ResNet12 69.20 84.70
    TEAM ResNet12 70.40 80.30
    DeepEMD ResNet12 46.50 63.20
    DSN ResNet12 72.30 85.10
    MTL ResNet12 69.50 84.10
    DSMNet ResNet12 60.66 79.26
    MTUNet ResNet18 67.43 82.81
    CRAPF* ResNet12 72.34 85.11
    表  6  FC100数据集上的对比实验结果 (%)

    Table  6  Comparative experimental results on the FC100 dataset(%)

    模型 网络 5类1样本 5类5样本
    ProtoNet* ResNet12 37.50 50.96
    SimpleShot ResNet10 40.13 53.63
    Baseline2020 ResNet12 36.82 49.72
    TADAM ResNet12 40.10 56.10
    CRAPF* ResNet12 40.44 54.56
