2.845

2023影响因子

(CJCR)

  • 中文核心
  • EI
  • 中国科技核心
  • Scopus
  • CSCD
  • 英国科学文摘

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

基于跨连卷积神经网络的性别分类模型

张婷 李玉鑑 胡海鹤 张亚红

彭孝东, 张铁民, 李继宇, 陈瑜. 基于传感器校正与融合的农用小型无人机姿态估计算法. 自动化学报, 2015, 41(4): 854-860. doi: 10.16383/j.aas.2015.c140277
引用本文: 张婷, 李玉鑑, 胡海鹤, 张亚红. 基于跨连卷积神经网络的性别分类模型. 自动化学报, 2016, 42(6): 858-865. doi: 10.16383/j.aas.2016.c150658
PENG Xiao-Dong, ZHANG Tie-Min, LI Ji-Yu, CHEN Yu. Attitude Estimation Algorithm of Agricultural Small-UAV Based on Sensors Fusion and Calibration. ACTA AUTOMATICA SINICA, 2015, 41(4): 854-860. doi: 10.16383/j.aas.2015.c140277
Citation: ZHANG Ting, LI Yu-Jian, HU Hai-He, ZHANG Ya-Hong. A Gender Classification Model Based on Cross-connected Convolutional Neural Networks. ACTA AUTOMATICA SINICA, 2016, 42(6): 858-865. doi: 10.16383/j.aas.2016.c150658

基于跨连卷积神经网络的性别分类模型

doi: 10.16383/j.aas.2016.c150658
基金项目: 

国家自然科学基金 61175004

高等学校博士学科点专项科研基金 20121103110029

北京市博士后工作资助项目 2015ZZ-24: Q6007011201501

详细信息
    作者简介:

    李玉鑑 北京工业大学计算机学院教授. 主要研究方向为模式识别, 图像处理, 机器学习, 数据挖掘. E-mail: liyujian@bjut.edu.cn

    胡海鹤 北京工业大学计算机学院博士后. 主要研究方向为模式识别, 机器学习, 红外技术. E-mail: huhaihe@bjut.edu.cn

    张亚红 北京工业大学计算机学院博士研究生. 主要研究方向为模式识别, 数据挖掘, 大数据分析. E-mail: plahpu@163.com

    通讯作者:

    张婷 北京工业大学计算机学院博士研究生. 主要研究方向为模式识别, 深度学习, 大数据分析. 本文通信作者. E-mail: zhangting08@emails.bjut.edu.cn

A Gender Classification Model Based on Cross-connected Convolutional Neural Networks

Funds: 

National Natural Science Foundation of China 61175004

Specialized Research Fund for the Doctoral Program of Higher Education of China 20121103110029

Project Funding of Postdoctor in Beijing 2015ZZ-24: Q6007011201501

More Information
    Author Bio:

    LI Yu-Jian Professor at the Com-puter School, Beijing University of Technology. His research interest cov-ers pattern recognition, image process-ing, machine learning, and data mining

    HU Hai-He Postdoctor at the Computer School, Beijing University of Technology. Her research interest cov-ers pattern recognition, machine learn-ing, and infrared technology

    ZHANG Ya-Hong Ph. D. candi-date at the Computer School, Bei-jing University of Technology. Her re-search interest covers pattern recogni-tion, data mining, and big data analysis

    Corresponding author: ZHANG Ting Ph. D. candidate at the Computer School, Beijing Univer-sity of Technology. Her research inter-est covers pattern recognition, deep learning, and big data analysis. Corresponding author of this paper
  • 摘要: 为提高性别分类准确率, 在传统卷积神经网络(Convolutional neural network, CNN)的基础上, 提出一个跨连卷积神经网络(Cross-connected CNN, CCNN)模型. 该模型是一个9层的网络结构, 包含输入层、6个由卷积层和池化层交错构成的隐含层、全连接层和输出层, 其中允许第2个池化层跨过两个层直接与全连接层相连接. 在10个人脸数据集上的性别分类实验结果表明, 跨连卷积网络的准确率均不低于传统卷积网络.
  • 图  1  跨连卷积神经网络结构示意图

    Fig.  1  The crossed-connected convolutional neural network

    图  2  10 个数据集中的示例人脸图像

    Fig.  2  Examples of face images in ten datasets

    表  1  CCNN 的网络描述

    Table  1  Description of the CCNN

    Layer Type Patch size Stride Output size
    x Input 32×32
    h1 Convolution 5×5 1 28×28×6
    h2 Mean pooling 2×2 214×14×6
    h3 Convolution 5×5 110×10×12
    h4 Mean pooling 2×2 25×5×12
    h5 Convolution 2×2 14×4×16
    h6 Mean pooling 2×2 22×2×16
    h7 Fully-connected 364
    o Output 2
    下载: 导出CSV

    表  2  实验数据集的训练集和测试集信息描述

    Table  2  Number of training samples and testing samples of the experiments

    数据集 训练集 测试集
    混合 混合
    UMIST 209 57 266 95 19 114
    ORL 320 30 350 40 10 50
    Georgia Tech 4507552519530225
    FERET 6585321190105105
    Extended Yale B 1 280 3841 664 576192768
    AR 9109101 820 390390780
    Faces94 2 000 4002 400 66020680
    LFW 8 000 1 900 9 900 2 000 8002 800
    MORPH 40 997 7 102 48 099 3 000 1 000 4 000
    CelebFaces+ 27 887 37 113 65 000 2 500 2 500 5 000
    下载: 导出CSV

    表  3  CNN 和CCNN 在10 个数据集上的分类准确率(%)

    Table  3  Classi¯cation accuracies of CNN and CCNN in ten datasets (%)

    数据集CNN CCNN
    UMIST 96.4999.20
    ORL 9898.00
    Georgia Tech 97.697.78
    FERET 94.7796.44
    Extended Yale B 98.5398.82
    AR 98.7198.71
    Faces94 96.4697.35
    LFW 8787.86
    MORPH 92.7394.56
    CelebFaces+ 85.1888.70
    下载: 导出CSV

    表  4  CNN 和CCNN 在4 个数据集上的分类准确率(%)

    Table  4  Classi¯cation accuracies of CNN and CCNN in four datasets (%)

    数据集 CNN CCNN
    混合 混合
    Georgia Tech 99.49 95.71 97.6 99.49 96.07 97.78
    Extended Yale B 100 97.06 98.53 100 97.64 98.82
    Faces94 98.4894.4496.4610094.797.35
    LFW 95 79 87 96.8 78.92 87.86
    下载: 导出CSV

    表  5  CCNN 在不同跨连方式的分类准确率(%)

    Table  5  Classif cation accuracies of the CCNN withdifferent cross-connections (%)

    数据集 h2-h7 h3-h7 h4-h7 h5-h7
    Georgia Tech 97.9697.8497.7897.33
    AR 98.8598.8598.7198.59
    Faces94 97.597.3597.3597.35
    LFW 88.1388.0487.8687.86
    MORPH 94.6394.6394.5694.45
    下载: 导出CSV
  • [1] Golomb B A, Lawrence D T, Sejnowksi T J. SEXNET: a neural network identifies sex from human faces. In: Proceedings of Advances in Neural Information Processing Systems (NIPS). Colorado, USA: Morgan Kaufmann Publishers Inc., 1991. 572-579
    [2] Brunelli R, Poggio T. HyberBF networks for gender classification. In: Proceedings of the 1992 DARPA Image Understanding Workshop. Detroit, USA, 1992. 311-314
    [3] Tamura S, Kawai H, Mitsumoto H. Male/female identification from 8×6 very low resolution face images by neural network. Pattern Recognition, 1996, 29(2): 331-335
    [4] Jiao Y B, Yang J C, Fang Z J, Xie S J, Park D S. Comparing studies of learning methods for human face gender recognition. In: Proceedings of the 7th Chinese Conference on Biometric Recognition (CCBR). Guangzhou, China: Springer, 2012. 67-74
    [5] Verma A, Vig L. Using convolutional neural networks to discover cogntively validated features for gender classification. In: Proceedings of the 2014 International Conference on Soft Computing and Machine Intelligence (SCMI). New Delhi, India: IEEE, 2014. 33-37
    [6] Hinton G E, Salakhutdinov R R. Reducing the dimensionality of data with neural networks. Science, 2006, 313(5786): 504-507
    [7] 魏伟波, 洪丹枫, 潘振宽, 吴鑫. 基于区域特征映射的模糊掌纹识别方法. 自动化学报, 2015, 41(2): 386-395

    Wei Wei-Bo, Hong Dan-Feng, Pan Zhen-Kuan, Wu Xin. Blurred palmprint recognition algorithm based on region feature map. Acta Automatica Sinica, 2015, 41(2): 386-395
    [8] Tivive F H C, Bouzerdoum A. A gender recognition system using shunting inhibitory convolutional neural networks. In: Proceedings of the 2006 IEEE International Joint Conference on Neural Networks (IJCNN). Vancouver, BC: IEEE, 2006. 5336-5341
    [9] Ciresan D C, Meier U, Gambardella L M, Schmidhuber J. Convolutional neural network committees for handwritten character classification. In: Proceedings of the 2011 International Conference on Document Analysis and Recognition. Beijing, China: IEEE, 2011. 1135-1139
    [10] Khalajzadeh H, Mansouri M, Teshnehlab M. Face recognition using convolutional neural network and simple logistic classifier. In: Proceedings of the 17th Online World Conference on Soft Computing in Industrial Applications. Switzerland: Springer International Publishing, 2014. 197-207
    [11] Fan J, Xu W, Wu Y, Gong Y H. Human tracking using convolutional neural networks. IEEE Transactions on Neural Networks, 2010, 21(10): 1610-1623
    [12] Jin J Q, Fu K, Zhang C S. Traffic sign recognition with hinge loss trained convolutional neural networks. IEEE Transactions on Intelligent Transportation Systems, 2014, 15(5): 1991-2000
    [13] Xu C Y, Lu C Y, Liang X D, Gao J B, Zheng W, Wang T J, Yan S C. Multi-loss regularized deep neural network. IEEE Transactions on Circuits and Systems for Video Technology, DOI: 10.1109/TCSVT.2015.2477937
    [14] Krizhevsky A, Sutshever I, Hinton G E. ImageNet classification with deep convolutional neural networks. In: Proceedings of Advances in Neural Information Processing Systems (NIPS). Lake Tahoe, USA: Curran Associates, Inc., 2012. 4-13
    [15] Szegedy C, Liu W, Jia Y Q, Sermanet P, Reed S, Anguelov D, Erhan D, Vanhoucke V, Rabinovich A. Going deeper with convolutions. arXiv: 1409.4842, 2014.
    [16] He K M, Zhang X Y, Ren S Q, Sun J. Deep residual learning for image recognition. arXiv: 1512.03385, 2015.
    [17] 随婷婷, 王晓峰. 一种基于CLMF的深度卷积神经网络模型. 自动化学报, 2016, 42(6): 875-882

    Sui Ting-Ting, Wang Xiao-Feng. Convolutional neural network with candidate location and multi-feature fusion. Acta Automatica Sinica, 2016, 42(6): 875-882
    [18] Zhong S H, Liu Y, Ren F F, Zhang J H, Ren T W. Video saliency detection via dynamic consistent spatio-temporal attention modelling. In: Proceedings of the 2013 AAAI Conference on Artificial Intelligence. Bellevue, USA: AAAI, 2013. 1063-1069
    [19] 齐美彬, 檀胜顺, 王运侠, 刘皓, 蒋建国. 基于多特征子空间与核学习的行人再识别. 自动化学报, 2016, 42(2): 299-308

    Qi Mei-Bin, Tan Sheng-Shun, Wang Yun-Xia, Liu Hao, Jiang Jian-Guo. Multi-feature subspace and kernel learning for person re-identification. Acta Automatica Sinica, 2016, 42(2): 299-308
    [20] Sun Y, Wang X G, Tang X O. Deep learning face representation from predicting 10000 classes. In: Proceedings of the 2014 IEEE Conference on Computer Vision and Pattern Recognition (CVPR). Columbus, OH: IEEE. 2014. 1891-1898
    [21] Hubel D H, Wiesel T N. Receptive fields, binocular interaction and functional architecture in the cat's visual cortex. Journal of Physiology, 1962, 160(1): 106-154
    [22] Fukushima K, Miyake S, Ito T. Neocognitron: a neural network model for a mechanism of visual pattern recognition. IEEE Transactions on Systems, Man, and Cybernetics, 1983, SMC-13(5): 826-834
    [23] LeCun Y, Bottou L, Bengio Y, Haffner P. Gradient-based learning applied to document recognition. Proceedings of the IEEE, 1998, 86(11): 2278-2324
    [24] Graham D B, Allinson N M. Characterising virtual eigensignatures for general purpose face recognition. Face Recognition: from Theory to Applications. Berlin Heidelberg: Springer-Verlag, 1998. 446-456
    [25] Chen L, Man H, Nefian A V. Face recognition based on multi-class mapping of Fisher scores. Pattern Recognition, 2005, 38(6): 799-811
    [26] Lee K C, Ho J, Kriegman D J. Acquiring linear subspaces for face recognition under variable lighting. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2005, 27(5): 684-698
    [27] Maetinez A M, Kak A C. PCA versus LDA. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2001, 23(2): 228-233
    [28] Huang G B, Ramesh M, Berg T, Learned-Miller E. Labeled Faces in the Wild: a Database for Studying Face Recognition in Unconstrained Environment, Technical Report 07-49, University of Massachusetts, Amherst, USA, 2007.
    [29] Liu Z W, Luo P, Wang X G, Tang X O. Deep learning face attributes in the wild. In: Proceedings of the 2015 International Conference on Computer Vision (ICCV). Santiago, Chile: IEEE, 2015. 3730-3738
  • 期刊类型引用(40)

    1. 郭宇丰,董亚杰,李艳,李浩,王娜,王联旭. 基于边缘计算的智能化建筑安全监控系统. 昆明冶金高等专科学校学报. 2024(04): 89-94 . 百度学术
    2. 梁玉泽,冀俊忠. 基于原型学习与深度特征融合的脑功能连接分类方法研究. 自动化学报. 2022(02): 504-514 . 本站查看
    3. 朱子健,刘琪,陈红芬,张贵阳,王福宽,霍炬. 基于并行融合网络的航拍红外车辆小目标检测方法. 光子学报. 2022(02): 190-202 . 百度学术
    4. 王贲武,黄峰. 基于深度网络跨层特征融合的氩弧焊点分类. 计算机集成制造系统. 2022(04): 1011-1019 . 百度学术
    5. 赵腾飞,胡国玉,周建平,刘广,陈旭东,董娅兰. 卷积神经网络算法在核桃仁分类中的研究. 中国农机化学报. 2022(06): 181-189 . 百度学术
    6. 陈恩志,王春阳,李晨晨,吴夏铭. 改进的LeNet-5网络在图像分类中的研究. 长春理工大学学报(自然科学版). 2022(05): 74-79 . 百度学术
    7. 吴晓婷,冯晓毅,黄安,张雪毅,董晶,刘丽. 人脸亲子关系验证研究综述. 自动化学报. 2022(12): 2886-2910 . 本站查看
    8. 杨晨旭,蔡克参,张红云,苗夺谦. 基于人脸图像的二阶段性别分类算法. 计算机科学与探索. 2021(03): 524-532 . 百度学术
    9. 冯新扬,邵超. 跨卷积网络特征融合的SAR图像目标识别. 系统仿真学报. 2021(03): 554-561 . 百度学术
    10. 计浩浩,张诚,卿粼波,王正勇,韩龙玫. 基于机器学习的城市空间品质大规模量化方法. 计算机工程与设计. 2021(04): 1096-1102 . 百度学术
    11. 沈锐,陈亚军. 一种基于批量归一化的LeNet网络改进方法. 四川文理学院学报. 2021(02): 136-140 . 百度学术
    12. 黄庭鸿,聂卓赟,王庆国,李帅,晏来成,郭东生. 基于区块自适应特征融合的图像实时语义分割. 自动化学报. 2021(05): 1137-1148 . 本站查看
    13. 皮瑶,刘惠康,李倩. 基于柔性薄膜阵列压力传感器的抱闸故障诊断. 高技术通讯. 2021(08): 836-843 . 百度学术
    14. 谢沛松,胡黄水,张金栋. 改进LeNet-5网络模型图像分类. 长春工业大学学报. 2021(05): 455-461 . 百度学术
    15. 贾小军,叶利华,邓洪涛,刘子豪,陆锋杰. 基于卷积神经网络的蓝印花布纹样基元分类. 纺织学报. 2020(01): 110-117 . 百度学术
    16. 林景栋,吴欣怡,柴毅,尹宏鹏. 卷积神经网络结构优化综述. 自动化学报. 2020(01): 24-37 . 本站查看
    17. 姚丽莎,徐国明,赵凤. 基于卷积神经网络局部特征融合的人脸表情识别. 激光与光电子学进展. 2020(04): 338-345 . 百度学术
    18. 张文琪,陈平,吴泱序. 基于跨层卷积神经网络的石刻碑文识别. 测试技术学报. 2020(03): 197-203 . 百度学术
    19. 乔俊飞,郭子豪,汤健. 面向城市固废焚烧过程的二噁英排放浓度检测方法综述. 自动化学报. 2020(06): 1063-1089 . 本站查看
    20. 郎波,张娜,段新新. 基于融合机制的多模型神经网络人物群体分类模型. 计算机系统应用. 2020(08): 127-134 . 百度学术
    21. 刘教民,刘艳晖,朱叶. 基于单模型集成的年龄估计框架. 河北工业大学学报. 2020(04): 40-46 . 百度学术
    22. 魏巍,徐卫峰. 卷积神经网络在类风湿性关节炎X光影像自动识别的应用及效果分析. 医院管理论坛. 2020(07): 72-74 . 百度学术
    23. 阴紫微,陈淑荣. 基于双路卷积神经网络的人脸性别识别. 现代计算机. 2020(24): 64-68+85 . 百度学术
    24. 杨旭,尚振宏. 基于改进AlexNet的人脸表情识别. 激光与光电子学进展. 2020(14): 243-250 . 百度学术
    25. 郭鹏程,张文琪,李毅红. 基于跨层网络的危险物品X射线自动识别. 科学技术与工程. 2020(33): 13718-13724 . 百度学术
    26. 石学超,周亚同,池越. 基于多层特征融合可调监督函数卷积神经网络的人脸性别识别. 计算机应用研究. 2019(03): 940-944 . 百度学术
    27. 马中启,朱好生,杨海仕,王琪,胡燕海. 基于多特征融合密集残差CNN的人脸表情识别. 计算机应用与软件. 2019(07): 197-201 . 百度学术
    28. 季珂,韩龙玫,卿粼波,刘美,吴晓红. 基于视频的行人视力状况分析展示系统. 计算机系统应用. 2019(07): 51-57 . 百度学术
    29. 刘金利,张培玲. 改进LeNet-5网络在图像分类中的应用. 计算机工程与应用. 2019(15): 32-37+95 . 百度学术
    30. 文元美,欧阳文,凌永权. 面向表情识别的双通道卷积卷积神经网络. 计算机工程与设计. 2019(07): 2046-2051 . 百度学术
    31. 黄倩露,王强. 基于跨连特征融合网络的面部表情识别. 计算机工程与设计. 2019(10): 2969-2973 . 百度学术
    32. 李雨冲,闫昭帆,严国萍. 基于边缘的双路卷积神经网络及其可视化. 计算机工程与科学. 2019(10): 1837-1845 . 百度学术
    33. 王建霞,陈慧萍,李佳泽,张晓明. 基于多特征融合卷积神经网络的人脸表情识别. 河北科技大学学报. 2019(06): 540-547 . 百度学术
    34. 李勇,林小竹,蒋梦莹. 基于跨连接LeNet-5网络的面部表情识别. 自动化学报. 2018(01): 176-182 . 本站查看
    35. 高述勇,周粉粉,符朝兴,孟含. 卷积网络样本数和迭代数与识别结果关系研究. 青岛大学学报(工程技术版). 2018(01): 51-54 . 百度学术
    36. 刘继华,王丰锦,孔洁. 基于BPSO降维的软件故障倾向模块DNN预测. 计算机工程与设计. 2018(08): 2660-2667 . 百度学术
    37. 曲建岭,余路,袁涛,田沿平,高峰. 基于一维卷积神经网络的滚动轴承自适应故障诊断算法. 仪器仪表学报. 2018(07): 134-143 . 百度学术
    38. 郭磊,贺宏伟,王玉军,王昌元,杨秀云,刘露. 基于并行卷积神经网络的X线图像成像部位识别. 中国医疗器械杂志. 2018(02): 92-94+98 . 百度学术
    39. 吴章辉,李志清,杨晓玲,刘雨桐. 树状卷积神经网络的车标识别应用. 计算机系统应用. 2017(10): 166-171 . 百度学术
    40. 刘万军,梁雪剑,曲海成. 自适应增强卷积神经网络图像识别. 中国图象图形学报. 2017(12): 1723-1736 . 百度学术

    其他类型引用(44)

  • 加载中
图(2) / 表(5)
计量
  • 文章访问数:  3086
  • HTML全文浏览量:  560
  • PDF下载量:  2005
  • 被引次数: 84
出版历程
  • 收稿日期:  2015-10-16
  • 录用日期:  2016-04-01
  • 刊出日期:  2016-06-20

目录

    /

    返回文章
    返回