黄雅婷 石晶 许家铭 徐波

黄雅婷, 石晶, 许家铭, 徐波. 鸡尾酒会问题与相关听觉模型的研究现状与展望. 自动化学报, 2019, 45(2): 234-251. doi: 10.16383/j.aas.c180674
引用本文: 黄雅婷, 石晶, 许家铭, 徐波. 鸡尾酒会问题与相关听觉模型的研究现状与展望. 自动化学报, 2019, 45(2): 234-251. doi: 10.16383/j.aas.c180674
HUANG Ya-Ting, SHI Jing, XU Jia-Ming, XU Bo. Research Advances and Perspectives on the Cocktail Party Problem and Related Auditory Models. ACTA AUTOMATICA SINICA, 2019, 45(2): 234-251. doi: 10.16383/j.aas.c180674
Citation: HUANG Ya-Ting, SHI Jing, XU Jia-Ming, XU Bo. Research Advances and Perspectives on the Cocktail Party Problem and Related Auditory Models. ACTA AUTOMATICA SINICA, 2019, 45(2): 234-251. doi: 10.16383/j.aas.c180674


中国科学院战略性先导科技专项 XDBS01070000

国家自然科学基金 61602479

北京市科技重大专项 Z181100001518006


    黄雅婷  中国科学院自动化研究所博士研究生.主要研究方向是语音分离, 听觉模型, 类脑智能.本文共同第一作者. E-mail: huangyating2016@ia.ac.cn

    石晶  中国科学院自动化研究所博士研究生.主要研究方向是语音分离, 听觉模型, 自然语言处理, 深度学习.本文共同第一作者.E-mail:shijing2014@ia.ac.cn

    徐波  中科院自动化所所长, 研究员.中科院脑科学与智能技术卓越创新中心副主任.长期从事人工智能研究, 主要研究方向为类脑智能, 类脑认知计算模型, 自然语言处理与理解, 类脑机器人.E-mail:xubo@ia.ac.cn


    许家铭  中国科学院自动化研究所副研究员.主要研究方向为语音处理与听觉注意, 智能问答和对话, 深度学习和强化学习.本文通信作者.E-mail:jiaming.xu@ia.ac.cn

Research Advances and Perspectives on the Cocktail Party Problem and Related Auditory Models


the Strategic Priority Research Program of Chinese Academy of Sciences XDBS01070000

National Natural Science Foundation of China 61602479

the Beijing Brain Science Project Z181100001518006

  • 摘要: 近些年,随着电子设备和人工智能技术的飞速发展,人机语音交互的重要性日益凸显.然而,由于干扰声源的存在,在鸡尾酒会等复杂开放环境下的语音交互技术远没有达到令人满意的程度.现阶段,开发一个具备较强自适应性和鲁棒性的听觉计算系统仍然是一件极具挑战性的任务.因此,鸡尾酒会问题的深入探索对智能语音处理领域中的说话人识别、语音识别、关键词唤醒等一系列重要任务都具有非常重要的研究意义和应用价值.本文综述了鸡尾酒会问题相关听觉模型研究的现状与展望.在简要介绍了听觉机理的相关研究,并概括了解决鸡尾酒会问题的多说话人语音分离相关计算模型之后,本文还讨论了受听觉认知机理启发的听觉注意建模方法,认为融入声纹记忆和注意选择的听觉模型在复杂的听觉环境下具有更好的适应性.之后,本文简单回顾了近期的多说话人语音识别模型.最后,本文讨论了目前各类计算模型用于处理鸡尾酒会问题时遇到的困难和挑战,并对未来的研究方向进行了展望.
