一种新的基于子空间的说话人自适应方法

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

一种新的基于子空间的说话人自适应方法

张文林, 张卫强, 刘加, 李弼程, 屈丹

文章导航 > 自动化学报 > 2011 > 37(12): 1495-1502

张文林, 张卫强, 刘加, 李弼程, 屈丹. 一种新的基于子空间的说话人自适应方法. 自动化学报, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

引用本文:

张文林, 张卫强, 刘加, 李弼程, 屈丹. 一种新的基于子空间的说话人自适应方法. 自动化学报, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

ZHANG Wen-Lin, ZHANG Wei-Qiang, LIU Jia, LI Bi-Cheng, QU Dan. A New Subspace Based Speaker Adaptation Method. ACTA AUTOMATICA SINICA, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

Citation:

ZHANG Wen-Lin, ZHANG Wei-Qiang, LIU Jia, LI Bi-Cheng, QU Dan. A New Subspace Based Speaker Adaptation Method. ACTA AUTOMATICA SINICA, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

张文林, 张卫强, 刘加, 李弼程, 屈丹. 一种新的基于子空间的说话人自适应方法. 自动化学报, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

引用本文:

张文林, 张卫强, 刘加, 李弼程, 屈丹. 一种新的基于子空间的说话人自适应方法. 自动化学报, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

ZHANG Wen-Lin, ZHANG Wei-Qiang, LIU Jia, LI Bi-Cheng, QU Dan. A New Subspace Based Speaker Adaptation Method. ACTA AUTOMATICA SINICA, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

Citation:

ZHANG Wen-Lin, ZHANG Wei-Qiang, LIU Jia, LI Bi-Cheng, QU Dan. A New Subspace Based Speaker Adaptation Method. ACTA AUTOMATICA SINICA, 2011, 37(12): 1495-1502. doi: 10.3724/SP.J.1004.2011.01495

一种新的基于子空间的说话人自适应方法

doi: 10.3724/SP.J.1004.2011.01495

1.
中国人民解放军信息工程大学信息工程学院郑州 450002;
2.
清华大学电子工程系北京 100084

通讯作者:
张文林中国人民解放军信息工程大学信息工程学院博士研究生, 主要研究方向为语种识别,连续语音识别,机器学习. E-mail: zwlin_2004@163.com

计量
- 文章访问数: 1733
- HTML全文浏览量: 37
- PDF下载量: 1776
- 被引次数: 0
出版历程
- 收稿日期: 2011-01-13
- 修回日期: 2011-07-07
- 刊出日期: 2011-12-20

A New Subspace Based Speaker Adaptation Method

1.
Information Engineering Institute, PLA Information Engineering University, Zhengzhou 450002;
2.
Department of Electronic Engineering, Tsinghua University, Beijing 100084

摘要: 提出了一种新的基于子空间的快速说话人自适应方法.该方法在本征音(Eigen-voice, EV)自适应方法基础上,进一步在音子空间寻找低维子空间, 得到更为紧凑的“说话人--音子”联合子空间.该子空间不仅包含了说话人间的模型参数相关性信息,而且对音子间的模型参数相关性信息也进行了显式建模,在大大降低模型存储量的同时更为全面地反映模型参数的先验信息.在基于连续语音识别的无监督自适应实验中,在少量的自适应数据条件下,新方法取得了比最大似然线性回归和聚类最大似然线性基方法更好的效果.
- 连续语音识别 /
- 说话人自适应 /
- 本征音 /
- 本征音子
Abstract: A new speaker adaptation method based on subspace modeling is proposed. After performing eigen-voice (EV) analysis and finding the speaker subspace, another low dimensional subspace is found in the phone space. The new subspace can capture the inter-speaker variability as well as intra-speaker variability of the hidden Markov model (HMM) model parameters. This joint speaker-phone subspace is both robust and compact. In large vocabulary continuous speech recognition experiments, the new method showed better unsupervised adaptation than the baseline maximum likelihood linear regression and clustered maximum-likelihood linear basis adaptation method, especially when the adaptation data were less than 30s.
- Continuous speech recognition /
- speaker adaptation /
- eigen-voice (EV) /
- eigen-phone (EP)

参考文献(0)

资源附件(0)

WeChat

点击查看大图

计量

文章访问数: 1733
HTML全文浏览量: 37
PDF下载量: 1776
被引次数: 0

/

下载: 全尺寸图片幻灯片

分享

用微信扫码二维码

分享至好友和朋友圈

返回

版权所有 © 《自动化学报》编辑部京ICP备14019135号-6

地址：北京中关村东路95号邮政编码：100190E-mail：aas_editor@ia.ac.cn

电话：010-82544677 (日常咨询和稿件处理)，010-82544653(费用管理、寄刊)

本系统由北京仁和汇智信息技术有限公司开发技术支持： info@rhhz.net