基于转换矩阵的GLRAM在MAP结构中说话者自适应的应用.docxVIP

基于转换矩阵的GLRAM在MAP结构中说话者自适应的应用.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于转换矩阵的GLRAM在MAP结构中说话者自适应的应用   摘要:本文描述了这一种新的说话者转换矩阵用基矩阵表示的说话者自适应的方法,利用最大似然线性回归转换矩陣(mllr)的广义低阶近似(glram)构建了基矩阵,用公式表示了在最大限度的后验(map)结构下说话者的自适应。   关键词:glrammapmllr   中图分类号:g64文献标识码:a文章编号:1674-098x(2019)02(a)-0154-02   1引言   3实验   实验中使用华尔街日报语料库wsj0,在训练中使用了101个说话者的12,574种表达方式。作为特征向量,实验中使用了39维向量组成了13维的mfcc,以及它们的导数系数和加速系数。同时使用了20ms的汉明窗并以10ms滑动去提取特征向量。通过建立si模型,使用mllr得到了每个测试者的回归矩阵。这101个矩阵通过glram被分解,这些分解矩阵用来建立基矩阵。在自适应和识别的测试中,使用了nov’925k非语言表态的自适应测试集合。在监督模式下,测试的8名说话者提取1~5个句子用于自适应测试,330个句子用于识别测试。在识别测试中,使用了wsj5k非语言表态的5k封闭词汇集和wsj标准5k非语言表态的闭合双子字母组。以这个为基准,si模型给出了91.45%的单词识别准确率。图1给出了实验结果。   4结语   本文给出了说话者在si模型下一名新说话者的转换矩阵的自适应系统,同时使用在来自于训练回归矩阵的glram的基矩阵,用公式表示了在map框架下的自适应性,同ml配对比较,效果得到了改善。   参考文献   [1]c.j.leggeter,p.c.woodland.maximumlikelihoodlinearregressionforspeakeradaptationofcontinuousdensityhiddenmarkovmodel,”[j].computspeechlang,1995,2(9):171-185.   [2]y.jeong,h.s.kim.“speakeradaptationintransformspaceusinggeneralizedlowrankapproximationsofmatrices(glram),”[j].inproc.springconf.ksss,2012:27-28.   [3]j.ye.“generalizedlowrankapproximationsofmatrices,”[j].mach.learn,2005,61(1-3):167-191.

文档评论(0)

亦起学 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体湖北亦贤科技有限公司
IP属地陕西
统一社会信用代码/组织机构代码
91421023MA4F181CXD

1亿VIP精品文档

相关文档