中英双语混合语音识别研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第 20卷第 4期2008年 8月重庆邮电大学 第 20卷第 4期 2008年 8月 重庆邮电大学学报 (自然科学版 ) Journa l of C hon gq in g Un iver s ity of Po sts an d Te lecomm un ica t ion s( Na tura l Sc ien ce Ed it ion ) Vo l. 20 No. 4 A ug. 2008 中英双语混合语音识别研究 张晴晴 ,潘接林 ,颜永红 (中国科学院 声学研究所 中科信利实验室 ,北京 100080 ) 摘 要 :介绍了针对歌曲检索中出现的中英混合现象所开发的中英双语识别系统 。在双语混合语音识别中 ,主要 面临的 2个问题 : ①在保证双语识别率的前提下控制系统的复杂度 ; ②有效处理插入语中原用语引起的非母语口 音现象 。为了解决双语混合现象以及减少统计建模所需的数据量 ,通过音素混合聚类方法建立起一个统一的双语 识别系统 。在聚类算法中 ,提出了一种新型基于混淆矩阵的两遍音素聚类算法 ( TCM ) ,并将该方法与基于声学似 然度准则的聚类方法进行了比较 。实验结果表明 : 利用 TCM 进行音素聚类的识别性能优于基于声学似然度音素 聚类的性能 ,最终得到的中英双语识别系统在纯英文测试集上的短语错误率 ( PER )相对基线单英文识别系统下降 7. 19 % ;在双语混合测试集上 PER 相对基线混合模型下降 13. 78 % ; 同时在纯中文测试集上保持了基线单中文识 别系统的性能 。 关键词 :双语识别 ;聚类算法 ;自适应 中图分类号 : TN93 文献标识码 : A 文章编号 : ( 2008 ) 0420391206 D eve lopm en t of a M an da r in 2En g l ish b il in gua l speech recogn it ion sy stem ZHAN G Q ing2q ing, PAN J ie2lin, YAN Yong2hong ( Th ink IT Sp eech L abo ra to ry, In stitu te of A cou stics of Ch ine se A cadem y of Science s, B e ijing 100080 , P. R. Ch ina) A b stra c t: The M anda rin2English b ilingua l sp eech recogn ition system wh ich ha s been deve lop ed fo r the M anda rin2English p henom enon in song re trieva l is in troduced. The m a in d ifficu ltie s to hand le the b ilingua l sp eech recogn ition fo r rea l wo rld app lica tion a re focu sed on two a sp ec ts: the first is to ba lance the p e rfo rm ance on in te r and in tra - sen ten tia l language sw itc2 h ing and to reduce the comp lexity of the b ilingua l sp eech recogn ition system; the second is to effec tive ly dea l w ith the m a2 trix language accen ts in em bedded language. In o rde r to p roce ss the in tra2sen ten tia l language sw itch ing and reduce the a2 moun t of da ta requ ired to robu stly e stim a te sta tistica l mode ls, in stead of u sing two sep a ra te mono lingua l mode ls fo r each lan2 guage, a comp ac t single se t of b ilingua l acou stic mode l de rived by p hone se t m e rging and c lu ste ring is

文档评论(0)

小教资源库 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档