基于端到端技术的藏语语音识别.pdfVIP

  • 79
  • 0
  • 约2.41万字
  • 约 6页
  • 2017-11-09 发布于湖北
  • 举报
第30卷第4期 模式识别与人工智能 V01.30No.4 2017年4月 PRAI Apr. 2017 基于端到端技术的藏语语音识别术 王庆楠 郭武 解传栋 (中国科学技术大学语音及语言信息处理国家工程实验室合肥230027) 摘要现阶段基于链接时序分类技术的端到端的大规模连续语音识别成为研究热点,文中将其应用于藏语识别 中,取得优于主流的双向长短时记忆网络性能.在基于端到端的语音识别中,不需要发音字典等语言学知识,识别 性能无法得到保证.文中提出将已有的语言学知识结合至端到端的声学建模中,采用绑定的三音子作为建模单元, 解决建模单元的稀疏性问题,大幅提高声学建模的区分度和鲁棒性.在藏语测试集上,通过实验证明文中方法提高 基于链接时序分类技术的声学模型的识别率,并验证语言学知识和基于端到端声学建模技术结合的有效性. 关键词端到端,藏语,自动语音识别,链接时序分类 183 DOI

文档评论(0)

1亿VIP精品文档

相关文档