- 79
- 0
- 约2.41万字
- 约 6页
- 2017-11-09 发布于湖北
- 举报
第30卷第4期 模式识别与人工智能 V01.30No.4
2017年4月 PRAI Apr. 2017
基于端到端技术的藏语语音识别术
王庆楠 郭武 解传栋
(中国科学技术大学语音及语言信息处理国家工程实验室合肥230027)
摘要现阶段基于链接时序分类技术的端到端的大规模连续语音识别成为研究热点,文中将其应用于藏语识别
中,取得优于主流的双向长短时记忆网络性能.在基于端到端的语音识别中,不需要发音字典等语言学知识,识别
性能无法得到保证.文中提出将已有的语言学知识结合至端到端的声学建模中,采用绑定的三音子作为建模单元,
解决建模单元的稀疏性问题,大幅提高声学建模的区分度和鲁棒性.在藏语测试集上,通过实验证明文中方法提高
基于链接时序分类技术的声学模型的识别率,并验证语言学知识和基于端到端声学建模技术结合的有效性.
关键词端到端,藏语,自动语音识别,链接时序分类
183 DOI
您可能关注的文档
最近下载
- 新19J108 外墙外保温薄抹灰系统建筑构造.docx
- 巧手制作不倒翁(教案) 北师大版二年级上册综合实践活动.pdf VIP
- 冀人版科学六年级下册活动手册答案 课件(1至19课).pptx VIP
- PSA变压吸附制氮设备培训-资料.doc
- 企业会计综合实训(第二版)刘燕习题答案.pdf VIP
- 20222024年义务教育国家质量监测八年级音乐学科试题.docx VIP
- 15G366-1- 桁架钢筋混凝土叠合板(60mm厚底板).pdf VIP
- 生活垃圾收集站(压缩式)设置标准 DG_TJ08-402-2021.pdf VIP
- 大型医用设备使用效益分析报告(案例模板).docx
- Canon佳能470EX-AI 使用说明书.pdf
原创力文档

文档评论(0)