一种基于多编码器的通话语音识别方法.pdfVIP

下载本文档

2
0
约2.35万字
约 16页
2023-08-23 发布于四川
举报

一种基于多编码器的通话语音识别方法.pdf

本发明公开了一种基于多编码器的通话语音识别方法，首先对通话语音按声道信息进行说话人分类；将分类好的语音按说话时间和空白信息进行切分排序；对排序好的语音进行预处理，并转为80维的Fbank特征；将Fbank特征按照前一句、识别句和后一句进行拼接作为语境信息的来源；将拼接后的语音和目标句分别输入到两个不同的编码器中，按照不同的方式进行语境信息的融合，获得包含语境信息的隐空间特征；再输入到历史解码器中，在历史解码器中与之前识别的文本特征进行融合，得到包含上下文的特征信息；最终进行解码操作得到目标语音的

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116631385 A (43)申请公布日 2023.08.22 (21)申请号 202310418560.8 (22)申请日 2023.04.19 (71)申请人西安理工大学

您可能关注的文档

文档评论（0）

1亿VIP精品文档

更多 >

一种基于多编码器的通话语音识别方法.pdfVIP

一种基于多编码器的通话语音识别方法.pdf

您可能关注的文档

最近下载

文档评论（0）

1亿VIP精品文档

相关文档