一种基于多编码器的通话语音识别方法.pdfVIP

  • 2
  • 0
  • 约2.35万字
  • 约 16页
  • 2023-08-23 发布于四川
  • 举报

一种基于多编码器的通话语音识别方法.pdf

本发明公开了一种基于多编码器的通话语音识别方法,首先对通话语音按声道信息进行说话人分类;将分类好的语音按说话时间和空白信息进行切分排序;对排序好的语音进行预处理,并转为80维的Fbank特征;将Fbank特征按照前一句、识别句和后一句进行拼接作为语境信息的来源;将拼接后的语音和目标句分别输入到两个不同的编码器中,按照不同的方式进行语境信息的融合,获得包含语境信息的隐空间特征;再输入到历史解码器中,在历史解码器中与之前识别的文本特征进行融合,得到包含上下文的特征信息;最终进行解码操作得到目标语音的

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 116631385 A (43)申请公布日 2023.08.22 (21)申请号 202310418560.8 (22)申请日 2023.04.19 (71)申请人 西安理工大学

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档