CN119811370A 基于音素分类的语音对齐方法、装置、设备和介质 (广州视源电子科技股份有限公司).docxVIP

  • 0
  • 0
  • 约1.79万字
  • 约 26页
  • 2026-06-29 发布于山西
  • 举报

CN119811370A 基于音素分类的语音对齐方法、装置、设备和介质 (广州视源电子科技股份有限公司).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119811370A

(43)申请公布日2025.04.11

(21)申请号202311311481.3

(22)申请日2023.10.10

(71)申请人广州视源电子科技股份有限公司

地址510530广东省广州市黄埔区云埔四

路6号

申请人广州视睿电子科技有限公司

(72)发明人章武峰

(74)专利代理机构北京泽方誉航专利代理事务所(普通合伙)11884

专利代理师陈照辉

(51)Int.Cl.

G10L15/02(2006.01)

G10L15/06(2013.01)

G10L15/16(2006.01)

G10L15/26(2006.01)

H04N21/44(2011.01)

H04N21/845(2011.01)

权利要求书2页说明书9页附图3页

(54)发明名称

基于音素分类的语音对齐方法、装置、设备

和介质

(57)摘要

CN119811370A本申请实施例公开了基于音素分类的语音对齐方法、装置、电子设备和存储介质。该语音对齐方法中,将待处理音频数据输入预训练的音素分类模型得到第一音素拆分结果;对待处理音频数据的进行语音识别得到语音识别文本,对语音识别文本进行音素拆分得到第二音素拆分结果;将第一音素拆分结果与第二音素拆分结果进行路径求

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档