CN119741928A 一种基于TFCA-Res2Net的短语音声纹提取方法 (成都理工大学).docxVIP

  • 3
  • 0
  • 约1.03万字
  • 约 18页
  • 2026-06-18 发布于山西
  • 举报

CN119741928A 一种基于TFCA-Res2Net的短语音声纹提取方法 (成都理工大学).docx

(19)国家知识产权局

(12)发明专利申请

(10)申请公布号CN119741928A

(43)申请公布日2025.04.01

(21)申请号202411868988.3

(22)申请日2024.12.18

(71)申请人成都理工大学

地址610000四川省成都市成华区二仙桥

东三路1号

(72)发明人邓飞于琳黄睿王美平

(74)专利代理机构成都众恒智合专利代理事务所(普通合伙)51239

专利代理师龚攀

(51)Int.Cl.

G10L17/18(2013.01)

G10L17/02(2013.01)

权利要求书2页说明书5页附图3页

(54)发明名称

一种基于TFCA-Res2Net的短语音声纹提取

方法

(57)摘要

CN119741928A本发明公开了一种基于TFCA_Res2Net的短语音声纹提取方法,包括对原始语音信号进行预处理,将预处理后的原始语音信号音频经短时傅里叶变换生成对应的短时傅里叶语谱图;根据得到的短时傅里叶语谱图训练Res2Net,并引入TFCA注意力机制,得到短语音说话人识别网络;训练Res2Net过程中,以交叉熵损失函数作为训练目标函数,通过更新参数最小化损失,得到最终网络模型;使用训练好的网络模型提取音频特征,并与数据库中的特征向量进行欧式距离计算,并与阈值比较,最终识别出说话人。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档