- 1
- 0
- 约1.84万字
- 约 29页
- 2026-01-15 发布于重庆
- 举报
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114203159B(45)授权公告日2025.07.04
(21)申请号202111615879.7
(56)对比文件
(22)申请日2021.12.27
CN111564164
A,2020.08.21
(65)同一申请的已公布的文献号
CN113256751
A,2021.08.13
申请公布号CN114203159A
审查员何元
(43)申请公布日2022.03.18
(73)专利权人深圳市优必选科技股份有限公司
地址518000广东省深圳市南山区学苑大
道1001号南山智园C1栋16、22楼
(72)发明人丁万黄东延赵之源杨志勇
(74)专利代理机构深圳中一联合知识产权代理
有限公司44414
专利代理师刘永康
(51)Int.CI.
G10L15/02(2006.01)
G10L25/63(2013.01)
权利要求书2页
说明书11页附图3页
(54)发明名称
语音情感识别方法、终端设备及计算机可读存储介质
(57)摘要
本申请适用于语音处理技术领域,提供了一种语音情感识别方法、装置、终端设备及计算机可读存储介质,包括:获取对待处理语音进行语音识别得到的文本特征,以及对所述待处理语音进行音频特征提取得到的音频特征;将所述文本特征映射到图像空间,获得图像特征;根据所述音频特征和所述文本特征的对应关系,将所述音频特征和所述图像特征进行信息融合,获得融合特征;根据所述融合特征识别所述待处理语音的情感类别。通过上述方法,可以有效提高语音情感识别的精度。
获取对待处理语音进行语音识别得到的文
本特征,以及对所述待处理语音进行音频
特征提取得到的音频特征
将所述文本特征映射到图像空间,获得图像特征
根据所述音频特征和所述文本特征的对应
关系,将所述音频特征和所述图像特征进
行信息融合,获得融合特征
根据所述融合特征识别所述待处理语音的情感类别
S201
S202
S203
S204
CN114203159
CN114203159B
CN114203159B权利要求书1/2页
2
1.一种语音情感识别方法,其特征在于,包括:
获取对待处理语音进行语音识别得到的文本特征,以及对所述待处理语音进行音频特征提取得到的音频特征;
将所述文本特征映射到图像空间,获得图像特征;
计算所述图像特征中的第一局部特征与所述文本特征中的第二局部特征之间的第一映射关系,其中,所述第一局部特征用于表征图像中的区域,所述第二局部特征用于表征文本中的词语;
计算所述音频特征中的第三局部特征与所述文本特征中的第四局部特征之间的第二映射关系,其中,所述第三局部特征用于表征音频中的音素,所述第四局部特征用于表征文本中的词语;
根据所述第一映射关系和所述第二映射关系,将所述音频特征和所述图像特征进行信息融合,获得融合特征;
根据所述融合特征识别所述待处理语音的情感类别。
2.如权利要求1所述的语音情感识别方法,其特征在于,在将所述文本特征映射到图像空间,获得图像特征之前,所述方法还包括:
获取训练文本、以及与所述训练文本表达语义相匹配的训练图像;
将所述训练文本的特征输入预设的生成器,获得生成图像的特征;
将所述生成图像的特征和所述训练图像的特征输入预设的判别器,获得判别结果;
根据所述判别结果更新所述生成器的参数,获得训练后的所述生成器;
相应的,所述将所述文本特征映射到图像空间,获得图像特征,包括:
将所述文本特征输入训练后的所述生成器,获得所述图像特征。
3.如权利要求1所述的语音情感识别方法,其特征在于,所述根据所述第一映射关系和所述第二映射关系,将所述音频特征和所述图像特征进行信息融合,获得融合特征,包括:
对于每组第三局部特征,根据所述第一映射关系和所述第二映射关系获取目标特征,所述目标特征为所述图像特征中与所述第三局部特征对应的第一局部特征;
将所述第三局部特征添加到所述目标特征上,获得融合后的所述目标特征;
在对所有第三局部特征处理后,将融合后的所述目标特征和未经融合的第一局部特征生成所述融合特征。
4.如权利要求1所述的语音情感识别方法,其特征在于,所述根据所述融合特征识别所述待处理语音的情感类别,包括:
对所述融合特征进行特征提取处理,获得目标特征;
将所述目标特征输入预设的分类器,输出所述情感类别。
5.如权利要求1所述的语音情感识别方法,其特
您可能关注的文档
- CN113298610B 信息推荐与获取方法、设备及存储介质 (阿里巴巴集团控股有限公司).docx
- CN113384693B Fcrn抗体及其使用方法 (动量制药公司).docx
- CN113442808B 车辆及其控制方法 (现代自动车株式会社).docx
- CN113473613B 由用户设备执行的方法以及用户设备 (夏普株式会社).docx
- CN113496522B 一种对包含音圈电机的镜头模组进行标定的方法及装置 (支付宝(杭州)信息技术有限公司).docx
- CN113516331B 一种建筑数据处理方法及装置 (腾讯科技(深圳)有限公司).docx
- CN113544673B 具有动态内核选择的销售点(pos)系统和方法 (布洛克公司).docx
- CN113574633B 半导体模板和制造方法 (六边钻公司).docx
- CN113584526B 一种可多堆并用的通用型电解水制氢测试系统及测试方法 (中国科学院上海应用物理研究所).docx
- CN113590454B 测试方法、装置、计算机设备和存储介质 (腾讯科技(深圳)有限公司).docx
最近下载
- 九上期末考试数学模拟.pdf VIP
- 2025年体育用品绿色技术专利行业报告.docx
- 2025年内蒙古呼和浩特市政府采购评审专家考试真题(附含答案).docx VIP
- 2023-2025中考化学真题分类汇编:专题05 元素考点01 元素及元素周期表.docx VIP
- 2025年内蒙古呼和浩特市政府采购评审专家考试真题含答案.docx VIP
- 98浙J30 卷帘门-标准图集.docx VIP
- 三年(2019-2021)中考真题化学-考点08原子结构(全国通用).docx VIP
- 2025年内蒙古呼和浩特市政府采购评审专家考试测试题及答案.docx VIP
- 二零二五版合同Amazon店铺代运营协议模板.docx VIP
- 《膝关节教学》课件.ppt VIP
原创力文档

文档评论(0)