- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
(19)国家知识产权局
(12)发明专利
(10)授权公告号CN114155836B(45)授权公告日2025.07.04
(21)申请号202111479624.2
(22)申请日2021.12.06
(65)同一申请的已公布的文献号申请公布号CN114155836A
(43)申请公布日2022.03.08
(73)专利权人科大讯飞股份有限公司
地址230088安徽省合肥市高新区望江西
路666号
(72)发明人赵子航李永超吴重亮方昕
(74)专利代理机构北京集佳知识产权代理有限公司11227
专利代理师宋东阳
(51)Int.CI.
G10L15/02(2006.01)
G10L15/26(2006.01)
G10L19/00(2013.01)
(56)对比文件
CN
103971686
A,2014.08.06
CN
111354347
A,2020.06.30
CN
113436614
A,2021.09.24
审查员郑心妍
权利要求书3页说明书11页附图6页
(54)发明名称
语音识别方法、相关设备及可读存储介质
(57)摘要
CN114155836B本申请公开了一种语音识别方法、相关设备及可读存储介质。该方案中,通过预先构建一个解码网络,该解码网络包括主解码网络以及插入在该主解码网络中的热词解码网络,在获取待识别的语音信号之后,利用该解码网络对该语音信号进行解码,并在解码过程中,利用该热词解码网络对该语音信号进行热词激励,得到对应的语音识别文本。基于该方案,只需对语音信号进行一次解码处理,即可实现对热词的激励,因此,该
CN114155836B
获取待识别的语音信号
获取预先构建的解码网络,所述解码网络包括主解码网络以热词解码网络
利用所述解码网络对所述语音信号进行解码,在解
码过程中,利用所述热词解码网络对所述语音信号
进行热词激励,得到对应的语音识别文本
S101
S102
S103
CN114155836B权利要求书1/3页
2
1.一种语音识别方法,其特征在于,所述方法包括:
获取待识别的语音信号;
获取预先构建的解码网络,所述解码网络包括主解码网络以及热词解码网络;所述热词解码网络融入到所述主解码网络;所述主解码网络为加权有限状态转换器WFST网络;所述热词解码网络为有限状态自动机FSA网络;
利用所述解码网络对所述语音信号进行解码,在解码过程中,利用所述热词解码网络对所述语音信号进行热词激励,得到对应的语音识别文本,所述利用所述热词解码网络对所述语音信号进行热词激励包括基于预设的所述热词解码网络的激励分数对所述语音信号进行热词激励;
所述解码网络的构建方法包括:构建主解码网络,所述主解码网络中包括至少一个槽位,每个所述槽位位于两个节点之间;针对所述主解码网络中的每个槽位,将所述热词解码网络插入所述槽位中,生成解码网络。
2.根据权利要求1所述的方法,其特征在于,所述解码网络的构建方法还包括:
获取第一热词列表,所述第一热词列表中包括一个或多个第一热词;
基于所述第一热词列表,构建热词解码网络,所述热词解码网络中包括多个分支,分支的数量与所述第一热词列表中第一热词的数量相同,每个分支头部和尾部的弧为静音弧。
3.根据权利要求1所述的方法,其特征在于,所述将所述热词解码网络插入所述槽位中,包括:
针对所述热词解码网络中每个分支,将所述热词解码网络中各个分支头部和尾部的静音弧拆除;
将所述分支头部的实弧对应的三音素中的第一个音素设置为所述主解码网络中所述槽位之前的首个实弧对应的三音素中的最后一个音素,将所述分支尾部的实弧对应的三音素中的最后一个音素设置为所述主解码网络中所述槽位之后的首个实弧对应的三音素中的第一个音素;
将所述分支头部的实弧与所述主解码网络中所述槽位之前的首个节点连接,将所述分支尾部的实弧与所述主解码网络中所述槽位之后的首个节点连接。
4.根据权利要求1所述的方法,其特征在于,所述利用所述解码网络对所述语音信号进行解码,在解码过程中,利用所述热词解码网络对所述语音信号进行热词激励,得到对应的语音识别文本,包括:
获取所述热词解码网络对应槽位的激励分数;
针对所述语音信号中每个语音信号帧,根据所述解码网络对所述语音信号帧进行解码,在解码过程中,根据所述热词解码网络对应槽位的激励分数对在所述热词解码网络中的解码令牌的得分进行激励;
您可能关注的文档
- CN113258779B 集成电路、反激式变换器及其控制电路和方法 (意法半导体股份有限公司).docx
- CN113298610B 信息推荐与获取方法、设备及存储介质 (阿里巴巴集团控股有限公司).docx
- CN113384693B Fcrn抗体及其使用方法 (动量制药公司).docx
- CN113442808B 车辆及其控制方法 (现代自动车株式会社).docx
- CN113473613B 由用户设备执行的方法以及用户设备 (夏普株式会社).docx
- CN113496522B 一种对包含音圈电机的镜头模组进行标定的方法及装置 (支付宝(杭州)信息技术有限公司).docx
- CN113516331B 一种建筑数据处理方法及装置 (腾讯科技(深圳)有限公司).docx
- CN113544673B 具有动态内核选择的销售点(pos)系统和方法 (布洛克公司).docx
- CN113574633B 半导体模板和制造方法 (六边钻公司).docx
- CN113584526B 一种可多堆并用的通用型电解水制氢测试系统及测试方法 (中国科学院上海应用物理研究所).docx
- CN114156086B 多层电子组件及其制造方法 (三星电机株式会社).docx
- CN114158284B 用于使用存储器内处理进行矩阵乘法的装置和方法 (北京苹芯科技有限公司).docx
- CN114203159B 语音情感识别方法、终端设备及计算机可读存储介质 (深圳市优必选科技股份有限公司).docx
- CN114219890B 一种三维重建方法、装置、设备及计算机存储介质 (中国科学院深圳先进技术研究院).docx
- CN114220414B 语音合成方法以及相关装置、设备 (广州虎牙科技有限公司).docx
- CN114222145B 一种低复杂度的快速vvc帧内编码方法 (杭州电子科技大学).docx
- CN114225412B 信息处理方法、装置、计算机设备及存储介质 (网易(杭州)网络有限公司).docx
- CN114239025B 基于区块链的数据处理方法及设备 (深圳前海微众银行股份有限公司).docx
- CN114239991B 一种基于数据驱动的楼宇供热负荷预测方法、装置与设备 (西安交通大学).docx
- CN114240134B 低轨卫星综合调度计划自动生成方法 (中国西安卫星测控中心).docx
原创力文档


文档评论(0)