CN114242062B 输出命令词的方法、装置、存储介质及电子装置 (浙江大华技术股份有限公司).docxVIP

CN114242062B 输出命令词的方法、装置、存储介质及电子装置 (浙江大华技术股份有限公司).docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

(19)国家知识产权局

(12)发明专利

(10)授权公告号CN114242062B(45)授权公告日2025.07.04

(21)申请号202111645679.6

(22)申请日2021.12.29

(65)同一申请的已公布的文献号申请公布号CN114242062A

(43)申请公布日2022.03.25

(73)专利权人浙江大华技术股份有限公司

地址310051浙江省杭州市滨江区滨安路

1187号

(72)发明人张锦铖史巍林聚财殷俊

(74)专利代理机构北京康信知识产权代理有限责任公司11240

专利代理师张丹红

(51)Int.CI.

G1OL15/22(2006.01)

G1OL15/197(2013.01)

(56)对比文件

US2021319795A1,2021.10.14CN113516967A,2021.10.19

CN107644638A,2018.01.30

US2020357387A1,2020.11.12

审查员可杨

权利要求书2页说明书10页附图4页

(54)发明名称

输出命令词的方法、装置、存储介质及电子

装置

(57)摘要

CN114242062B本发明实施例提供了一种输出命令词的方法、装置、存储介质及电子装置,其中,该方法包括:在持续接收音频数据的情况下,对当前接收到的音频数据的类型进行检测;响应于检测到当前接收到的音频数据为对应于目标唤醒词的目标音频数据的情况下,基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词的音频数据的出现概率;响应于确定出出现概率大于第一概率阈值的对应于目标命令词的音频数据,输出所述目标命令词。通过本发明,有效解决相关技术中存在的需要对输入语音中包括的全部词全部进行识别后才可能确定出输

CN114242062B

在持续接收音频数据的情况下,对当前接收到的音频数据的类型进行检测

响应于检测到当前接收到的音频数据为对应于目标唤醒词的

目标音频数据的情况下,基于在所述目标音频数据之后所接

收到的音频数据确定后续出现对应于命令词的音频数据的出

现概率

NodeB将确定的上述数据收发状态信息发送给RNC,其中,

RNC根据该数据收发状态信息对向NodeB发送的高速下行包

接入HSDPA多流数据进行调度

S202

S204

S206

CN114242062B权利要求书1/2页

2

1.一种输出命令词的方法,其特征在于,包括:

在持续接收音频数据的情况下,对当前接收到的音频数据的类型进行检测;

响应于检测到当前接收到的音频数据为对应于目标唤醒词的目标音频数据的情况下,基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词的音频数据的出现概率;

响应于确定出出现概率大于第一概率阈值的对应于目标命令词的音频数据,输出所述目标命令词;

基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词的音频数据的出现概率包括:基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词类型的音频数据的第一概率以及出现对应于非命令词类型的音频数据的第二概率;响应于确定出所述第一概率大于第二概率阈值,基于后续接收到的音频数据确定对应于每个命令词的音频数据的所述出现概率;

基于后续接收到的音频数据确定对应于每个命令词的音频数据的所述出现概率包括:对所述后续接收到的音频数据进行帧级解码,得到第二解码结果;基于所述第二解码结果持续对目标解码图中包括的命令词路径中的每个命令词路径对应的初始权重进行调整;将每个命令词路径对应的调整后的初始权重确定为对应于每个命令词的音频数据的所述出现概率。

2.根据权利要求1所述的方法,其特征在于,基于在所述目标音频数据之后所接收到的音频数据确定后续出现对应于命令词类型的音频数据的第一概率以及出现对应于非命令词类型的音频数据的第二概率包括:

基于在所述目标音频数据之后所接收到的音频数据在目标解码图中调整后续出现对应于命令词类型的音频数据的第一权重以及出现对应于非命令词类型的音频数据的第二权重;

基于所述第一权重和所述第二权重确定所述第一概率和所述第二概率。

3.根据权利要求2所述的方法,其特征在于,基于在所述目标音频数据之后所接收到的音频数据调整后续出现对应于命令词类型的音频数据的第一权重以及出现对应于非命令词类型的音频数

您可能关注的文档

文档评论(0)

aabbcc + 关注
实名认证
文档贡献者

若下载文档格式有问题,请咨询qq1643702686索取原版

1亿VIP精品文档

相关文档