基于人工智能的唤醒词检测方法、装置、设备及介质.pdf

下载文档

16
0
约2.27万字
约 20页
2020-09-15 发布于湖南
举报
版权申诉
保障服务

基于人工智能的唤醒词检测方法、装置、设备及介质.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 110838289 A (43)申请公布日 2020.02.25 (21)申请号 201911124453.4 G06N 3/04(2006.01) (22)申请日 2019.11.14 (71)申请人腾讯科技（深圳）有限公司地址 518000 广东省深圳市南山区高新区科技中一路腾讯大厦35层 (72)发明人陈杰　苏丹　金明杰　朱振岭　 (74)专利代理机构北京志霖恒远知识产权代理事务所(普通合伙) 11435 代理人成丹 (51)Int.Cl. G10L 15/16(2006.01) G10L 15/197(2013.01) G10L 15/22(2006.01) G10L 15/02(2006.01) G06N 3/08(2006.01) 权利要求书2页说明书11页附图6页 (54)发明名称基于人工智能的唤醒词检测方法、装置、设备及介质 (57)摘要本申请公开了一种基于人工智能的唤醒词检测方法、装置、设备及其存储介质。该方法包括：获取待识别语音数据，并提取待识别语音数据中每个语音帧的语音特征；将语音特征输入到预先构建的深度神经网络模型，输出语音特征对应于音节标识的后验概率向量，该深度神经网络模型包括与预先构建的发音字典的音节的数量相同的音节输出单元；根据音节组合序列从后验概率向量中确定目标概率向量，该音节组合序列是基于输入的唤醒词文本构建的；再根据目标概率向量计算置信度，且在置信度大于等于阈值时 A 确定语音帧包含唤醒词文本。本申请实施例提供 9 的方案，计算复杂度低，且响应速度快，无需针对 8 2 8 固定唤醒词进行专门优化改进，有效地提升了唤 3 8 0 醒检测效率。 1 1 N C CN 110838289 A 权　利　要　求　书 1/2页 1.一种基于人工智能的唤醒词检测方法，其特征在于，该方法包括：获取待识别语音数据，并提取所述待识别语音数据中每个语音帧的语音特征；将所述语音特征输入到预先构建的深度神经网络模型，输出所述语音特征对应于音节标识的后验概率向量，所述深度神经网络模型包括与预先构建的发音字典的音节的数量相同的音节输出单元；根据音节组合序列从所述后验概率向量中确定目标概率向量，所述音节组合序列是根据输入的唤醒词文本构建的；再根据所述目标概率向量计算置信度，且在所述置信度大于等于阈值时确定所述语音帧包含所述唤醒词文本。 2.根据权利要求1所述的基于人工智能的唤醒词检测方法，其特征在于，所述根据所述目标概率向量计算置信度包括：对所述目标概率向量所包含的每个后验概率值进行概率处理；根据所述音节组合序列中所包含的音节标识与所述唤醒词文本所包含的字符之间的映射关系，确定所述唤醒词文本中是否包含多音字；在所述唤醒词文本中不包含多音字时，根据概率处理后的目标概率向量计算置信度。 3.根据权利要求2所述的基于人工智能的唤醒词检测方法，其特征在于，所述根据所述目标概率向量计算置信度还包括：在所述唤醒词文本中包含多音字时，将所述概率处理后的目标概率向量按照所述多音字的对应关系进行求和处理；根据求和处理后的目标概率向量计算置信度。 4.根据权利要求2或3所述的基于人工智能的唤醒词检测方法，其特征在于，