- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 111209384 A
(43)申请公布日
2020.05.29
(21)申请号 202010019179.0
(22)申请日 2020.01.08
(71)申请人 腾讯科技(深圳)有限公司
地址 518000 广东省深圳市南山区高新区
科技中一路腾讯大厦35层
(72)发明人 司鹏达 邓强 钟滨 徐进
(74)专利代理机构 北京派特恩知识产权代理有
限公司 11270
代理人 王花丽 张颖玲
(51)Int.Cl.
G06F 16/332(2019.01)
G06F 40/30(2020.01)
权利要求书4页 说明书23页 附图12页
(54)发明名称
基于人工智能的问答数据处理方法、装置及
电子设备
(57)摘要
本发明提供了一种基于人工智能的问答数
据处理方法、装置、设备及存储介质;方法包括:
获取问答数据的语义特征;对所述问答数据的语
义特征进行解耦处理,得到所述问答数据的实体
特征以及所述问答数据的意图特征;基于所述实
体特征确定所述问答数据对应实体维度匹配的
实体匹配分数,并基于所述意图特征确定所述问
答数据对应意图维度匹配的意图匹配分数;当所
述实体匹配分数以及所述意图匹配分数中的至
少一个满足对应的答非所问条件时,确定所述问
答数据属于答非所问的类型,通过本发明,能够
A 从不同维度识别出答非所问的问答数据,从而提
4 高问答数据的质量。
8
3
9
0
2
1
1
1
N
C
CN 111209384 A 权 利 要 求 书 1/4页
1.一种基于人工智能的问答数据处理方法,其特征在于,所述方法包括:
获取问答数据的语义特征;
对所述问答数据的语义特征进行解耦处理,得到所述问答数据的实体特征以及所述问
答数据的意图特征;
基于所述实体特征确定所述问答数据对应实体维度匹配的实体匹配分数,并基于所述
意图特征确定所述问答数据对应意图维度匹配的意图匹配分数;
当所述实体匹配分数以及所述意图匹配分数中的至少一个满足对应的答非所问条件
时,确定所述问答数据属于答非所问的类型。
2.根据权利要求1所述的方法,其特征在于,获取问答数据的语义特征之前,所述方法
还包括:
当用于答复问题的文本的长度超过文本长度阈值时,提取所述文本的摘要以作为所述
问题的答案,并结合所述问题组成问答数据;
当用于答复问题的文本长度不超过文本长度阈值时,将所述文本作为所述问题的答
案,并结合所述问题组成问答数据。
3.根据权利要求1所述的方法,其特征在于,所述获取问答数据的语义特征,包括:
通过语义特征提取网络的各特征提取层,分别提取表征所述问答数据中问题与答案之
间的语义关系的子语义特征;
结合对应各特征提取层中的权重,对所述各特征提取层所提取的子语义特征进行加权
处理,得到表征所述问答数据中问题与答案之间的语义关系的语义特征;
其中,所述语义关系包括所述问题与所述答案在实体维度的匹配关系、以及所述问题
与所述答案在意图维度的匹配关系。
4.根据权利要求1所述的方法,其特征在于,所述对所述问答数据的语义特征进行解耦
处理,得到所述问答数据的实体特征以及所述问答数据的意图特征,包括:
通过问答匹配模型中的实体全连接层,将所述问答数据的语义特征,从语义特征空间
映射到实体特征空间,以得到用于表征实体维度匹配信息的实体特征;
通过问答匹配模型中的意图全连接层,将所述问答数据的语义特征,从语义特征空
文档评论(0)