- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 111460791 A
(43)申请公布日
2020.07.28
(21)申请号 202010239589.6 G06N 3/08(2006.01)
(22)申请日 2020.03.30
(71)申请人 北京百度网讯科技有限公司
地址 100085 北京市海淀区上地十街10号
百度大厦2层
(72)发明人 张亦鹏 张真 刘明浩 姚荣洁
郭江亮
(74)专利代理机构 北京品源专利代理有限公司
11332
代理人 孟金喆
(51)Int.Cl.
G06F 40/216(2020.01)
G06F 40/30(2020.01)
G06K 9/62(2006.01)
G06N 3/04(2006.01)
权利要求书3页 说明书12页 附图10页
(54)发明名称
文本分类方法、装置、设备以及存储介质
(57)摘要
本申请公开了一种文本分类方法、装置、设
备以及存储介质,涉及数据处理领域,尤其涉及
人工智能技术。具体实现方案为:根据文本块在
待分类文档中的位置,组合所述待分类文档中至
少两个文本块的文本特征,得到特征序列;利用
至少两个目标处理逻辑,对所述特征序列进行处
理,得到至少两种文本块间的语义关联信息,所
述至少两个目标处理逻辑通过级联不同数量的
目标处理子逻辑得到;根据所述至少两种语义关
联信息,确定所述文本块的分类结果。本申请实
施例提供了一种文本分类方法、装置、设备以及
存储介质,提高了文本块的分类准确率,进而基
A 于准确的分类结果可以实现对用户需要内容的
1 快速定位和抽取。
9
7
0
6
4
1
1
1
N
C
CN 111460791 A 权 利 要 求 书 1/3页
1.一种文本分类方法,其特征在于,包括:
根据文本块在待分类文档中的位置,组合所述待分类文档中至少两个文本块的文本特
征,得到特征序列;
利用至少两个目标处理逻辑,对所述特征序列进行处理,得到至少两种文本块间的语
义关联信息,所述至少两个目标处理逻辑通过级联不同数量的目标处理子逻辑得到;
根据所述至少两种语义关联信息,确定所述文本块的分类结果。
2.根据权利要求1所述的方法,其特征在于,所述利用至少两个目标处理逻辑,对所述
特征序列进行处理,得到至少两种文本块间的语义关联信息,所述至少两个目标处理逻辑
通过级联不同数量的目标处理子逻辑得到,包括:
将所述特征序列输入至少两个模型分支,得到所述至少两种文本块间的语义关联信
息;
所述模型分支由级联有不同数量的目标处理组件构成,所述目标处理组件关联有所述
目标处理子逻辑。
3.根据权利要求2所述的方法,其特征在于,所述将所述待运算数据输入至少两个模型
分支之后,所述方法还包括:
对所述目标处理组件的输入和所述目标处理组件的输出求和;
对求和结果进行归一化,并利用归一化结果替代所述目标处理组件的输出。
4.根据权利要求2所述的方法,其特征在于,所述目标处理组件由动态的双向长短期记
忆网络BiLSTM构成。
5.根据权利要求1-4任一所述的方法,其特征在于,所述根据文本块在待分类文档中的
位置,组合所述待分类文档中至少两个文本块的文本特征之前,所述方法还包括:
确定所述待分类文档的至少一个关键词;
根据所述文本块包括所述关键词的信息,确
文档评论(0)