- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(19)中华人民共和国国家知识产权局
(12)发明专利申请
(10)申请公布号 CN 111078871 A
(43)申请公布日
2020.04.28
(21)申请号 201911147060.5 G06N 3/08(2006.01)
(22)申请日 2019.11.21
(71)申请人 深圳前海环融联易信息科技服务有
限公司
地址 518000 广东省深圳市前海深港合作
区前湾一路1号A栋201室(入驻深圳市
前海商务秘书有限公司)
(72)发明人 范有文 李如先 谭江龙
(74)专利代理机构 深圳市精英专利事务所
44242
代理人 蒋学超
(51)Int.Cl.
G06F 16/35(2019.01)
G06F 40/284(2020.01)
G06N 3/04(2006.01)
权利要求书2页 说明书7页 附图4页
(54)发明名称
一种基于人工智能的合同自动分类的方法
及系统
(57)摘要
本发明公开了一种基于人工智能的合同自
动分类的方法及系统,其中方法包括:通过卷积
神经网络提取图片合同中每页的文本信息;根据
循环神经网络的自然语言处理模型对每页的文
本信息按照预先设置的标签类别进行分类。本发
明能够将每页图片合同进行自动归类,无需人工
参与,准确度高,速度快。
A
1
7
8
8
7
0
1
1
1
N
C
CN 111078871 A 权 利 要 求 书 1/2页
1.一种基于人工智能的合同自动分类的方法,其特征在于,所述方法包括:
通过卷积神经网络提取图片合同中每页的文本信息;
根据循环神经网络的自然语言处理模型对每页的文本信息按照预先设置的标签类别
进行分类。
2.根据权利要求1所述的一种基于人工智能的合同自动分类的方法,其特征在于,所述
通过卷积神经网络提取图片合同中每页的文本信息的步骤,具体包括以下步骤:
获取待识别的每页的图片合同;
根据预先训练好的卷积神经网络模型的输入层定义,对每页的图片合同进行预处理,
得到处理后的每页的原始文字图像;
根据卷积神经网络模型的卷积层定义,对每页的原始文字图像进行文字的特征提取和
特征组合,得到每页的原始文字图像对应的N*N的文字特征矩阵,其中,N为正整数;
针对每个文字特征矩阵,根据卷积神经网络模型的池化层定义,对文字特征矩阵进行
特征降维处理,得到降维后的1*1的目标特征矩阵,并将1*1的目标特征矩阵中的目标特征
值,作为一维目标序列点;
将每页的每个原始文字图像对应的一维目标序列点组成的合集,作为一维目标特征序
列;
在预先训练好的循环神经网络模型中,对一维目标特征序列进行识别,输出一维目标
特征序列对应的目标文字数据。
3.根据权利要求2所述的一种基于人工智能的合同自动分类的方法,其特征在于,所述
根据循环神经网络的自然语言处理模型对每页的文本信息按照预先设置的标签类别进行
分类的步骤,具体包括以下步骤:
读取每页的文本信息;
抓取每页文本信息中反应其文本特点的关键词;
将每页抓取的关键词进行词义分析,确定该页所属的标签类别。
4.根据权利要求3所述的一种基于人工智能的合同自动分类的方法,其特征在于,所述
标签类别包括:合同封面页、合同首页、合同价款页以及合同签字页。
5.根据权利要求1所述的一种基于人工智能的合同自动分类的方法,其特征在于,所述
根据循环神经网络
文档评论(0)