CN106991084-CN201710192657-一种文档评估方法及装置.pdfVIP

CN106991084-CN201710192657-一种文档评估方法及装置.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
CN106991084-CN201710192657-一种文档评估方法及装置

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 CN 106991084 A (43)申请公布日 2017.07.28 (21)申请号 201710192657.6 (22)申请日 2017.03.28 (71)申请人 中国长城科技集团股份有限公司 地址 518000 广东省深圳市南山区科技园 长城计算机大厦 (72)发明人 熊文 丁紫惠  (74)专利代理机构 深圳中一专利商标事务所 44237 代理人 阳开亮 (51)Int.Cl. G06F 17/27(2006.01) G06F 17/30(2006.01) 权利要求书3页 说明书16页 附图5页 (54)发明名称 一种文档评估方法及装置 (57)摘要 本发明公开了一种文档评估方法及装置,其 中,所述文档评估方法包括:获取目标文档的抽 取信息,所述抽取信息包括:命名实体、长名词短 语及长动词短语;基于所述抽取信息,计算所述 目标文档的技术原创度指标,写作质量特征度指 标及技术分布度指标,其中,所述技术原创性指 标用来表达所述目标文档的创新程度,所述写作 质量特征度指标用来表达所述目标文档的复杂 程度,所述技术分布度指标用来表达所述目标文 档在其它文档中的分布程度;对所述目标文档的 技术原创度指标,写作质量特征度指标及技术分 布度指标进行加权求和,得到所述目标文档的综 A 合重要度评分;输出所述目标文档的综合重要度 4 评分。本发明方案可以从多指标角度对文档进行 8 0 1 更为可靠的评估。 9 9 6 0 1 N C CN 106991084 A 权 利 要 求 书 1/3页 1.一种文档评估方法,其特征在于,所述文档评估方法包括: 获取目标文档的抽取信息,所述抽取信息包括:命名实体、长名词短语及长动词短语; 基于所述抽取信息,计算所述目标文档的技术原创度指标,写作质量特征度指标及技 术分布度指标,其中,所述技术原创性指标用来表达所述目标文档在所述目标文档所在的 文档集合中的创新程度,所述写作质量特征度指标用来表达所述目标文档在所述文档集合 中的复杂程度,所述技术分布度指标用来表达所述目标文档的抽取信息在所述文档集合的 其它文档中的分布程度; 对所述目标文档的技术原创度指标,写作质量特征度指标及技术分布度指标进行加权 求和,得到所述目标文档的综合重要度评分; 输出所述目标文档的综合重要度评分。 2.如权利要求1所述的文档评估方法,其特征在于,所述获取目标文档的抽取信息,之 后还包括: 根据各个目标摘要句在所述目标文档中的先后顺序,依次提取各个目标摘要句及各个 目标摘要句的上下文,生成所述目标文档的全文摘要,其中,所述目标摘要句为包含所述抽 取信息的子句; 输出所述目标文档的全文摘要。 3.如权利要求1至2任一项所述的文档评估方法,其特征在于,所述获取目标文档的抽 取信息,包括: 基于汉语词法分析系统对所述目标文档进行分词处理、词性标注处理及命名实体识别 处理,获得所述目标文档包含的命名实体; 基于中文句法语义分析系统对所述目标文档进行成分句法分析处理,获得所述目标文 档包含的长名词短语及长动词短语。 4.如权利要求1至2任一项所述的文档评估方法,其特征在于,所述基于所述抽取信息, 计算所述目标文档的技术原创度指标,写作质量特征度指标及技术分布度指标,包括: 获取所述目标文档的长名词短语支持度、长动词短语支持度及所述目标文档归入所述 文档集合中的时间; 根据预设的技术原创度评分公

您可能关注的文档

文档评论(0)

18273502 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档