带权复杂图模型的专利关键词标引研究.PDFVIP

带权复杂图模型的专利关键词标引研究.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
带权复杂图模型的专利关键词标引研究

研究论文 带权复杂图模型的专利关键词标引研究* 李军锋 吕学强 周绍钧 (北京信息科技大学网络文化与数字传播北京市重点实验室 北京 100101) 摘要: 【目的 】专利关键词标引是中文信息处理领域较为基础的环节, 在专利检索、专利翻译以及专利自动摘要 中具有较高的应用价值。【方法 】采用K-最邻近耦合图将专利文献映射成复杂网络图模型, 结合平均路径变化 量、平均聚类系数变化量以及当前节点对整个复杂图模型流动性的影响, 提出平均连通权重评价指标。分析关 键词位置信息、关键词跨度信息以及关键词逆文档频率信息, 提出专利综合相关特征衡量关键词的重要性。 【结果 】在传感器领域专利文献的实验结果中, Top-8 级别上准确率达到60.9%, Top-10 级别上召回率达到73.4%。 【局限 】对低频关键词的处理效果不够理想, 影响了标引效果。【结论 】实验结果表明该方法的有效性, 对专利标 引具有积极意义。 关键词: 复杂图模型 拓扑势 关键词标引 平均连通权重 综合相关特征 分类号: TP391.1 1 引 言 词组或者短语表达专利信息的主题内容。国内外学者 对关键词标引做了大量研究, 依据关键词标引采用的 专利文献作为信息化社会的重要资源, 所反映的 理论方法, 主要分为: 技术信息内容涉及人类生活的诸多方面。专利关键词 (1) 统计分析方法, 主要利用专利信息中术语的 作为专利文献核心要素, 不仅能为用户提供简洁内容 显著特征, 如共现、逆文档频次、互信息等。Wartena 摘要, 而且使专利信息定位更加快速、便捷和准确。 等[3]在TF-IDF 的基础上, 结合词间共现分布和词间语 专利关键词标引(Patent Keyword Indexing, PKI)在专利 义关系进行关键词抽取, 相比传统的 TF-IDF 方法提 领域具有越来越广泛的应用, 如专利信息检索、专利 高了抽取关键词的精度与广度。罗准辰等[4]在边界参 翻译等。专利信息检索通过对用户的查询字段与专利 数与互信息结合的基础上提出了分离模型, 显著提高 信息进行相似度计算, 展示出用户所需要的信息, 通 了关键词标引质量。 过专利关键词标引进一步提升与精炼专利信息, 因 (2) 语义分析方法, 此类方法从自然语言的语义 此专利关键词标引可以有效提高专利信息检索的性 角度探索关键词标引。索红光等[5]将《知网》作为知 [1] [2] 能 。Fujii 等 提出长句子与关键词是影响专利翻译 识库, 结合词汇间语义信息提出构建词汇链的算法, 正确率的关键要素, 由此可见专利关键词对专利文献 有效改善了关键词标引的性能。Noh 等[6]利用主题相关 翻译也起着重要作用。 度, 通过分析候选关键词的语义信息从句子抽取关键 词, 取得了较好的抽取效果。 2 相关研究 (3) 人工智能分析方法, 主要从机器学习的角度 专利关键词标引, 致力于从专利文献中自动抽取 对自动标引进行研究。章成志[7]将机器学习模型与集 通讯作者: 李军锋, ORCID: 0000-0002-6561-1043, E-mail: lijunfeng1990@live.cn 。 *本文系国家自然科学基金项目“基于本体的专利自动标引研究”(项目编号:、北京市教委科技发展计划重点项目暨北京 市自然科学基金B 类重点项目“面向领域的互联网多模态信息精准搜索方法研究”(项目编号: KZ201311232037)和北京市属高等学校创 新团队建设与教师职业发展计划项目“大数据内容理解的

文档评论(0)

zhuwo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档