- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
带权复杂图模型的专利关键词标引研究
研究论文
带权复杂图模型的专利关键词标引研究*
李军锋 吕学强 周绍钧
(北京信息科技大学网络文化与数字传播北京市重点实验室 北京 100101)
摘要: 【目的 】专利关键词标引是中文信息处理领域较为基础的环节, 在专利检索、专利翻译以及专利自动摘要
中具有较高的应用价值。【方法 】采用K-最邻近耦合图将专利文献映射成复杂网络图模型, 结合平均路径变化
量、平均聚类系数变化量以及当前节点对整个复杂图模型流动性的影响, 提出平均连通权重评价指标。分析关
键词位置信息、关键词跨度信息以及关键词逆文档频率信息, 提出专利综合相关特征衡量关键词的重要性。
【结果 】在传感器领域专利文献的实验结果中, Top-8 级别上准确率达到60.9%, Top-10 级别上召回率达到73.4%。
【局限 】对低频关键词的处理效果不够理想, 影响了标引效果。【结论 】实验结果表明该方法的有效性, 对专利标
引具有积极意义。
关键词: 复杂图模型 拓扑势 关键词标引 平均连通权重 综合相关特征
分类号: TP391.1
1 引 言 词组或者短语表达专利信息的主题内容。国内外学者
对关键词标引做了大量研究, 依据关键词标引采用的
专利文献作为信息化社会的重要资源, 所反映的
理论方法, 主要分为:
技术信息内容涉及人类生活的诸多方面。专利关键词
(1) 统计分析方法, 主要利用专利信息中术语的
作为专利文献核心要素, 不仅能为用户提供简洁内容
显著特征, 如共现、逆文档频次、互信息等。Wartena
摘要, 而且使专利信息定位更加快速、便捷和准确。 等[3]在TF-IDF 的基础上, 结合词间共现分布和词间语
专利关键词标引(Patent Keyword Indexing, PKI)在专利 义关系进行关键词抽取, 相比传统的 TF-IDF 方法提
领域具有越来越广泛的应用, 如专利信息检索、专利 高了抽取关键词的精度与广度。罗准辰等[4]在边界参
翻译等。专利信息检索通过对用户的查询字段与专利 数与互信息结合的基础上提出了分离模型, 显著提高
信息进行相似度计算, 展示出用户所需要的信息, 通 了关键词标引质量。
过专利关键词标引进一步提升与精炼专利信息, 因 (2) 语义分析方法, 此类方法从自然语言的语义
此专利关键词标引可以有效提高专利信息检索的性 角度探索关键词标引。索红光等[5]将《知网》作为知
[1] [2]
能 。Fujii 等 提出长句子与关键词是影响专利翻译 识库, 结合词汇间语义信息提出构建词汇链的算法,
正确率的关键要素, 由此可见专利关键词对专利文献 有效改善了关键词标引的性能。Noh 等[6]利用主题相关
翻译也起着重要作用。 度, 通过分析候选关键词的语义信息从句子抽取关键
词, 取得了较好的抽取效果。
2 相关研究
(3) 人工智能分析方法, 主要从机器学习的角度
专利关键词标引, 致力于从专利文献中自动抽取 对自动标引进行研究。章成志[7]将机器学习模型与集
通讯作者: 李军锋, ORCID: 0000-0002-6561-1043, E-mail: lijunfeng1990@live.cn 。
*本文系国家自然科学基金项目“基于本体的专利自动标引研究”(项目编号:、北京市教委科技发展计划重点项目暨北京
市自然科学基金B 类重点项目“面向领域的互联网多模态信息精准搜索方法研究”(项目编号: KZ201311232037)和北京市属高等学校创
新团队建设与教师职业发展计划项目“大数据内容理解的
您可能关注的文档
- 基于cluster态的量子多重代理盲签名方案-山东大学学报理学版.PDF
- 基于ElGamal变体同态的安全两方计算协议设计Designforsecure.PDF
- 基于FPGA与DLP的体三维显示系统设计方法与研究-北京大学学报.PDF
- 基于GOST签名体制的代理多重签名方案-信息工程大学学报.PDF
- 基于gpsOne技术移动定位终端可行性分析-Read.PDF
- 基于GPS/BaiduMap的位置信息服务平台-计算机应用与软件.PDF
- 基于LBS的换热站智能巡检系统-中南民族大学学报.PDF
- 基于LMI全方位移动机器人H鲁棒控制HRobustControlfor-Core.PDF
- 基于MACS-K系列DCS在废水零排放污水处理中的工业应用-控制网.PDF
- 基于MIMO异构AdHoc网络节点调度优化算法.PDF
文档评论(0)