- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
专利技术主题分析基于sao结构的lda主题模型方法
第61卷 第3期 2017年2月
专利技术主题分析:基于 SAO结构的LDA主题
模型方法
1 1 1 1,2 1
■ 杨超 朱东华 汪雪锋 朱福进 衡晓帆
1北京理工大学管理与经济学院 北京 100081
2悉尼科技大学量子计算与智能系统研究中心 新南威尔士2007
摘要:[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中
的“问题”与相应“解决方案”等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从 SAO结构中识
别“问题和解决方案”(P&S)模式,基于“bagofP&S”假设,构建基于“主语-行为-宾语”(subject-action-ob
ject,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方
法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势。
关键词:SAO结构 技术主题分析 LDA模型 P&S模式 石墨烯
分类号:G250
DOI:10.13266/j.issn.0252-3116.2017.03.012
[7] [8]
专利技术主题分析聚焦于识别所讨论技术的主 重要主题 ,计算术语词/词组相似性 ,也可基于词
题,对主题进行分类,预测主题的发展趋势,识别主题 共现构建网络,进而描述文档的内容[9-10]、映射领域技
[11] [12]
间的关系等,有助于相关人员了解技术领域的研究内 术结构 、挖掘科技情报 ; 基于引用的专利技术
②
容、研究热点和发展变化,为科研机构、企业的研发决 主题分析方法,其优势在于可以基于数据中存在的引
[1-5]
策提供支持 。传统专利技术主题分析中,专家知 用关系识别技术发展路径。基于共引关系分析技术研
[13]
识常用于技术主题解读,在数据量较小、领域单一且知 究前沿 、识别对领域贡献最多的文章、作者和机构
[14]
识完备的情况下灵活易用,能产生准确度较高的分析 以及受到最多关注的主题 。目前,引用分析往往基
结果。但是专家知识是对技术主题的粗糙总结,受到 于引用关系构建网络,进而识别技术间关系以及核心
[15] [16]
知识提供者的主观影响,同时具有成本高昂和结果不 技术 、检测新兴技术的发展与重组 、跟踪新兴研
易重复的缺点,尤其随着科技文本数据量成几何倍数 [17-18] [19]
究领域发展路径 、识别技术融合模式与机制 、
产生和积累,凭借人类个体总结海量技术知识变得不 [20]
基于网络度分布特征识别技术转移 ; 基于技术路
③
再可行。为了解决上述问
文档评论(0)