- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多词共现分析方法的实现及其在研究热点识别中的应用.pdf
第58卷 第24期 2014年12月
多词共现分析方法的实现及其在研究热点识别中的应用
■ 高继平 丁 潘云涛 袁军鹏
[摘 要]在当前词共现分析多关注两词共现分析的基础上,提出多词共现分析方法,并采用关联规则挖
掘中的频繁项集抽取法,实现多词共现的抽取和与分析。以我国国家知识产权局专利数据库(SIPOD)中数字
信息的传输领域(H04L)为例,抽取和深入分析该领域中词最多的多词集合和频数最大的多词集合。最后,结
合当前文献计量学中研究热点的定义与识别,应用多词共现分析方法发现H04L领域中的6个研究热点,进而
对这6个研究热点中的部分代表性专利文献进行介绍。
[关键词]专利计量 多词共现分析 关联规则挖掘 国家知识产权局专利数据库 数字信息的传输
研究热点
[分类号]G250
DOI:10.13266/j.issn.0252-3116.2014.24.013
词共现分析(也称共词分析)是由M.Callon等人 尽管如此,鲜有研究从多重共现的角度去研究词
[1-2]
在1983年提出并于1986年完善的 。正如滕立等 与词之间的共现问题,以及由此衍生而来的多词共现
[3]
人 的研究所述,当前词共现分析的理论基础主要包 分析,为此本文提出多词共现分析方法(muliplewords
括拉图尔的行动者网络理论和社会网络分析。其中前 cooccurrenceanalysis),并将其应用于领域研究热点的
?
者的侧重点在于共词网络基础上的词聚类分析以及结 识别之中。
构演化分析[4-5],而后者的关注点是节点在网络中的
[6-7] 1 多词共现分析方法
影响力评价 ,如节点度数、节点中介中心度、节点
紧密度等。 1.1 多词共现的理论基础
不过,在有些情况下,用一般的网络图很难真实刻 多词共现是由单篇文本中两个及两个以上词语之
画世界网络的特征。例如,在合作撰写论文的网络中, 间的共同出现而构成的,是可以用于表达文本的主要
用网络图可表示作者之间是否合作,但不能表示是否 知识结构和核心知识内容的词语集合,其中两个词语
有3个或更多的作者合写一篇文章等;同理,一篇文章 之间的共现可以被称之为两词共现,而3个词语之间
一般会有3-5个关键词,而一般的词共现分析生成的 的共现可以被称为3词共现,以此类推。
共词网络也仅能体现两个关键词的共现,很难体现3
-5个关键词是否同时出现在一篇文章中等。
针对类似的情况,王众托等人提出超网络的概
[8]
念 ,以期解决类似的问题;李树青则提出3词共现分
析的方法,并将该方法用于识别学者主要的研究兴趣
图1 多词共现的形成
[9]
特征 ;庞弘遷等人提出主题领域、研究团体、所发表
图1中存在P、P、P、P 和P5篇文本,其中文
论文的期刊类型等多个论文特征项共现机构科研状况 1 2 3 4 5
[10] 本P通过分词方法,最终可以由词语KU表示;文本
分析方法 ;刘志辉等人则提出作者关键词耦合的研 1 1
[11] P通过分词处理,得到KU 和KU两个词语,故而它
究方法 。 2 2 3
本文系“863”计划课题“以科技文献服务为主的搜索引擎研制”(项目编号:2011AA01A206)和中国科学技术信息研究所所
您可能关注的文档
- 基于数字相机、ASTER和MODIS影像综合测量植被盖度.pdf
- 基于数据仓库的客户关系管理系统研究.pdf
- 基于斑岩成矿体系结构的深部找矿预测――以鄂东丰山铜金矿田为例.pdf
- 基于时频重排的地震信号wigner-ville分布时频分析.pdf
- 基于曲边平面谱单元的弹性波传播分析.pdf
- 基于曲面局平特性的散乱数据拓扑重建算法.pdf
- 基于最小二乘支持向量机的无轴承同步磁阻电机解耦控制.pdf
- 基于最小驻留时间法估计线性切换系统的分量最终界.pdf
- 基于松动区理论的高速铁路浅埋隧道初支变形处理方法brThe Initial Support Deformation Treatment of High Speed Railway Shallow Buried Tunnel Based on Excavation Disturbed Zone Theory.pdf
- 基于构型选优决策的冗余度机器人避障研究.pdf
文档评论(0)