- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于共词分析的主题类型划分方法比较研究
韩 真
(浙江海洋学院图书馆 浙江舟山 316004)
[摘要]:主题类型划分是主题演化分析的重要环节。本文给出了学科主题演化的含义,分析了主题演化的流程,研究了DT法Library of Zhejiang Ocean University Zhoushan 316004 )
[abstract]:Theme type patition is important tache in analysis of theme evolution. This paper presents the meaning of disciplinary theme evolution, analyzes theme evolution flow, and studies three kinds of methods, including theme type patition, social network analysis and association intensity algorithm. At last, through comparing and analyzing, author induces that only association intensity algorithm can well embody essence of Core Themes and Sub-Themes in theme network.
[keywords]:co-word analysis;theme type patition;DT method;association intensity algorithm
在当前众多计量方法中,共词分析以其自身的优势和特点(适用于对文本主题和内容的分析研究),被用于监测描绘不同领域的动态发展过程。学科主题动态跟踪包括定性分析和定量分析两种,两种方法是进行学科主题的重要手段。学科主题hemes)和次要主题(Sub-Themes)构成,核心主题虽然在一定程度上能代表主题网络特征,但由于核心主题只有一个,而次要主题数目众多,且对主题演化具有重要影响,因此,主题网络的演化分析还需要由包括次要主题在内的所有主题词语来共同决定。
2.主题演化流程分析
现有主题演化分析流程包括John Law于1992年提出的标准学科主题演化分析程序[1]和Kostoff等人于1990-1991年间开发的DT法分析流程[2]。无论采用哪种方法,主题演化分析流程都大体包括主题数据库形成、主题网络识别和主题聚类间相似(或非相似)分析(也称聚类比较)三个阶段,只是在具体环节上有所区别而已。John Law的标准学科主题演化分析程序中不用对主题类型进行划分;而在Kostoff的DT法中,主题类型划分是分析流程的关键。
整个DT法大致需要三个步骤:第一步是文本检索流程建立检索结果数据库,第二步是识别广义主题以及广义主题和主题之间定量和定性关系的确定,最后一步是跟踪这些主题的演进和之间关系的变化情况。DT法
DT分析法主要包括两个组成部分:抽取多词短语频次的算法和短语近分析法(多词技术短语之间的物理临近或短语联合频次)。多词短语频次算法词频法短语临近分析法是在广义主题确定的基础上,计算广义主题短语每次出现时与其物理临近的前后50个词以内的短语频次,短语频次词典用于量化关系的强度指标分析[6]
DT法词频统计存在一定局限性。Social Network Analysis,SNA)是社会科学和行为科学中的一种独特的研究视角,它注重单元之间的相互关系,其内容包括按照关系概念或过程来表述的理论、模型及应用。社会网络分析强调从关系或者是结构的角度把握研究对象,不仅给出了一个结构性的研究视角,更进一步发展出了一套具体的测量方法和指标来描述网络的结构性特征。社会网络是社会行动者及其间关系的集合,也就是说,社会网络是由多个点(社会行动者)和各点之间连线(行动者之间的关系)组成的集合。社会网络分析的实质就是用点和线来表达网络,给出社会网络的形式化定义[7]。
一个网络之所以区别于其他网络,首先考虑的一个因素是“关联性”。如果几个网络要素之间相互联系很紧密,它们在网络中就可能居于重要地位。而对于一个网络来说,如果其中的要素之间都相互紧密联系,这样的网络可能具有较高的凝聚性。在社会网络中,与“关联性”密切相关的另一方面研究就是要素之间的“距离”。有的要素可能与网络中的任何一个要素都建立了联系,与其他要素的距离都很近;有的要素可能与其他要素联系比较少,相对“孤立”一些。如果要素之间的距离不一样,我们就可以找到这些要素在网络中所处的位置来。
在社会网络分析中,关联性由中心度来测度。中心度又包括整体中心度、局部中
文档评论(0)