在线网络社区中舆论领袖识别模型的研究.docVIP

在线网络社区中舆论领袖识别模型的研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
精品文档(可编辑) 值得下载 在线网络社区中舆论领袖识别模型的研究 摘要:目前,有许多理论被用来识别舆论领袖。一般使用节点的度数、紧密度、介数和不同领域的PageRank算法等中心化指标来识别出舆论领袖,这些方法虽然简单,但是由于它们仅利用了节点自身的外部属性,因而识别率并不高。为此,文章提出了一种舆论领袖识别模型IDMS。该模型不但考虑了节点的外部属性,而且还综合考虑了节点的内部属性,如文本内容的相关度。最后通过实验,验证了该模型可以更准确地识别出舆论领袖。 关键词:网络社区;影响力发现;舆论领袖 一、引言 “舆论领袖”的概念是由美国哥伦比亚大学的传播学者Lazarsfeld、Berelson和Gaudet在1940年政治选举研究中提出的。舆论领袖会表达他们有影响力的评论或观点,提出指导意见,鼓励和指导大众去理解社会问题,因此舆论领袖的识别是非常重要而且是很有意义的。 基于在线网络社区的网络交往特征,人际互动关系已成为国内外学者的研究热点,但是关于在线网络社区中参与者重要性方面的研究并不多见,特别是针对在线网络社区中舆论领袖的识别研究非常匮乏。社区参与者重要性评估、舆论领导者发现及其相关技术目前仍然处在起步阶段,为此本文针对在线网络社区中舆论领袖的识别问题进行研究。 首先,本文研究的网络舆论领袖是指那些通过在新兴媒体发表帖子(文本)或者回复其他网络用户发表的帖子这种基于文本的交流方式。将自己的见解、观点传递给其他网络用户,引起他们内心的共鸣,进而影响、改变他们的观点、思想和决策的网络用户。 其次,通过研究发现,很多的研究者在研究舆论领袖的识别方法方面存在一些不足:现有的研究工作侧重于分析网络用户间的外部联系,如发帖、回帖,忽略了内部联系,如帖子的内容。 为此,本文提出了舆论领袖识别模型IDMS (Influence Diffusion Model Similarity),改进了影响力扩散模型IDM(In fluence Diffusion Model),增加了文本相似度的计算与分析。通过高频关键词识别出具有热点话题的帖子,然后再通过热帖识别出影响力大的网络用户,也就是从海量的具有回复关系的帖子中找出那些具有重要影响力的网络用户。只有影响力大的网络用户才是真正的舆论领袖。 二、舆论领袖识别模型 (一)基本思想 假设C={C1,C2,…,Cn}是一个帖子的集合,同时Ci(1≤i≤n)是指任意的一个帖子,同时本文给出了以下的定义。 定义1:外部联系和内部联系。对于任意的Ci和cj(1≤i,j≤n),假设Ci的发布时间早于Ci,如果Ci是Ci的回复,那么Cj和Ci就有外部联系。如果它们没有关系,但是ci和Cj之间有语义上的相似性(相同或不同)那么Cj和Ci之间就有内部联系。 定义2:帖子网络。对于任意的帖子会形成两种网络,内部联系的网络和外部联系的网络。 基于帖子内容和信息传播结构的影响力计算模型多是从词频角度着手。 假设1:在BBS交流环境下。发帖和回复是BBS成员之间最直接的交互方式,人们通过发回帖来表达观点和意见,可以认为论坛对话链体现影响力的传递结构,即论坛成员通过交互关系传递影响力。 假设2:论坛成员通过发帖表达观点和看法,帖子的基本组成单位是词语,可以认为论坛交流通过词语来表达和传播。 通过挖掘蕴含在网络文本内容和回复结构中的规律来测量论坛参与者的活动,并假设论坛影响力最高的用户就是论坛舆论领袖。这里分为两种情况:一是在基于文本的论坛交流环境中,人们通过发帖、回帖表达自己的观点,因此论坛回复链体现影响力的传递结构:二是词语是组成帖子内容的基本单位,在基于文本的论坛交流环境中,交流通过词语来表达和传播。帖子影响力定义为帖子包含的词语集合在回复链传播的程度,采用回复关系的上下游帖子的词语交集数与下游帖子词语数之比来进行计算。帖子回复链结构表示了个体之间的关系,一个个体的影响力就是他提交的所有帖子的影响力的总和。因此,通过帖子的影响力计算就可以找到最有影响力的个体,也就是舆论领袖。 (二)影响力计算 帖子内容的主题相关性可以通过向量空间模型来计算。根据当前帖子和它回复帖子之间的主题相关度来分配影响力,计算的方法是对这些有回复链接关系的帖子的主题内容进行分析。 具体过程如下:两个主题型帖子内容的相关性是根据两个帖子出现的相似关键词和高频关键词的次数总和进行计算的。计算帖子A和帖子B内容的主题相似度算法计算步骤如下。

文档评论(0)

linsspace + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档