微博意见领袖识别研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微博意见领袖识别研究

微博意见领袖识别研究   【摘要】论文通过研究微博及其意见领袖的新特征,对备选属性进行考察,构建微博意见领袖识别模型,提出微博用户领袖评分公式,并利用获取的真实数据集对模型进行逐步验证。通过微博意见领袖的识别,有针对性地对网络舆情进行监测和引导。   【关键词】微博 意见领袖 网络舆情   一、引言    微博的出现逐渐改变了人们的行为模式,更新了人们参与新媒体的认识。在传播方式与技术上对博客等新媒体进行了颠覆性的创新,已经成为最便于用户使用话语表达权、交流一切信息、宣扬自己个性的网络应用。微博的传播模式特点、影响机理等已经成为重要的研究课题。而微博用户作为发布、传播信息的主体,亦已成为研究的一个出发点,并且至关重要。微博平台有“信息输出用户”和“看客用户”,意见领袖则是“信息输出用户”中影响力最大的用户群体。论文试图通过对用户建立模型,找出衡量用户重要性的量化工具,从而找出微博领域的核心人物,也就是“意见领袖”。    根据拉着斯菲尔德对意见领袖的定义,微博中意见领袖应该是某一主题内特别活跃并且在这一主题内具有极大影响力的用户。微博在分散下放信息传播权利的同时,通过意见领袖的掌控和引领,在一定程度上加剧信息传播权的集中。就信息或言论的扩散特征而言,微博呈现出塔形结构,处于塔尖的就是意见领袖。微博时代的意见领袖既继承了网络意见领袖的特征,同时又有自己的特点。微博意见领袖具有用户参与的活跃性强和信息发布的影响力大两个特征。   二、微博意见领袖识别模型    根据在“新浪微博”中获取的一个较大规模数据集合,从中筛选出对意见领袖识别关联程度大的属性,从这些属性入手,建立微博意见领袖识别模型。   (一)新浪微博数据的整理    利用网络爬虫从“新浪微博”中获取一段时间内参与过的所有微博用户的数据,共提取了100059位微博用户的详细信息,以此为基础构建实验数据集合。在数据集中,各微博用户关注的人数,最多的为3271,最少的为0,平均每个用户关注289人。而拥有粉丝的微博用户,其粉丝数量最多为9097221,最少为0,平均每个用户拥有2091个粉丝。但是,平均关注人数和平均粉丝数并不相等。进一步分析发现,有超过60%的用户,其粉丝数量在45-306之间。根据用户粉丝数量分布可以看出,大部分粉丝都关注在很小一部分的用户,而大部分用户拥有的粉丝数量较少。在数据集中,发布微博数目最多的用户发布了211791条微博;而最少为0,平均每个用户发布了691条微博。其中1/4分位数和3/4分位数分别为356和966,即有50%的用户发表微博数量在356-966条之间。   (二)属性选择    根据已有的一些研究和经验,论文在建立微博意见领袖识别模型时考虑微博用户的关注用户数量、微博用户的粉丝数量、微博用户的身份是否被验证、微博用户发布的微博数量四个属性。微博用户的关注用户数量是由于微博是一种特殊的社交网络,关注与被关注都存在单向性,意见领袖作为被关注者在“关注与被关注”这个关系上会呈现绝对领导地位,即关注用户数量远远小于粉丝数量。微博用户的粉丝数量是微博传播中最重要的一个因素,将对微博被关注度、转发量、回复量等产生重要的潜在影响,这也是意见领袖影响力的体现。    在微博平台上,被验证的用户往往在现实社会中具有一定的知名度和影响力,其影响力会辐射至微博领域,可以吸引和影响更多的粉丝。并且,依据社会资源不同,微博中还会自上而下形成不同生态层级的名人及相应的粉丝圈,其影响力由中心向边缘递减。因此,身份是否被验证应是权值较高的一个属性,身份是否被验证是对粉丝数量、微博转发量和回复量等均有潜在影响的一个属性。微博用户所发布的微博数量,既包括用户本人所发布的微博数量,也包括该用户回复他人微博时同时发布到自己微博中的评论的数量。这是一个体现意见领袖活跃度的指标,发布的微博数量决定了用户参与度和输出信息的程度,一个输出了更多有意义信息的用户,其关注度和认同度应该更高。需要注意的是,如何辨别有意义信息,即在考虑发布的微博数量时应剔除发布大量无意义信息的“僵尸”型用户。    综上考虑,论文根据用户关注用户数量、粉丝数量、是否被验证身份和发布的微博数量这四个属性,来建立微博意见领袖识别模型。   (三)模型构建    综上分析,意见领袖的识别旨在利用模型算出每个微博用户的领袖评分来辨别意见领袖。因此,对用户X来说,领袖评分LX与粉丝数量FX、关注用户数量fX、发布微博总数lx和是否被验证VX这几个属性相关,微博用户领袖的评分模型为:    LX=(1+aVX)*(FX+afX+blx),其中a函数为针对微博用户关注用户数量fX 的一个修正函数,b为针对lx发布微博数量的一个修正函数。    对于a函数,目的是减弱互相关注这

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档