微博舆情监测指标体系研究及原型系统应用.pdfVIP

微博舆情监测指标体系研究及原型系统应用.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

微博舆情监测指标体系研究及原型系统应用

针对微博客在信息更新频率、组织结构、用户关联等方面与其他社会化媒体

有较大差异,具有惊人的聚合力和渗透力,文章通过研究其特点提出了五维一体

的微博舆情监测指标体系(MBPOI),用以衡量和评价微博客中话题/事件的舆情

度。同时以A自动化世界活动为例分析,对指标体系和分析挖掘系统进行验证,

结果表明该指标体系使用五种统计方式(QI,II,RI,PI,CI),从多维度、多

层次量化话题/事件的影响力有较好的效果,为A公司自动化世界活动监控和追

踪提供了有效的社会化媒体分析依据。

标签:微博客;舆情监测指标;中文信息处理;社会化媒体

1概述

国内已有一些舆情指标体系的研究,这些研究多数建立在舆情分析和网络安

全的基础上,国内外已有一些相关的研究工作,如基于网络性能度量指标[1],

社会学角度计量社会稳定指标体系[2]等。还有一些系统开发工作,如:中国传

媒大学网络舆情研究所的IRI网络舆情指数和Imonitor舆情系统,中科院计算所

的网络安全舆情指数和天玑监测系统,TRS公司的网络舆情指标体系和网络舆情

监控解决方案以及skeye舆情监控系统。

前人的研究[3]一般针对常规社会化媒体来构建舆情指标体系,然而微博在

传播机制、聚合力、影响力等特点与传统社会化媒体有很大的不同,常规的舆情

指标体系和监测工具已不完全适用。因此,文章针对微博的特点,提出了专门的

微博舆情监测指标体系,基于该体系实现了微博监控与分析系统,并通过“A自

动化世界活动”实例分析,验证该指标体系和系统的有效性。

2微博舆情监测指标体系构建

微博用户及传播的信息具有自由化、隐蔽化、发散化、复杂化等特点,微博

舆情指标的选取要有相对稳定性或具有自动更新机制,能够在时间上延续和空间

上扩展,从而用于衡量话题/事件的舆情态势进行有效的引导。其定义如下:

定义1:MBPOI={QuantityIndex(QI),IntensityIndex(II),RelationIndex

(RI),PolarityIndex(PI),ConfidenceIndex(CI)}

其中QI表示量度指标,II表示强度指标,RI表示关联指标,PI表示情感

倾向指标,CI信度指标。

图1微博舆情监控指标体系图

2.1量度

量度体现了总体演化趋势,事件持续、舆情参与度等宏观方面的度量。

量度将加入分类模型,对话题相关信息更有效的过滤,增加量度的准确度;

同时,引入聚类模型,有效的发现领域相关热点话题,提炼关联话题。

2.2强度

强度体现了舆情热点和行为活跃性分布、涉及话题/事件的重要程度、兴趣

热点等方面的度量。

分析的数据来源是将整体数据集中进行过滤、归类获得。强度可以对话题/

事件相关博主影响力进行计算,以确定话题意见领袖;同时,话题/事件一般有

产生、热议、消减的周期,强度计算将话题周期也纳入计算范围,进行及时预警。

2.3关联度

关联度体现了波及的传播关联网络、层次维度,涉及话题/事件的覆盖面、

影响力等方面的度量。

分析来源于整体数据中抽取的用户粉丝和关注信息。关联度可以在网络图

中,增加话题相关博主重要性,关联紧密度的分析,并以节点的大小,弧的粗细

来可视化展示。同時,可将话题相关微博在博主中转博的路径进行勾勒,以便捷

的进行溯源和追踪。

2.4情感度

情感度体现了情绪倾向和社会状态,涉及关注、社会心理、和谐等方面的度

量。

分析数据来源于话题相关博文和用户发布的博文的评论内容,文章采取基于

HowNet1的词粒度语义倾向性分析方法,建立具有强烈褒贬倾向的词典,在设

定种子情感词后,使用HowNet计算相似度。根据博文中情感词语与词典中词语

的语义倾向相似度来判断博文内容和评论的支持度分布。

2.5信任度

信任度体现了权威性和可信度,涉及话题/事件的准确、真实、有用性等方

面的度量。

信任度的数据来源为话题相关的某一条博文内容发布用户发布站点的相关

属性数据。以上属性建立影响力模型,基于模型判断某条博文的可信度。信任度

将建立不同细分领域的影响力模型,并结合领域专家知识不断调整模型,以达到

对信息可信度的有效判断。

3微博客实时监控分析系统

在微博舆情指标体系的基础上,文章

文档评论(0)

135****8274 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档