基于话题情感强度的微博舆情分析.docxVIP

  • 28
  • 0
  • 约1.53万字
  • 约 9页
  • 2021-09-03 发布于浙江
  • 举报
RESEARCH ON LIBRARY SCIENCE RESEARCH ON LIBRARY SCIENCE PAGE # RESEARCH ON LIBRARY SCIENCE RESEARCH ON LIBRARY SCIENCE PAGE # * * 本文系国家自然科学基金项目 “社会化媒体集成检索与语义分析方法研究” ( 项目批准号: 的研究成果之一。 * * 本文系国家自然科学基金项目 “社会化媒体集成检索与语义分析方法研究” ( 项目批准号: 的研究成果之一。 基于话题情感强度的微博舆情分析* 【摘 要】 舆情事件发生时往往引发公众持续的关注和激烈的讨论。鉴于此,文章提出一种基于话题情感强度 的微博舆情分析模型,实现对微博舆情热点的探测和跟踪。该模型采用 LDA 聚类算法对在线微博文本流挖掘 检测微博话题,结合情感强度定律计算话题情感强度,通过对话题的情感强度进行时序回归分析,跟踪事件发 生过程中公众的情感变化,弥补了传统的话题探测方法不能有效跟踪舆情热点的不足。并通过实证分析证明了 该方法的可行性。 【关键词】 情感强度 LDA 舆情分析 Abstract: Public often give sustained attention and heated discussion to the incidents when public opinions happened. This paper presents a model about microblogging public opinion analysis based on emotional intensity of the topic ,to achieve hotspot detection and tracking of microblogging public opinion. The model uses LDA clustering algorithm to detect microblogging topics,uses the laws of emotional intensity to calculate emotional intensity of the topic. Time-series regression analysis is carried out on the emotional intensity of the topic, so to track public emotional changes during the course of the incident. This model compensates the deficiencies of traditional detection methods on public opiniontracking. The empirical analysis shows that the method is feasible. Key words: emotional intensity LDA public opinion analysis 1 引言 Web2. 0 时代,人的参与性不断提高,人们不仅仅从网络上获取信息,而是更多地希望参与信息的发布,表达 自己的想法和观点。在公共舆情发生过程中,不同网民围绕某些主题的讨论会汇焦为话题,而那些关注度高、涉 及主题敏感的话题则会演化为舆情。中国传媒大学网络舆情研究所/艾利艾咨询 (IRI) 发布的“2013 年网络热点 事件排行榜”中指出,越来越多影响力较大的社会热点事件都是通过网络爆料而引发公共关注甚至公共危机。微 博 ( Micro - Blog,Twitter) 作为互联网上的一种重要媒体,自2013 年一跃成为继新闻、论坛之后的中国互联网第 三大舆情源,网络舆情 “微内容”化程度加剧。在这种背景下,对微博中的舆情热点进行探测,跟踪舆情热点事 件发展过程中公众的情感变化趋势对于舆情监控预警具有非常重要的意义。 从信息分析角度来看,舆情热点发现本质上是一个无监督的主题聚类过程。目前,已有许多学者对微博中的 热点探测进行了一系列相关研究[1]。文章指出,微博中大部分信息是零散的、高噪声的、随机的和碎片化的,从 而导致构建出的文档向量空间矩阵维数较高,数据稀疏,因此传统基于 VSM 的文本聚类方法在微博热点探测中效 果不佳。为克服短文本聚类在微博舆情分析中的不足[2],将共词网络与复杂网络方法应用于微博舆情分析中,利 用共词网络图中的子群分析有效探测舆论热点[3],提出了一种高效的数据流挖掘算法框架 ( Single-Pass 算法) ,通 过单遍扫描计算出聚类中

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档