基于微博的社会舆情研判与预警体系构建.pdfVIP

基于微博的社会舆情研判与预警体系构建.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
社会观察 基于微博的社会舆情研判与预警体系构建 1 2 张利民 邹姝阳 (1.兰州石化职业技术学院人文社会系,甘肃 兰州 730060;2.香港中文大学 新闻与传播学院,中国 香港) 摘  要:本研究以新浪微博为主要舆情采集平台,对微博系统内海量信息进行日常性和持续性的抓取、跟踪与搜集。本论文针对微博信息传播特 点,充分利用网络信息挖掘技术、计算机中文信息处理技术、数据挖掘技术等应用技术,研究微博舆情监测关键技术及实施方案,力求构建适应微博 特点的网络舆情预警机制。 关键词:微博;舆情;研判;预警 1  引言 情感词,本研究基于情感词词典的方法来提取情感词。 近年来我国各类突发事件频发,社会稳定性显著降低,这不仅直 ① 极性词典的构建:词语除可表达特有的概念外,还能传达一 接导致社会经济生活及人身财产安全的重大损失,也极大地危害到社 定的感情色彩。感情色彩大体分为褒义和贬义两种,褒义如“好,聪 会的稳定与发展。中国社科院在其出版的《社会蓝皮书》一书中, 明、优秀”等,贬义如“坏、鄙夷、恶魔”等。具有褒贬义的词语集 将微博定义为杀伤力最强的舆论载体,体现了微博舆论的强大影响 合称为极性词典,本研究的极性词典主要取自《知网》 (HowNet),包 力。 括程度级别词语、正负面评价词语、正负面情感词语等。 本研究来源于北京市大学生科研创新项目《基于微博的社会舆情 ② 倾向性分析算法与实现过程:词语中还有些极性修饰词,处理 研判与预警》的子项目,试图以新浪微博为对象,研究微博舆情监测 时,可给这些修饰词设置不同的强度系数。如定义极性褒义、贬义的 关键技术及实施方案,具体内容包括:博文自动抽取、中文分词、文 原始强度分别为:+1,-1,再定义极性修饰词“极其/最”的强度系数 档清洗(去停用词)、中文计算机表达、文档情感倾向判别、意见领 为2,则总的情感极性=词语极性*强度系数。另有些特殊情况需考虑: 袖识别、综合舆情判断等内容。 句式反转规则,适用于汉语中表示否定和反问句式,如:“不、不 2  研究过程 是、非、并非、难道、岂不”引导的句子,另遇到双引号或单引号括 起的情感词,均应对原话中的褒贬义进行反转。感情强化规则:汉语 2.1 微博数据的自动获取 的感叹号等可表示情感的增强,故可用感叹号的数量来表示感情色彩 网络舆情数据获取是网络舆情分析的前提。面对互联网的海量信 的强度。 息,迫切需要一种技术来帮助人们自动从网络上获取相关信息,从而 2.5 意见领袖识别 可以极大地提高人们获取信息的速度和广度。网络爬虫(WEB Crawler) 是搜索引擎的重要组成部分之一,其作用是为搜索引擎从网络中下载 社会突发事件发生后,微博中会往往会产生群体情绪,其间意见 所需的网页。相比网络爬虫,新浪微博的开放API接口可以更加简洁的 领袖对群体情绪的演化及舆情研判影响极大。据拉扎菲尔德的定义, 获取相应的数据,本研究即采用新浪微博的API接口作为数据挖掘工 意见领袖指在某一主题内特别活跃且有极大影响力的用户,所以本研 具。 究从如下两个方面分析微博意见领袖:用户影响力和用户活跃度。 ① OAUTH认证:使用新浪API前首先须完成用户认证。新浪微

文档评论(0)

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档