基于网络媒体社会舆情监测体系研究.docVIP

基于网络媒体社会舆情监测体系研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于网络媒体社会舆情监测体系研究

基于网络媒体社会舆情监测体系研究   摘 要:随着我国网络技术的快速发展,网络媒体引发的重大舆情事件不断增多,因此建立网络舆情监测预警体系已经成为时代发展的需求。基于此,从网络舆情监测、社会舆情监测体系构建标准以及如何构建社会舆情体系三个方面进行深入分析。   关键词:网络媒体;社会舆情;构建原则;监测体系   中图分类号:G206 文献标志码:A 文章编号:1673-291X(2017)31-0169-02   一、网络舆情监测分析   第一,社会舆情信息采集。信息采集的目标是为了在网络上解决舆情数据的来源,在进行监测时可以通过网络爬虫技术从一个网页开始,下载该网页内容以及其网页内URL指向的其他网页,递归下载一直到完成整个网站的镜像。在工作当中,为了保证数据的采集的及时性,必须保证网络爬虫能够长时间工作和进行大规模的遍历访问,这样在工作的过程中经常会遇到被目标网站屏蔽等问题,尤其是境外网站。因此,其在工作的过程中必须采取有效防屏蔽网站技术。首先,轮转访问与分时任务。在目标网站所能够忍受的范围内对网站进行访问抓取,将一个大的任务划分为几块完成,分时段完成。其次,IP地址轮换。多数网站会对访问率很高的主机IP地址进行暂时性的屏蔽,在进行抓取工作的过程中当发现被屏蔽时,可以主动换一个IP继续进行工作。最后,模拟浏览器登录技术。针对一些需要使用用户登录才能进行访问的网站,在工作当中可以通过使用模拟浏览器技术,完成抓取工作。   第二,舆情信息的预处理。在进行社会舆情监测时,由于当前是互联网时代,抓取到的数据当中结构比较复杂,并且表达方法也有很大的差异,因此需要对这些数据进行处理。首先,数据规约。数据规约主要指的是通过数据筛选将少数数据,通过使用特征选择和子集选择的模式有效简化数据处理的难度,通过多种方法可以实现对数据降维,进而能够更加方便地对数据进行处理。其次,数据清理。数据清理指的是通过删除、替换以及补齐确实数据完成信息格式的标准化,通过采用比对、相似度计算等方式清除重复数据,使用时间序列等技术清除噪声数据,使用移动窗口理论、移动曲面拟合等技术完成信息的错误修正。最后,数据变化。数据变换主要是要在相关技术的支撑下完成数据格式转换,减少数据的复杂度,使数据按照比例能够落入到相关区域。   第三,数据分析处理。首先,文本聚类。文本聚类从本质上看,属于无监督的机器学习法,指的是通过把一个文本集聚成若干个簇,在同一个簇中的文本具有很搞的相似性,在不同簇之间的文本相似性则十分低。进行文本具备的主要目标是要使属于不同一个话题信息之间的度量尽可能小,而且在不同类别的信息之间的度量尽可能的大。其次,主题监测。主题生存是有效期限,在研究的过程中主要通过老化理论建立起主题生存模型以测量主题的生存周期。根据信息输入的顺序,先出现的信息首先聚成主题的候选集合,后来的相似内容将被聚到已形成的主题当中,或者是产生新的主题。   二、基于网络的社会舆情监测体系构建原则   第一,可行性原则。在社会舆情体系构建的过程中可行原则主要指的对抓取的数据信息进行定量分析和科学预算监测得到数据,这样能够对社会愈强的发展态势进行科学的评估,通过利用现代科学技术手段以及理论水平能够达到指标所要求的监测条件。   第二,全面性原则。全面性原则指的是基于?W络的社会舆情监测体系能够客观、全面地反映网络舆情存在的实际情况。如果社会舆情监测体系不完善,在对社会舆情进行监控的过程中极容易出现漏洞,容易在监测的过程中遗漏能够突出表现社会舆情的内容。因此,在进行社会舆情监测体系构建的过程中需要坚持全面性,避免出现遗漏。   第三,动态性原则。在基于网络媒体对社会舆情进行检测的过程中不能单纯地从静态的角度触发,只关注社会舆情过去发展状态以及现在的实际情况,要从发展变化的角度来看待社会舆情,从而能够从动态的角度关注社会舆情的发展态势,这样有助于总结社会舆情的发展变化规律,增强对社会舆情的处置能力。   第四,科学性原则。科学性主要指的是在社会舆情信息抓取的过程中,抓取的数据和内容能够在客观上反映社会舆情的实质特征和发展的态势,而不能只是简单地对获取的各类数据进行简单的收集汇总,需要具有层次性以及综合性,这样才能使获取的信息不仅可以就某个方面进行反馈,同时又可以作为一个整体,在整体上反映社会舆情发展的整体趋势。   第五,相对稳定性原则。在信息的选择上要着眼于信息的动态性,从整体上把握社会舆情发展的规律和趋势,但是也必须坚持相对稳定性,单纯的数据很难进行预测和把握,立足于舆情特征相对稳定地选择信息,能够增强社会舆情监测的准确性,也更有利于把握事物的本质,及时对社会舆情进行引导和处理。   三、基于网络媒体的社会舆情监测体系构建   (一)数据采集体系   1.

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档