我国网络舆情热点话题发现探究综述.docVIP

我国网络舆情热点话题发现探究综述.doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
我国网络舆情热点话题发现探究综述

我国网络舆情热点话题发现探究综述   〔摘要〕随着互联网的快速发展,网络舆情对社会的影响不容忽视。若能够及时从海量数据中发现热点话题,追踪热点话题演变以及预测话题的倾向,对于帮助相关部门及时有效地对其引导和控制具有较大意义。本文通过对我国网络舆情热点话题发现的相关文献进行收集、整理及分析,归纳其中的主要研究思想和方法,同时发现存在的不足,并提出进一步的展望,以期对后来研究者提供参考 〔关键词〕网络舆情;热点话题发现;发现模型;综述 DOI:10.3969/j.issn.1008-0821.2017.03.029 〔中图分类号〕G2062〔文献标识码〕A〔文章编号〕1008-0821(2017)03-0165-07 〔Abstract〕With the rapid development of the Internet,the impact of network public opinion on society can not be ignored.If we can timely find the hot topic,track the evolution of hot topics and predict the tendency of hot topics,it will be of great significance to help the relevant departments guide and control the development of network public opinion.The paper studied and reviewed the related literatures of the hotspot topic detection of network public opinion in China,analyzed and summarized the main ideology,key technology and existing problems,besides,gave the working directions of next steps. 〔Key words〕network public opinion;hotspot topic detection;detection models;review 随着互联网的快速发展,网络信息交互与传播迅速且敏捷,网络中重要的信息常淹没在海量数据中,因此如何有效地从不断涌现的海量非结构化数据中发现热点话题、追踪热点话题演变以及预测话题的发展倾向,为相关单位部门及时提供有效网络舆情信息、舆情监控和竞争情报具有较大意义 本文在文?I调研的基础上,对我国网络舆情热点话题发现的相关文献进行统计分析和回顾整理。然后从数据采集、文本处理以及热点话题发现模型等方面对现有研究进行整理归纳,意在发现网络舆情热点话题发现中有待解决的难点,以期为未来深入研究奠定基础,最后分析总结网络舆情热点话题发现研究中存在的问题与不足,并指出下一步的展望方向 1文献统计及分类 为了充分掌握我国网络舆情热点话题发现研究的现况,截至2016年6月对中国学术期刊网CNKI、万方学位论文期刊网以及维普等数据库进行检索搜集,采用“微博”、“舆情”、“网络”、“论坛”与 “热点话题发现”关键字组合作为检索条件进行模糊搜索,检索2005-2016年期间的相关文献。检索命中135条,其中期刊论文64篇,学位论文66篇,会议论文5篇。从图1可以看出,从2007-2014年,网络舆情热点话题发现研究的相关文献逐年增多,2014年相关文献数量达到高峰,近两年有所减少。随着互联网的迅速壮大,网名规模的持续扩大,网络舆情事件的不断爆发,相关部门对网络舆情的监控越来越加大重视力度,并且随着相关研究不断深入,学术成果不断呈现 2我国网络舆情热点话题发现分析 21热点话题发现研究路线 热点话题指的是在某个时间段内人们比较关注的话题,涉及民生、政治、经济以及文化等方面。网络舆情热点话题发现过程一般遵循数据采集、数据处理以及话题识别3个大步骤,具体流程如图2所示 22热点话题数据采集 作为网络舆情热点话题发现的前提,数据采集是网络舆情热点话题发现的重要一部分,主要通过数据采集工具,对目标站点的数据进行监测和数据采集。目前数据源主要来自微博、新闻网站、论坛以及相关网页等。从数据采集方式上,目前主要是采用网络爬虫技术从互联网中抓取下来。从网络爬虫的功能和结构上分类,可分为通用类型的网络爬虫、专用型的网络爬虫以及增量型网络爬虫[1]。关于网页信息抽取技术,大体上分为基于DOM树的抽取方法、基于统计的抽取方法以及基于模板的抽取方法

文档评论(0)

docman126 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7042123103000003

1亿VIP精品文档

相关文档