网络舆情分析系统功能的研究.docVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络舆情分析系统功能的研究

网络舆情分析系统功能的研究   摘要:网络舆情及其管理是信息化时代政府和主管部门构建和谐社会的关键工作之一,针对此进行网络舆情分析系统研究是有效开展此项工作极为重要的技术保障因素。本文以此为切入点。系统分析网络舆情分析系统的七大基本功能需求和系统设计中的四个部分,其核心部分功能的八大模块及相关主要技术等。   关键词:网络舆情分析 基本功能需求 核心部分 功能模块      2008年中国的网络新闻得到快速发展,网络新闻的使用率较去年提升了近5个百分点,网络新闻用户达到2.34亿,互联网已经成为一个不可忽视的舆情策源地与宣传阵地。舆情是指在一定的社会空间内,围绕社会事件的发生、发展和变化,民众对社会管理者产生和持有的社会政治态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等表现的总和。互联网因其虚拟性、隐蔽性、发散性、渗透性和随意性等特点,吸引越来越多的人通过这一渠道表达自己的想法。当网民的言论达到了一定规模时,就形成了网络舆论。作为社会舆论的一种重要表现形式,网络舆情形成迅速,对社会的影响巨大。   由于网络的信息量十分巨大,仅依靠人工的方法难以应对网络海量信息的收集和处理,需要加强相关信息技术的研究,形成一套自动化的网络舆情分析系统,及时应对网络舆情,由被动防堵化为主动梳理、引导。      网络舆情分析系统的基本功能      在我国,作为网络舆情管理的主体一般是地方政府和主管部门,其对网络舆情管理的基本要求是:及时掌控所辖范围内网站上的信息情况(包括论坛、博客、网站等),防止网络突发事件的发生进而诱发群体事件,维持安全健康的网络环境和稳定的社会环境。   因此,服务于地方政府或主管部门的网络舆情分析系统应该具备以下七大基本功能。   网站的设置功能:舆情分析系统所配置的来源网站主要包括国内知名的门户网站、论坛、贴吧、博客、所关注的境外网站以及辖区内一些有影响力的网站。   Web页面浏览的功能:网站的设置是为了方便采集信息的管理,也方便用户在Web页面上的浏览。   指定网站的搜索功能:主管部门所关注的信息类似百度贴吧的网络社区,以及辖区内具有一定影响力的网站,如各级论坛、各政府网站等;这部分的需求是通过配置指定网站的方法来实现的,指定网站配置采集可以做到信息的准确性。   全网搜索的功能:收集国内各个知名门户网站对该区域的报道和论坛中一些敏感的话题。由于全网搜索的准确性难免有所下降,应该可以通过配置关键字过滤来采集数据,保证采集回来的信息是用户所需要的。   主题事件的跟踪功能:主要通过主题词来监控一些突发事件和热点事件,如突发事件、重大事件。   敏感词自动检测功能:基于敏感词典信息过滤技术,可以有效地识别各种有害文字信息,以摆脱有害信息的侵扰,进一步监测各种严重政治性错误、淫秽色情、凶杀暴力、赌博迷信、非法、负面报道等内容的发生,可对各类有害信息及时有效地发起预警,并严防此类严重错误见诸报端。   短信提示功能:其主要作用是服务于领导。通过正常的配置,将采集的信息及时用短信的形式发给领导,使领导可以第一时间知道某些突发事件和热点事件的情况。      网络舆情分析系统的核心功能      充分考虑到使用者的功能需求。对以上基本功能进行软件工程学的分析后,可以发现以上七大基本功能的具体实现涉及舆情分析引擎、自动信息采集、数据清理、代理服务四大部分。其中,核心部分是舆情分析引擎。   舆情分析引擎是舆情分析系统的核心功能,至少应当具备八个模块进行功能分解。   识别模块:热点话题、敏感话题识别,可以根据新闻出处的权威度、评论数量、发言时间密集程度等参数,识别出一定时间段内的热门话题。利用关键字布控和语义分析,识别敏感话题。   倾向性分析模块:对于每个话题,对每个发信人发表的文章的观点、倾向性进行分析与统计。   主题跟踪模块:分析新发表文章、帖子的话题是否与已有主题相同。   自动摘要模块:对各类主题、各类倾向能够形成自动摘要。   趋势分析模块:分析某个主题在不同的时间段内。人们所关注的程度。   突发事件分析模块:对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。   报警系统模块:对突发事件、涉及内容安全的敏感话题及时发现并报警。   统计报告模块:根据舆情分析引擎处理后的结果库生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。   舆情分析系统的核心技术在于舆情分析引擎,涉及的最主要的技术包括文本分类、聚类、观点倾向性识别、主题检测与跟踪、自动摘要等计算机文本信息内容识别技术。这些技术一向是国内外信息工作者关注的领域。

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档