- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网舆情监测系统在高校校园网中的应用.doc
互联网舆情监测系统在高校校园网中的应用
摘要:随着高校校园网网络建设的不断完善,移动终端的迅速普及,在校师生利用互联网进行交流的方式日趋便捷。本设计搭建的针对高校师生的互联网舆情系统包括系统管理、信息采集、分析处理、信息服务等功能模块,可以提供全方位舆情监测服务,能及时了解广大在校师生关心的热点问题,为高校管理者提供良好的决策依据和支持。
关键词:高校;舆情监测
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2016)03-0025-02
随着以社会媒体为主的Web 2.0的发展和深入,以及移动终端等新媒体的普及,社会舆情的传播途径急剧扩张。网络成为反映社会舆情的主要载体之一,网络舆情影响力正积聚放大,对公共事务和政策的影响日渐深入。同时网络技术更新网络舆情信息来源不再局限与新闻评论、博客、贴吧等,随着微博、即时通信工具的广泛应用,现在新闻在网上的呈现与传播不是以小时计,而是以分秒计,近乎于实时。短时间内就可能将突发事件传播、发酵为有着重大舆论影响的事件。赢得时间就赢得了话语权,就赢得了舆论引导的主动权。把握好“黄金时间”是成功处置突发事件的第一道关口。因此,高校建立自己的互联网舆情监测分析系统[1-3],运用高科技手段对互联网敏感内容进行24小时不间断地自动监测和分析,可以提高信息收集和研判的效率和水平,进一步做好对广大师生的舆论引导工作,从而更好的维护高校形象[4, 5]。
1 需求分析
现代高校管理工作中,有一部分重要的工作是对在校师的关注的重要信息能够及时掌握,并能做出正确的引导。现有的收集信息的方式是通过网络搜索引擎、网页浏览的传统手工信息收集方式已经无法满足当前舆情监督工作的要求。手工方式监测范围主要集中在几大门户网站、论坛、微博等,覆盖面窄,难以较全面地收集到目标信息。效率低,及时性差,根本无法及时发现敏感信息,且无预警机制,突发事件容易造成被动局面。信息统计难以存档,形成规范统计数据,更不可能有规范的数据进行分析,为高校舆论引导管理工作提供分析依据。因此建立一个拥有通过网页内容的自动采集处理、专题聚焦、敏感词过滤、统计分析等功能的舆情监测系统,可以实现高校对自己相关网络舆情监督管理的需求,为高校管理层全面掌握广大师生的舆情动态提供了信息保障,并能让高校管理层对发生的舆情事件做出正确舆论引导。
2 系统功能设计
互联网舆情监测分析系统分析为系统管理、信息采集、分析处理、信息服务等功能模块,提供全方位舆情监测服务
2.1 系统管理模块
提供基于WEB平台标准网页模式的管理工作界面,使用人员通过浏览器即可方便地进行各种操作控制与远程管理。提供多频道分类和多个监控专题设置,支持无限分类和无限站点加入。支持用户自定义站点描述、起始URL、抓取深度、更新时间等各种参数配置。具备用户管理和权限分配功能,针对不同用户提供不同操作权限和个性化操作界面。
2.2 信息采集模块
该模块可以对境内外多种监控网站类型的静动态网页采集,包括新闻门户、BBS、RSS、博客、贴吧、微博及其他类似结构网站。可以对监控专题的信息采集,可针对特定事件在设定时间内进行专门采集。可以自动对信息源进行24小时不间断的实时监控能力,信息从出现到被检索到的时间间隔应为分钟级,对新信息进行实时更新和增量索引。对采集的信息提取摘要和关键字段信息,并按指定格式分字段存入全文库相应位置,便于根据需要进行数据统计。
2.3 信息分析处理
系统对采集入库的数据以下核心技术进行智能分析,对原始数据进行加工处理,关键数据提取,形成原始舆情库。对各类主题能够形成自动摘要。可以自动在搜索结果条目下显示摘要信息。这些“摘要”帮助用户迅速了解搜索结果的主要内容,提高工作效率。使用自动分类技术,基于用户配置的关键词,将收集的信息自动分类,以树型结构的方式进行展现,结构清晰便于舆情工作人员第一时间找到有价值的信息,并实现对敏感信息的有效监控。由于网络转载的现象,网络上存在大量的重复信息,可根据文档内容的匹配程度确定是否重复,对重复信息自动判断和区分,大大节省用户时间。提供了敏感字库,同时可根据用户需求对敏感词库进行设定,信息采集器在运行过程中自动识别信息内敏感词,对于包含敏感词的信息系统提供“不入库”、“入库待审”、“入库已审”等几种处理方式。系统采用基于语义的文本倾向性研究方法,对新闻、评论、论坛、博客、微博中的信息进行整句和整篇情感分析,在计算机层面先进行研判再展现给系统用户。可以利用内容主题词组和回贴数进行综合语义分析,识别敏感话题。
2.4 信息服务模块
通过对采集入库的数据进行智能分析,根据各分类每天采集的信息生成曲线图形式的分析报表,可按每日、每周
文档评论(0)