基于地铁运营服务行业网络舆情监控系统研究.docVIP

基于地铁运营服务行业网络舆情监控系统研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于地铁运营服务行业网络舆情监控系统研究

基于地铁运营服务行业网络舆情监控系统研究   摘要:以地铁运营服务行业为背景,主要从业务需求、系统框架、关键技术3个方面对网络舆情监控系统的构建进行了全面阐述,介绍了利用网络舆情系统进行舆情收集、分析、预警、报告的整个过程。   关键词:地铁;网络舆情;监控系统;运营服务   中图分类号:TP393文献标识码:A文章编号2012)009012902   1背景   在以“论坛”和“博客”兴盛为特征的Web2.0时代,在互联网技术和3G通讯的快速发展下,网络成为了信息的海洋,网络上的主体也发生了根本变化。在Web1.0时代,主要是媒体、各种官方机构在网络中发布资讯,以新闻形式呈现,带有官方的意见、判断和色彩。而伴随Web2.0的到来,网民成为了更具影响力的主体,他们的言论源于所见、所经历、所听说、所感悟,没有任何的过滤和判断,网友还可以发表回复和评论,进行多方互动和深入讨论。随着网络媒体逐渐成为反映社情民意的主要载体,网络舆情已经越来越成为各大企业关注的焦点。   作为轨道交通的城市地铁,是城市居民(城市居民是指常住居民和流动人口)公共交通出行的首要方式。速度快、不塞车,在享受地铁带来的便捷时,也以“乘客”挑剔的视角对地铁运营服务提出意见和建议。通过发帖子、发微博、写评价,将自己所感受到的地铁服务发布出来,分享给多更多的网友。而这些信息反映出乘客对地铁运营服务有认可、有意见、有建议、有投诉、有询问,通过整理这些信息,能组织相关人员对地铁运营服务进行评价并分析乘客的需求,更好地做好服务工作。   舆情监控系统的构建为企业相关部门提供了智能化全时段的电子监控技术,信息主管部门可用其跟踪网络热点事件主导网络文化阵地,利用它实时监控网上和本企业相关的舆情信息。使用网络舆情监测软件将各类有关地铁运营服务的信息分类整理出来,通过统计分析发现问题,有针对性地解决和改善问题,提升服务质量,让乘客体验到南京地铁运营分公司的温馨服务、微笑服务。   2业务需求分析   (1)及时采集、获取互联网上与“地铁运营”相关的网络舆情信息,包括乘客对列车及车站运营服务的意见和建议;对地铁运营管理的意见和建议;及时跟踪地铁运营面向广大市民举办的各类活动的相关新闻报道等。   (2)对微博、论坛等交互式栏目进行“热点管控”,要求及时发现网民讨论的热点、负面问题。   (3)要求对网络中分类舆情、单位舆情、领导人舆情、负面舆情等进行统计分析,并形成相关舆情报告。   (4)支持自定义监控范围,可按行业、地域、信息发布时间等方式监控信息内容。   (5)系统设有突发事件预警通报,系统可自动分析其事件发生的时间、地点等要素,进行预警。   3系统框架   网络舆情监控系统总体框架是以标准、规范和安全体系为保障,以基础硬件为支撑,广泛数据源为采集对象,提供舆情信息的采集、分析、预警、处置为一体的监控平台。   3.1舆情采集子系统   信息采集是舆情工作的首要任务,互联网传播特点和网民行为特征要求系统全面获取网络信息,信息时效性要求系统及时采集到网络信息。用户可自行配置新增站点,也可交由系统配置。   实时监测万余家网站最新信息,包括国内主要新闻网站、活跃的论坛、博客、微博客、视频网站等。用户可结合需要自动添加监测站点。   采集引擎按照各信息源表现出的网页形式采集信息,网页中包含大量的广告、图片、链接,这些不是舆情关注的价值信息,还给系统的高效运行、检索增加负担,因此需要对网页信息进行预处理。预处理包含以下环节:超链分析、编码识别、URL去重、锚文本处理、垃圾信息过滤、关键字抽取、关键信息提取、正文抽取、自动摘要等。   3.2舆情分析子系统   舆情分析主要是对收集到的信息进行实时处理,是舆情系统的核心模块,主要包括信息相似性排重;重点人分析;通过与之前信息分析结果相比较,自动研判相关舆情的主题及热度变化趋势;通过信息文档转换技术,对信息进行传统文件格式转换,如Doc、Excel等文件生成,可生成查询报表等。   (1)相似性排重。采用“文章相似性技术”根据文档内容的匹配程度确定是否重复,比如利用网页标题和大小等规则判断具有更强的准确性、实用性以及运行效率。采用中文分词技术对文章关键字进行比较计算,得出文章相似度,相似度高于0.75以上的文章系统默认处理为“已处理”,无需再进行任何操作,相似度位于0.5~0.75之间的相似转载文章需要用户在页面进行再次确认,确保文章无漏处理。   (2)重点人分析。对重点人的微博、发表的帖子及博客,以及通过关键词过滤信息,对重点人网站的一切信息进行聚类、汇集。支持提取用户的注册信息,并进行落地分析查证。并且支持重点人员发帖自定义匹配。对重点人的各论坛、博客、微博等注

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档