- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
舆情监测 平台建设方案(图文)
舆情监测: 平台建设方案(图文)
1 项目背景及建设目标
1.1 项目背景
随着互联网技术和应用的普及和发展,新闻、论坛、博客、微博客、视频网站等舆
情产生速度、传播渠道等均呈现出爆炸式快速增长的态势,据初步统计,2009 年
以来,互联网网上具有负面影响的舆情数量同比增长了近2 倍以上。目前主要存在
以下问题拯待解决:
1)网络舆情监测导控工作几乎完全是通过人工的方式开展的,手工发现关注网站
的局部性、时间上的滞后性与信息发布的随意性、随时性之间的矛盾日益严重。
2 )缺乏舆情信息综合分析,导致分析关联能力不足。例如,特定舆情事件在新
闻、论坛、微博、博客等不同来源上的关联分析。
3 )各分支在舆情信息的管理上缺乏统一的信息报送、舆情导控任务下发等业务流
程的信息化工具支撑。
第 1 页
舆情监测 平台建设方案(图文)
4 )目前,舆情导控体系中缺乏可量化的考核数据作为各级领导年底评分的依据;
在经过多次现场充分调研的基础上,提出建设舆情综合导控系统的规划,制定一个
统一的元数据标准和数据交换接口规范,作为舆情分析研判和考核统计的元数据,
从而对互联网上传播的舆情信息进行准确查找、归类、排重、分析、研判、导控和
核查,实现对互联网上各类海量数据快速分析处理,更加准确的掌握各类舆情信息
传播的数量、范围、趋势、影响等情况,最终形成一套科学、全面、高效地掌握网
上舆情监测导控系统。
1.2 建设目标
系统建设总体实现目标是:能够全面、准确、及时的获取与“我”有关的网络信
息,深层次的对互联网舆情信息进行分析和挖掘,通过统一的综合指挥系统实现舆
情的及时上传和导控任务的集中下达,并从在线率、引导发帖、信息报送及任务下
发等多方面综合考核,确保以互联网舆情监测小组为核心的整体监测成效。
1 总体架构
1.1 软件架构
第 2 页
舆情监测 平台建设方案(图文)
整个系统设计分为数据采集子系统、舆情信息数据仓库、舆情研判分析子系统、引
导指挥子系统、引导考核子系统几个部分。
1.1.1 数据采集子系统
第 3 页
舆情监测 平台建设方案(图文)
负责对信息源头采集,采集子系统主要实现多线程、集群采集模式。满足项目采集
深度和广度要求,采集深度按照需求可采集到新闻评论、微博转发数、粉丝数以及
论坛的评论树回帖数等。
采集广度本系统提供通用采集配置,支持大部分新闻、论坛的采集,只需要配置
URL 即可实现采集。采集性能可以灵活配置策略,分为指定调度和随机调度两个
模式。采集时效性可以定制。
1.1.2 舆情信息数据仓库
按照系统制定的数据规范支持外围系统数据接入,数据仓库设计分布式架构,通过
集群方式扩展项目的规模。主要分为分布式储存与全文索引、关系数据库。同时对
外提供 API 访问接口。数据入库经过数据的加工处理包括自动摘要、实体抽取、内
容分类等操作为后续研判提供标准数据。
1.1.3 舆情研判分析子系统
侧重业务需求根据各项指标综合计算舆情热点、负面信息、专题分析等。系统创新
设计了基于多层关键字不同权重的数据推送算法实现海量数据中自动推送用户真正
关心的舆情线索。
1.1.4 引导指挥子系统
融合舆情管控业务流程。实现重大、敏感舆情信息的逐级上报及领导审核;可通过
系统下发导控任务且短信提醒功能,确保导控任务通知及时、到位;
1.1.5 引导考核子系统
针对任务完成情况、导控情况、信息报送及在线等进行多角度考核,对网评员工作
量和工作效果提供科学评估依据。
1.2 关键技术
1.2.1 自动摘要
在舆情分析过程中,通过自动摘要简明、确切地描述聚出来话题的中心内容,摘要
是以提供文献内容概括为目的,不加评论和补充解释。
基于统计的自动摘要也称为自动摘录,是将文本视为句子的线性序列,将句子视为词
的线性序列。包括以下步骤:
第 4 页
舆情监测 平台建设方案(图文)
原始文本处理:
按照计算机能够识别的形式输入文本信息,
您可能关注的文档
最近下载
- 托育服务人员的培训与教育.docx
- 冀人版-第11课 电在我家(教学课件).pptx VIP
- 食品安全突发事件应急处置培训课件.pptx VIP
- 2025至2030中国电镀行业发展空间与未来投资走势预测报告.docx VIP
- 汽车智能底盘原理及技术 第3章 线控制动系统.ppt VIP
- 大学课程《工程制图与识图》PPT课件:第三章 基本体的投影 第一节 平面体的投影.pptx VIP
- FANUC数控系统0i-F Plus维修说明书(非常详细).pdf VIP
- 中医基础理论-体质学说 赖伟.ppt VIP
- 生产组织培训课件.pptx VIP
- 工业机器人离线编程与仿真(ABB)高职全套教学课件.pptx VIP
文档评论(0)