- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--
-
邦富舆情监控系统技术参数
一.舆情监控系统整体技术架构
二.舆情监控系统功能
1、舆情监控系统检索
用户通过强大的全网及本地信息检索出相应的舆情。 检索类型分类为:新闻、
论坛、博客、贴吧、境外等信息集合进行相关检索,可自定范围检索,指定网站
进行检索。
本地检索:本地检索是对数据库已经采集回来的从各个网站中采集匹配关键
字的各种信息进行检索,检索结果可查看所有类型的文章,也可以单一查看
一个类型。舆情检索出来的信息自动分为 :新闻、论坛、博客、境外、微博;
全网检索: 全网检索是直接使用主流搜索引擎(如百度 / 谷歌),检索的数据
可以直接加入分析专题,是本地检索的最有益补充。
2、关键词环境
用户通过手工设置关键词, 系统自动发现符合关键词条件的敏感信息。 依据
设定的主题与关键词对需要采集的舆情数据进行分类和抽取, 最后将舆情数据以
事件性的视图呈现给用户进行查阅,轻易掌握舆情的发展情况与趋势。
3、分类查看
分类查看在以下情况下,分类查看可为用户实现:
用户需要监控与某关键词高度匹配的舆情信息,信息自动分为:新闻、论坛、博客、境外、微博等类型,用户可有针对性地查看;
用户可分类对不同类别的信息进行管理, 分类可以属地 /部门 /舆情性质等常用方式划分;
直接访问信源;
将某一信息上报到报送系统、加入到简报素材库、收藏为待处理;
用户如需了解某一类信息的热度,可通过系统提供的转载量、出处、时间段等参数分析。
4、事件分析
根据用户所关注的目标事件进行全方位的跟踪与分析, 包括指定时间段内舆
情爆发点、舆情地点分布分析、舆情演变轨迹分析、关键字演变分析、正负面研
判、典型观点抽取等功能,并产生各种图表。具体包括以下:
事件简介
舆情监控系统自动摘取事件的关键部分作为事件的简介, 事件简介的截取方
式通常是文章的第一段内容。 事件简介可根据用户需求进行手工编辑(修改、
删除、增加)简介。
网站统计
统计事件相关数据发表的各大类型网站,分别是:新闻、论坛、博客、纸质媒体、视频等类型,并统计各个类型的数据总量。
数据类型
利用柱状图和饼状图来呈现各大数据类型的比例,数据网站类型分为新闻、
博客、论坛、传统媒体和其他;数据态度类型分为:正面、负面和中立;数据范
围分为境内和境外。
热点关键词
关键词分为三种类型,分别是热点关键词、地名、人名,另外专门设立了关键词演变这一类型。 系统根据关键字的分类数据中出现的关键字频率来定义关键字,关键字使用或查看的次数越多,关键字字体越大。
事件动态
根据数据的点击频率来定义数据的动态, 数据点击的次数和回复的数据量决定事件的动态方向。
热点网民
发表文章和评论相对较多的网民被定义为热点网民。
相关词
根据文章标题定义相关词语, 所有相关词语都是从相关的数据文章中筛选出来,被定义为相关词。
典型观点
针对该事件的每一个网站类型而做的观点分析被定义为典型观点。 且对部分热点数据进行观点分析,统计文章的报道数和网站数。
事件趋势浏览
根据事件抓取到的数据进行分析, 形成相应的趋势浏览曲线图。 可分别查看:
默认 一天 一周 一月 半年和一年。趋势曲线图分析的数据类型有新闻、论坛、
博客、微博、视频、其他等类型。
5、境外浏览
通过邦富自建服务器,可以安全、稳定的浏览被屏蔽的境外敏感网站信息。
便于用户查看浏览境外站点信息。 用户通过自定义输入境外站点, 或者系统内置
的一些站点迅速访问境外网站,不受地域限制。
6、舆情简报
在用户日常浏览舆情信息时, 可将关注的信息分文别类创建为简报, 把相关
的数据做成简报,导出成文档格式,方便日常工作需要。
7、短信预警
对于发现网上出现涉及本地负面新闻报道、 突发事件及引起网上大范围炒作的贴
文,第一时间通过手机短信形式向指定用户单位进行通报。
三.舆情监控系统的实现
1、技术指标
参数指标
性能要求
1.
网页抓取频率
分钟级
2.
舆情推送速度
≤2 分钟
3.
索引数据量(条)
上亿级
4.
微博博主数据量(条)
上亿级
5.
数据处理量
上百亿级
6.
分类专题建立(从建立到数据显示)
≤30 秒
7.
专题分析(从建立到报告显示事件)
≤2 分钟
8.
单机索引
1000条 / 秒
9.
检索响应
2 秒 / 亿
10.
分类速度
100 篇/ 秒
11.
自动聚类
1000篇 / 分钟
12.
查全率
≥94%
13.
查全率
≥96%
14.
关键词提取
≥1000 篇/ 秒
15.
关键词提取准确性
≥90%
2、性能指标
全面性:定点采集和元搜索相结合的信息采集机制实现信息的全网采集,不漏掉有价值的舆情信息。
准确性: 大量客户经验积累,帮助客户自助维护关键字的配置保证客户得到最焦点的、最常用的、最需要的、最关注的信息。
时效性:
您可能关注的文档
- 操作系统实验3.docx
- 折弯工艺规范.docx
- 2018年国内外大事.docx
- 九牧卫浴装修公司合作协议.docx
- 德阳加快推进畜禽养殖废弃物资源化利用.docx
- 家装公司施工规范和工艺标准.docx
- 柜式七氟丙烷气体灭火系统安装与施工方案模板.docx
- 《标准化菜市场设置与管理规范》.docx
- 久美特工艺介绍.docx
- 国内外聚合物驱油应用发展与现状.docx
- 四川中级美容师考前强化练习题及答案 .pdf
- 2024广东省语文中考真题(word版) .pdf
- 中青年脑出血患者卒中后疲劳的运动方案构建及实证研究 .pdf
- 三年(2022-2024)高考数学真题分类汇编(全国通用)专题14 坐标系与参数方程、不等式选讲(四大考点)(解析版) .pdf
- SEO十大经典案例 .pdf
- 2024年通信安全员ABC证考试题库及答案(完整版) .pdf
- 中职教育一年级上学期电子与信息《三极管的电流分配及电流放大原理》教学课件 .pdf
- 地理|山东省烟台德州东营2024年高考诊断性测试地理试卷及答案 .pdf
- 有限空间监理实施细则 .pdf
- 四川省成都市郫都区2023-2024学年高二上学期11月期中化学试题(解析版) .pdf
文档评论(0)