网站大量收购独家精品文档,联系QQ:2885784924

舆情监控实验室系统参数.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
互联网舆情监控系统招标参数 性能指标 性能描述 主要功能 互联网舆情监控产品应包含四个功能子系统:舆情数据采集子系统、舆情数据处理子系统、舆情分析子系统、舆情门户应用子系统。 舆情数据采集子系统 舆情数据采集子系统的数据采集对象主要是互联网网站和网页,数据源主要有两种,一是通过指定范围的网站对其进行抓取采集,另一种是通过baidu、google等进行全网的数据采集监控。在数据采集过程中,包含了对于正文内容的自动识别、文章去重与相似度分析、自动生成摘要和关键词等多项中文语言处理技术。 此外,数据采集子系统还能够针对网页中的图片、文档资源文件进行采集下载,具有生成网页图片和快照、实现网站自动登录、利用代理服务器下载、JS自动识别判断、分布式采集等多项功能。 2) 舆情数据处理子系统 舆情数据处理子系统主要是针对采集子系统采集的数据进行整理、处理。主要功能包括: 舆情数据管理:包括对于数据的整理、编辑、删除、新增等维护工作。 门户信息配置:系统可以自动生成前端门户平台的信息,管理员也可以通过后台配置将需要重点呈现的信息置于门户中去,同时,管理员也可以对门户的一些频道、热词、专题进行管理和设置。 简报管理模块:通过设置舆情简报模版,可以按天、按月、自动生成舆情简报,也可以手动选择信息生成简报,同时对于已生成的简报提供可视化的编辑界面。 3) 舆情分析子系统 舆情分析子系统功能分为统计和分析两部分。 统计主要是对于舆情内容的统计,信息站点分布统计、时间统计、具有折线图、柱状图、饼图多种表现方式。 舆情分析功能包括,自动聚类、热词发现;正负面信息研判;事件发展趋势分析;热点人名、地名分析; 4) 舆情门户应用子系统 舆情门户应用子系统是根据客户的行业特点与行业需求,定制的一个舆情展示、呈现平台,通过该平台可以将舆情系统中收集到的信息、分析结果、生成的简报、以图文方式进行展现,提供给用户和各级领导浏览、下载。 功能及特点: (1)核心技术 A.信息雷达 B.网页块分析正文抽取 C.自动分类,聚类 D.支持多种检索语法 E.信息指纹去重 F.多语言,编码格式自动识别 G.分布式系统、支持亿级数据检索 H.智能摘要、关键字提取技术 (2)功能列表 A.信息雷达 通过网络雷达系统,可以自己定义需要关注和监控的网站、栏目、或某段IP地址,作为采集源,并可以按照行业或分类进行管理。 在菜单中也可以配置监控网站的优先级,刷新速率,监控深度等设置。 在进入监控状态时,系统会自动执行雷达指令,对需要监控的网站或网址进行扫描,对于未更新的页面会自动跳过。 B.自动聚类、分类 自动聚类、分类功能,可以将雷达采集的信息进行二次处理,帮助用户对数据进行整理,系统支持人工分类,也支持基于统计模型的自动分类。 C.监控管理 用户可以自行设置监控的词语或语句,并可根据词语分类,例如:国际、军事、政治等。并可以设置发现敏感词汇的处理方式,以email或短信方式实时提醒。保留原始网页快照以备追踪 热点信息、热门话题自动发现。 文本关联分析,根据文本相似度计算,找到相似的文本和内容,根据发布的时间和IP,可以追踪到内容的传播过程和途径。 D.统计分析 分布统计:通过图表展示监控词汇和时间的分布关系以及趋势分析,包括地域信息分布。 热点统计:根据时间统计热点的分类和热门关键词,包括地域信息分布。 热点云图:以形象的图形展示热点信息 预警信息:对于敏感信息重点监控 信息报告:智能生成信息报告,支持报告导出功能。 E.多用户和分级 支持多用户管理,不同用户可以设置不同的监控源以及监控词汇,分类等信息。对于存在上下级关系的用户,支持报表的分级汇总及上报。 (3)特点 A.海量数据处理 本产品采用的搜索引擎核心技术,可处理亿级数据,TB级的数据检索可在毫秒内完成,结合分布式技术,不用担心因为数据的增长而产生的性能降低。 B.高效率实时监控 每天的监控页面在100万以上,单页面监控可在几秒钟以内完成。 C.操作简易 采用完全Web端网页管理方式,不需要安装额外插件,界面操作简单易用,普通人员经过简单培训即可。 D.多数据库支持 支持各种主流数据库,如MSSQL、Access、MySQL、Oracle、DB2、Sybase等。 E.开放式API 提供标准XML接口,提供多种API调用,支持JAVA,ASP.NET,PHP等多语言二次开发。 系统架构 B/S(Browser/Server)模式,后台+前台:后台进行数据采集、监控设置、门户管理、信息管理等;后台设置好之后,所有的数据都会自动推送到前台网站,供需要的人调阅。 开发语言 Java 数据库 MySql 服务器 运行环境 配置要求 (1)CPU:E5606二级缓

文档评论(0)

精品资源 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档