- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
服务需求及技术要求
一、融媒体大数据服务系详细技术需求表
序号 项目名称 项目内容及描述 数量 备注
全网资源线索汇聚服务
采集汇聚门户网站的新闻资讯,如国信办发布的允许发布新
闻的新闻机构网站;以及国内主流的商业新闻网站和地方政
府网站发布的资讯;采集汇聚客户端、微博、微信公众号发
布的即时信息。
指定数据采集服务数量:
数据采集范 重点新闻网站类:中央重点新闻网站、地方重点新闻网站及
1 1 项
围 其他重点新闻门户网站,范围涵盖网信办所公布的《互联网
新闻信息稿源单位名单》,总数 350 家以上;
新闻客户端类:覆盖不少于 100 个主流新闻客户端;
微博类:覆盖不少于 2000 个主流微博账号;
微信公众号类:覆盖不少于 4000 个主流微信公众号;
此类数据源均支持按采购人需求进行调整。
要求采集数据源频率主要包括:
线索资源采 1、重点新闻网站 “即时新闻”或者 “滚动新闻 “频道的新
2 集数据源频 闻数据采集轮训时间需达到 5 分钟之内更新一次; 1 项
率 2、需根据特殊的应用场景,提高部分网站、微博、微信数
据源采集频率,轮询时间提速到 2 分钟之内更新一次;
1、信息过滤处理要求针对特定的稿件所涉及到每个元素均
采集数据准 是干净的,必须去除广告、相关链接等干扰信息;
3 1 项
确性 2、微信数据结构化,去除多余的HTML 格式、二维码等;
3、网站数据结构化,按栏目进行数据分类;
实现基于高效索引和排序算法的多维度检索和排序,支持多
多维度全文
4 种索引条件的复杂组合。系统需支持灵活的检索结果展示, 1 项
检索和排序
包含但不限于按相关度排序或按时间排序等。
指定数据源 实现对网站、微博、微信号及其他渠道新媒体的数据监测及
5 1 项
数据采集 数据采集。定向监测的信息源可随时根据需要不断调整。
新闻热点实 实现实时推送自动生成的热点线索和热点事件,并以集合页
6 1 项
时推送 面进行统一管理。
实现基于自有历史数据图文稿件的深度挖掘分析,结合大数
广电数据挖
7 据处理技术和自然语言处理技术实现对海量数据的自动分 1 项
掘与利用
类、情感判断等,并进行数据的清洗和再利用。
数据分析、效果跟踪、舆情监测及数据报表服务
针对某一事件、人物、品牌、地域等进行个性化分析设置,
原创力文档


文档评论(0)