互联网视频及舆情.doc

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
互联网视频及舆情

现状分析 (1)信息技术突飞猛进,新媒体监管愈加复杂困难 当前,互联网应用创新加速,云计算、大数据等新一代信息技术动员力和影响力,已成为传媒领域重要的新生力量,深刻改变了媒体格局和舆论生态;三网融合及媒体融合进程不断加速,新闻出版广播影视领域技术IP化、IT化和云化趋势愈发明显,内容、业务与互联网融合越来越多。这些都带来了安全隐患,易被攻击的问题随之而来,尽管目前我省已经针对单个业务构建了监管系统 (2)业务数据庞杂分散,无法统一管理和共享 数据是信息化的基础支撑之一,经过多年建设,xx省新闻出版广播影视工作初步构建了传输快捷、覆盖全省的广播影视传播体系、监测监管体系、公共服务和政务服务体系,但这些体系缺乏有效的统一规划,相关数据分布在省、市、县以及各相关部门,数据标准不一、接口不同,无法进行有效管理和分析使用,影响了信息资源的互通共享、开发利用和集中管理,特别是跨部门信息共享和业务协同困难。 (3)新兴技术应用滞后,政务智能化水平不高 当前,互联网已成为人们获取信息等主要工具平台,我们在政务服务方面虽然做了大量的工作,初步建设了综合性信息发布门户网站,但系统功能单一、业务之间互不关联,离政务全电子化目标差距较大,与省委省政府的要求仍有距离。 (4)数据智能分析能力落后,无法有效支撑科学决策 当前,新闻出版广播影视行业信息数据呈爆炸式增长趋势,行业主管部门的信息处理与智能分析能力面临严峻挑战,然而目前xx省新闻出版广播影视行业尚未建立智能高效的数据分析及决策支撑平台,现有业务信息系统处理及分析能力远远无法应对海量信息的冲击,无法有效支撑行业科学决策。 系统整体架构 逻辑架构图 本项目将建设对xx省内视听网站和持证重点视听网站的监测监管,对省内主流APP、apk应用服务进行监测监管,对我省播出的网络剧、微电影等网络视听节目进行审查。 根据互联网视听节目监管业务系统的实际监管需要,同时针对各个监管业务子系统存在的共性,形成了视听节目数据发现与采集、网页元数据分析、码流采集与监测、视听内容分析等通用的基础监管业务模块,在基础监管业务模块基础上根据网络舆情监测的业务需要,形成各自独立的监管系统用于满足某一方面独特的监测需求。 互联网视听节目监测系统的软件架构采用模块化设计原则,每个模块保持一定的功能独立性,在协同工作时,通过相互之间的接口完成实际的任务,模块化设计将各个功能模块有机地结合起来,在保证正确性和健壮性的基础上,提高了软件的可扩充性和可复用性。系统软件模块流程图如下: 网络视听节目监管系统的软件系统主要包括三层:节目及网站数据采集层、数据分析处理层、业务功能模块与数据接口层。 1、分布式数据采集层 数据采集层通过采集控制中心,统一管理数据采集功能。 根据系统的监测目标和技术手段,数据采集包括互联网视听节目及网站搜索引擎、元搜索引擎。各个搜索引擎从功能和业务上相互独立,从相应的网络/网站中全面获取视听网站及节目信息。 搜索引擎具备采集控制中心,对搜索引擎的工作进行配置管理。采集控制中心支持网站发现、种子分配、地址解析、文本解析、性能监控等功能,同时支持应用平台下发的配置指令,例如节目下载、取证、快照等等: 2、数据分析处理层 数据分析处理层包括数据处理分析模块和数据存储模块。 数据处理分析模块接收数据采集层上传的视听节目信息,采用先进的全文自然语言分析技术和分词技术进行数据清洗,获取数据的元信息,并对视听节目进行节目归类、排重、关联分析,根据上层应用配置的规则,对节目进行规则匹配、关键帧抽取等操作,结合上层应用的数据业务处理后,对数据进行深度分析、汇总和统计,并存入数据库和磁盘阵列上。 3、功能模块与接口层 功能模块与接口层采用目前流行的B/S架构,以web网页形式将各个功能进行展示。用户通过WEB浏览器对系统进行登录和访问,根据权限调用不同功能模块,实时开展网上监管工作,掌握系统运行数据。 各子系统详细介绍监管 对我省互联网视听节目网站中的视音频节目扫描采集分类罗列,识别节目中是否政治有害、淫秽色情违规行为,一旦发现及时预警。发现 省新闻出版系统监控的重点网站周期为每扫描一周,爬取深度不低于 未批站点 已批站点 系统可以对已经审批通过的站点进行搜索信息的比对,对已审批的站点进行分类、站点的人工信息录入、站点内容的自动监控跟踪,而且可以采用信息检索技术对其文本信息和视频内容进行检索。 重点网站 系统对重点网站进行重点监控,可对该网站节目的节目名称、节目URL、节目详细信息、点击数、回复数进行抓取。并且可对系统初判为疑似违规的节目进行自动下载和分析。 节目采集 监控范围的音视频网站进行爬虫模块定制,轮循采集网站中的音视频节目、音频(听书)网络直播),系统监控的重点网站周期为每扫描一周,爬取深度不低于抓取过程中比对违规

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档