关于多媒体网络信息缓存管理和安全管理范文.docxVIP

关于多媒体网络信息缓存管理和安全管理范文.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
— PAGE \* Arabic 1 — 关于多媒体网络信息缓存管理和安全管理范文 关于多媒体网络信息缓存管理和安全管理范文   多媒体信息是多种媒体数据结合的综合体,具体有文本、语音、图像、视频等形式。网络的开放性提供多媒体网络大数据形成的契机,即网络社交、在线教育、电子商务、新闻传播等行业无时无刻不在产生图像、文字、语音等形式的多媒体网络信息[x]。但是多媒体技术在改善人类生活方式与生活效率的同时,也造成了数据冗余的不良影响。由于人们对多媒体网络大数据的管理整合力度不足,所以大数据丧失了原本的事物预测、规律挖掘价值。本文结合大数据时代信息处理的热点技术营造了多媒体网络信息整合的高效计算环境[x],基于数据仓库设计一套高效且有效的数据整合管理方案,优化多媒体网络信息数据的使用价值。   一、多媒体网络信息大数据整合   (一)Spark并行计算框架   大数据时代产生的多媒体信息数据呈海量规模增长,然而传统的串行计算环境每次只能执行单个指令,难以满足用户高效率、大规模数据整合需求。所以,对这部分数据信息的整合需要在大数据并行框架环境下完成,确保每次能够执行多个数据计算指令以增加问题求解的范围,从根本上改善复杂性多媒体信息大数据整合计算的速度[x]。根据开源计算框架Hadoop的性能不足,技术人员开发了全新的基于内存运算的Spark并行计算框架,采用弹性分布式数据集代替传统计算框架的核心数据结构,解决了数据整合运算期间产生的大量网络IO开销与内存IO开销问题,因此大幅度提升了大数据整合计算的效率,减少了资源占用率。在Spark并行计算框架下,多媒体大数据整合用户借助弹性分布式数据集可实现部分数据在内存中的缓存,并行计算操作执行可以循环使用这部分缓存数据。Spark并行计算框架为了灵活操作弹性分布式数据集,设置了一部分特定算子专门为弹性分布式数据集运算提供服务。算子本质上是Spark的函数工具,因此,算子与弹性分布式数据集是Spark并行计算框架的核心构成。弹性分布式数据集为抽象化的数据结构,数据集在机群服务器内存中的存储形式被其定义为分布式,换言之,一个多媒体网络信息数据集被规划成数个数据块,一一分布存储在机群节点部位[x]。Spark框架赋予每个多媒体数据块独特的BlockID标识,识别BlockID标识对应的元数据即可灵活执行对数据块的存储、传输等操作。此外,为了方便借助算子操作多媒体数据,多媒体数据块运算过程中被划分成多个区域。除了弹性分布式数据集与算子设定以外,Spark并行计算框架引入了智能化任务调度机制,以改善大数据整合操作的调度问题。各个任务阶段可以根据实际运算量确定使用串行还是并行方式,阶段任务的中间结果不必要保存在HDFS内,进而减少Hadoop开启与任务调度过程中产生的开销问题。   (二)基于数据仓库的多媒体网络信息大数据整合技术   在多媒体网络大数据整合分析之前,有必要对其进行压缩处理,降低多媒体网络信息的冗余度,提高数据存在的价值度。所以,多媒体网络信息大数据压缩也是针对其多余部分进行压缩处理。例如,网络文件中如果反复出现同一符号,高于正常符号出现的频率,减少或者删除部分此符号即可达到数据压缩的目的。本文选取哈夫曼编码算法进行多媒体信息的无损无失真压缩,最大程度维持数据信号的质量[x]。在此基础上,利用数据仓库技术对多媒体网络信息大数据进行整合。数据仓库的体系架构设计,见图x.基于数据仓库的多媒体网络信息整合能够描述多媒体数据的历史性变化历程,存储整合数据的性能相对稳定,可以按照内容主题进行数据整合归类,为多媒体网络信息管理决策提供基础条件。结合图x分析基于数据仓库整合信息的过程:多媒体网络信息主要以文本、语言、图像等形式存在,对这部分数据进行压缩处理后需要采用ETL工具进行数据调度,以规范数据表达形式;ETL数据调度主要包括数据抽取、转换与加载。接下来构建CDC数据仓库,按照多媒体网络信息的主题要求进行分类整合存储,设计数据模型时发挥OracleBIEExxg中间件作用。最后,通过数据仓库整合的多媒体网络数据可以作为特定行业的业务规划、关联规则挖掘以及决策分析的依据。以上是多媒体网络信息数据仓库构建的基本过程,为提高大规模数据整合效率与稳定性,设计了数据仓库的优化调度策略。同时,在数据仓库集成关联规则挖掘算法,辅助完成多媒体网络信息的关联度挖掘。x.数据仓库的优化调度策略ETL是数据仓库全程使用的重要数据处理工具,完成文本、语音、图像等多媒体信息由网络云平台向数据仓库的抽取工作,根据数据规模的不同可使用全量抽取或者增量抽取。抽取期间以更加标准规范的方式约束数据质量,将有价值的数据转移到数据仓库中,排除冗余数据部分[x]。为了保证ETL工具调度的高效性

文档评论(0)

泰和宸风 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体泰和宸风文化科技(青岛)有限公司
IP属地北京
统一社会信用代码/组织机构代码
91370211MA94GKPQ0J

1亿VIP精品文档

相关文档