基于文件拆分和缓存预测的日志文件传输算法 journal file transmission algorithm based file splitting and buffer memory prediction.pdfVIP

基于文件拆分和缓存预测的日志文件传输算法 journal file transmission algorithm based file splitting and buffer memory prediction.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于文件拆分和缓存预测的日志文件传输算法 journal file transmission algorithm based file splitting and buffer memory prediction

东信北邮信息技术有限公司专栏 E A S T C O M - B U P T I N F O R M AT I O N T E C H N O L O G Y C O . , LT D . C O L U M N 电信工程技术与标准化 基于文件拆分和缓存预测的日志文件传输算法* 1,2 1,2 马赛牧 王晶 (1 北京邮电大学网络与交换技术国家重点实验室,北京 100876; 2 东信北邮信息技术有限公 司,北京 100191) 摘 要 当今的云计算平台和大型网站在运行时都会产生大量的日志文件,这些日志文件一般都具有收集分析的价 值,所以在日志文件的收集过程中就出现了大日志文件的传输问题。本文要解决的问题就是如何使日志文件 能够快速的传输到接收端。为此本文在研究了当前已经有的大数据传输办法之后,针对日志文件提出了与传 输协议无关的新算法:文件拆分和预测算法。该算法主要由两部分组成:首先对日志文件进行拆分,拆分成 包含描述性信息的文件和包含数据的文件,消除了文件中的冗余信息;然后在传输过程中通过预测接收端缓 存的数据来达到消除传输过程中的冗余信息的目的。经过实验检验,本文设计的算法能够将实际传输的数据 量降低90%以上。 关键词 文件传输;fingerprint;消除冗余;云计算 中图分类号 TP393 文献标识码 A 文章编号 1008-5599(2013)08-0071-08 各个互联网平台在正常工作时都会产生大量的运 数据传输量,文献 [2] 是在骨干网上通过选择传输路径 行日志,尤其是大型的开放云平台和电子商务网站,云 来实现大文件的传输,主要适用于有多个存储转发节点 平台的管理者一般都要收集备份这些日志以备监控平 的网络,通过对网络建模可以使用最大流 [3] 的算法来进 台运行情况,以及分析用户行为。大量的日志不仅占用 行传输,文献 [4] 是通过检测网络缓存中数据的相似性 很多存储空间,而且更重要的是在传输这些文件时非常 来消除网络传输的冗余。 的低效,很多平台和网站需要周期性的将日志文件通过 上述文献中的方法都更侧重所传输数据的通用性, 网络传输备份到数据中心。在这个过程中,如何在现有 在日志文件的传输方面,由于日志文件的特殊性,比如 带宽条件下提高数据传输效率就成为了一个需要解决 其日志文件格式相对统一固定,因此在使用上述文章中 的问题。 方法传输日志文件时,都拥有进一步优化的空间。文献 目前业内在大数据传输方面已经做了一些工作。 [2] 是在提高带宽利用率做出了贡献,但并不能减少传输 Zohar 等人 [1] 实现了一种数据接收端驱动的传输模式, 量和消除传输冗余。文献 [1] 主要的使用场景是接收端 接收端通过预测传输文件的下一段数据来减少网络上的 已经拥有部分的数据,通过预测来避免发送方发送接收 收稿日期 :2013-07-16 * 基金项目 :国家 973 计划项目(No. 2013CB329100, 2013CB329102);国家自然科学基金(No. ;长江学者和创新团队发展计划资助(No. IRT1049)。

您可能关注的文档

文档评论(0)

qianqiana + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5132241303000003

1亿VIP精品文档

相关文档