基于文件拆分和缓存预测的日志文件传输算法 journal file transmission algorithm based file splitting and buffer memory prediction.pdfVIP
- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于文件拆分和缓存预测的日志文件传输算法 journal file transmission algorithm based file splitting and buffer memory prediction
东信北邮信息技术有限公司专栏
E A S T C O M - B U P T I N F O R M AT I O N T E C H N O L O G Y C O . , LT D . C O L U M N
电信工程技术与标准化
基于文件拆分和缓存预测的日志文件传输算法*
1,2 1,2
马赛牧 王晶
(1 北京邮电大学网络与交换技术国家重点实验室,北京 100876; 2 东信北邮信息技术有限公
司,北京 100191)
摘 要 当今的云计算平台和大型网站在运行时都会产生大量的日志文件,这些日志文件一般都具有收集分析的价
值,所以在日志文件的收集过程中就出现了大日志文件的传输问题。本文要解决的问题就是如何使日志文件
能够快速的传输到接收端。为此本文在研究了当前已经有的大数据传输办法之后,针对日志文件提出了与传
输协议无关的新算法:文件拆分和预测算法。该算法主要由两部分组成:首先对日志文件进行拆分,拆分成
包含描述性信息的文件和包含数据的文件,消除了文件中的冗余信息;然后在传输过程中通过预测接收端缓
存的数据来达到消除传输过程中的冗余信息的目的。经过实验检验,本文设计的算法能够将实际传输的数据
量降低90%以上。
关键词 文件传输;fingerprint;消除冗余;云计算
中图分类号 TP393 文献标识码 A 文章编号 1008-5599(2013)08-0071-08
各个互联网平台在正常工作时都会产生大量的运 数据传输量,文献 [2] 是在骨干网上通过选择传输路径
行日志,尤其是大型的开放云平台和电子商务网站,云 来实现大文件的传输,主要适用于有多个存储转发节点
平台的管理者一般都要收集备份这些日志以备监控平 的网络,通过对网络建模可以使用最大流 [3] 的算法来进
台运行情况,以及分析用户行为。大量的日志不仅占用 行传输,文献 [4] 是通过检测网络缓存中数据的相似性
很多存储空间,而且更重要的是在传输这些文件时非常 来消除网络传输的冗余。
的低效,很多平台和网站需要周期性的将日志文件通过 上述文献中的方法都更侧重所传输数据的通用性,
网络传输备份到数据中心。在这个过程中,如何在现有 在日志文件的传输方面,由于日志文件的特殊性,比如
带宽条件下提高数据传输效率就成为了一个需要解决 其日志文件格式相对统一固定,因此在使用上述文章中
的问题。 方法传输日志文件时,都拥有进一步优化的空间。文献
目前业内在大数据传输方面已经做了一些工作。 [2] 是在提高带宽利用率做出了贡献,但并不能减少传输
Zohar 等人 [1] 实现了一种数据接收端驱动的传输模式, 量和消除传输冗余。文献 [1] 主要的使用场景是接收端
接收端通过预测传输文件的下一段数据来减少网络上的 已经拥有部分的数据,通过预测来避免发送方发送接收
收稿日期 :2013-07-16
* 基金项目 :国家 973 计划项目(No. 2013CB329100, 2013CB329102);国家自然科学基金(No.
;长江学者和创新团队发展计划资助(No. IRT1049)。
您可能关注的文档
- 基于图论的城市电网最大供电能力模型及算法 model and algorithm for maximum power supply capacity of urban power grid based on graph theory.pdf
- 基于图论的集中式保护主后备保护区域划分 zone selection of primary and backup protection in centralized protection based on graph theory.pdf
- 基于图解法的泵旁路调节原理及优化 the principle and optimization of bypass control for pump based on graphic method.pdf
- 基于图片的变电站设备信息管理系统 substation information management system based on pictures.pdf
- 基于图论的n阶升压式谐振开关电容变换器潜电路分析技术 sneak circuit analysis in n-stage step-up resonant switched capacitor converters based on graphic theory.pdf
- 基于图染色思想的rfid防冲突算法研究 research of rfid anti collision algorithm based on.pdf
- 基于图论的含分布式电源配电网供电恢复动态规划方法 a dynamic programming method based on graph theory for restoration of distribution system with dgs.pdf
- 基于图像处理的led球泡灯组件自动排料的研究 the research on automatic arrangement of led bulb components based on image processing.pdf
- 基于图像处理的输电线路覆冰厚度测量 transmission line icing thickness measuring based on image processing.pdf
- 基于图像处理的管束间气液两相含气率的实验研究 investigation on gas-liquid two-phase flow void fraction across tube bundles based on images processing method.pdf
- 基于文字穿越线和笔画连通性的视频文字提取方法 an approach for video-text extraction based on text traversing line and stroke connectivity.pdf
- 基于稳定参数控制的改进遗传算法在配电网络规划中的应用 improved genetic algorithm on evolutionarily stable strategy applied in distribution network planning.pdf
- 基于稳定裕度指标的暂态电压稳定分析 analysis of transient voltage stability based on a novel transient stability index.pdf
- 基于稳定约束的电力系统稳定平衡解模型 stable equilibrium solution model of power system based on stability constraints.pdf
- 基于稳定域边界理论的暂态稳定指标及其应用 transient stability index of power systems based on theory of stability region and its applications.pdf
- 基于稳健估计时间序列法的风功率预测 wind power forecasting using time series model based on robust estimation.pdf
- 基于稳健估计的迭代型支持向量机及其在电站数据检验中的应用 iterative support vector machine based on robust estimation and its application in data validation in power plant.pdf
- 基于稳健最小二乘的鲁棒波束形成 robust adaptive beamforming based on least-square.pdf
- 基于稳态分析和区间层次分析法的分布式电源最佳位置确定方法 a method for optimal layout of distributed generations based on steady-state analysis and interval analytic hierarchy process.pdf
- 基于稳定性和电压精度协调控制的新型模糊励磁调节器 fuzzy excitation controller based on coordinative control of voltage precision and system stability.pdf
最近下载
- 一种窄冠带条多层缠绕搭接量计算方法及应用.pdf VIP
- 2025年融媒体中心全媒体记者招聘考试笔试试题(附答案).docx VIP
- L10010022《病理学》课程标准.pdf VIP
- 【必备收藏】幼儿建构区游戏指导完整版课件-.pptx VIP
- 主题策略-【专题报告】CANSLIM4.0策略:叠加企业生命周期.docx VIP
- 最新人教版九年级化学演示、分组实验统计表.xls VIP
- GB 50797-2012 光伏发电站设计规范.docx VIP
- 插画设计-PPT课件(全).pptx
- 古代牝户手抄本雨花香PPT课件.pptx VIP
- 【大单元整体教学设计】人教版初中化学九年级上册 第三单元物质构成的奥秘 课题1 分子和原子.doc VIP
文档评论(0)