Alluxio:2024对云上分析SQL引擎进行I、O优化的成本效益白皮书.pdfVIP

Alluxio:2024对云上分析SQL引擎进行I、O优化的成本效益白皮书.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

�ALLUXIO白皮书

对云上分析SQL引擎

进行1/0优化的成本效益

TheCostEffecton1/0OptimizationforAnalyticalSQLonCloud

*本白皮书版权归属千北京开元维度科技有限公司,未经授权,不得进行任何形式转载和分发。

摘要

本文探讨了将数据密集型分析应用从本地迁移到云原生环境这一普遍的行业趋势。

我们发现,与云存储相关的独特成本模型要求对性能优化有更细致的了解。具体而

言,根据从UberPresto生产环境中收集的数据,我们认为在云中简单地应用常见

的1/0优化,比如tablescan和filter(表扫描和过滤),以及broadcastjoin

(广播连接)可能会产生意想不到的成本。这是因为传统的1/0优化主要侧重千改

善本地环境中的吞吐量或延迟,而没有考虑到与存储API调用相关的财务成本。在

云环境中,这些成本可能会非常高昂仅在Uber实际的使用规模下,Presto工作

1

负载每天就可能涉及数十亿次的API调用。本文将以案例研究的形式呈现1/0优化

逻辑和思路,可作为读者进一步研究的起点,从而设计出专门针对云环境中数据密

集型应用的高效1/0策略。

01

目录

3

1导言

5

2云成本模型

866

31/0优化对工业分析负载的影响

3.1工业分析流量模式在云1/0成本方面的挑战

3.2Tablescan和filter优化带来的成本挑战

9

3.3BroadcastJoin优化的成本挑战

4讨论11

4.1提高存储资源效率

11

4.2创建带缓存的虚拟存储层

12

4.3具备成本意识,重新设计数据密集型应用

文档评论(0)

87090 + 关注
实名认证
文档贡献者

中学高级教师 从事一线教育教研15年多

1亿VIP精品文档

相关文档