神通:迈向100TB:电信业海量数据存储中的数据库实践.pdfVIP

神通:迈向100TB:电信业海量数据存储中的数据库实践.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
神通:迈向100TB:电信业海量数据存储中的数据库实践.pdf

DTCC2011 DTCC2011 迈向100TB :电信业海量 数据存储中的数据库实践 冯柯 2011-4-12 目录 DTCC2011 DTCC2011 问题与挑战 我们如何压缩? 我们如何索引? 我们的产品 我们下一步做什么? 问题刻划 DTCC2011 DTCC2011 数据:  海量话单文件,500亿行/ 月,每行70列,450字节  需要保存2+6 (1)月  数据总量超过200TB 查询  基于特定条件(通话起止时间、主被叫号码、局内外交换机号、产品 名称等)组合的详单查询  绝大多数查询只会返回少量的结果 问题:上述查询可以在1秒以内完成吗? 主要约束 DTCC2011 DTCC2011 约束1:我们不是在构建超级计算机  只使用普通的服务器:刀片机,8核,每核4GB 内存  只使用普通的存储阵列:最大容量4~5TB,平均传输率300MB/秒  支持压缩对降低整体成本至关重要 约束2:每个月的数据能够在一天内装载完吗?  数据装载速度不低于300MB/秒  装载不是必须的 其它功能性约束:  提供标准的SQL支持  支持双机热备  … 挑战1:如何压缩? DTCC2011 DTCC2011 压缩的主要目的不是减少空间占用,而是提高查询性能  CPU平均处理带宽3.6GB/秒(7000万行/秒/核),I/O平均处理带宽 300MB/秒  通过压缩提升I/O带宽,实现CPU与I/O处理均衡,提高查询性能 使用通用压缩算法?  LZMA:CPU处理带宽太低 压缩比18.9:1,解码速度171MB/秒/核 (折算后)CPU处理带宽991MB/秒,I/O处理带宽5.7GB/秒  LZOP:压缩率太低 压缩比7.2 :1,解码速度891Mb/秒/核 (折算后)CPU处理带宽2.4GB/秒,I/O处理带宽2.2GB/秒 我们对压缩的要求  压缩率不低于15:1  CPU处理带宽不低于5GB/秒 挑战2:如何索引? DTCC2011

文档评论(0)

wgvi + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档