20100531从稀疏数据处理角度看多租户数据存储陈维良.PPT

20100531从稀疏数据处理角度看多租户数据存储陈维良.PPT

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
20100531从稀疏数据处理角度看多租户数据存储陈维良

* * * * * * * * * * * * * * 从稀疏数据处理角度看 多租户数据存储 陈维良 2010-05-31 主要参考文献 1 Storage and Querying of E-Commerce Data VLDB 2001 2 Extending RDBMSs To Support Sparse Datasets Using An Interpreted Attribute Storage Format VLDB 2006 3 The Case for a Wide-Table Approach to Manage Sparse Relational Data Sets SIGMOD 2007 4 A Comparison of Flexible Schemas for Software as a Service SIGMOD 2009 5 The Design of the F Multitenant Internet Application Development Platform SIGMOD 2009 主要内容 一 稀疏数据处理背景解决方案 二 多租户数据存储与传统稀疏数据处理异同 三 基于稀疏表的多租户数据存储解决方案 四 分桶稀疏表存储方案(自己的想法) 稀疏数据处理背景传统解决方案 1 新生的电子商务应用需要数据模式的持续演变并且有稀疏的特点 2 传统的水平存储模式不能很好的满足这些需求 3 VLDB01 提出使用垂直存储(vertical table),在其上建立逻辑水平视图(logical horizontal view),并利用这些视图进行查询转换 4 VLDB06 提出扩展RDBMS去使用一种解释属性存储(Interpreted attribute storage)方法来处理空值(nulls) 5 SIGMOD07 从模式设计角度出发,认为单表解决方案是较合适的选择(single-table approach is a necessary component),因为单表解决方案使用户从繁重的模式设计工作中解脱。 6 SIGMOD09 提出了F的多租户存储架构 稀疏数据处理背景传统解决方案 一:电子商务数据特点 In trying to store all our electronic parts in one table using this scheme, we ran into the following problems: Large Number of Columns The current database systems do not permit a large numbers of columns in a table. This limit is 1012 columns in DB2 (also in Oracle), whereas we had nearly 5000 attributes across different categories. Sparsity Even if DB2 were to allow the desired number of columns, we would have had nulls in most of the fields. In addition to creating storage overhead1, nulls increase the size of the index and they sort high in the DB2 B+ tree index. Schema Evolution We would need frequent altering of the table to accommodate new parts and categories. The schema evolution is expensive in the current database systems. Performance A query incurs a large performance penalty if the data records are very wide but only a few columns are used in the query. 惩罚,不利 稀疏数据处理背景传统解决方案 二:垂直存储解决方案(Vertical Representation) However, once the data is stored in the vertical format, new problems arise

文档评论(0)

zhaoxiaoj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档