- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
20100531从稀疏数据处理角度看多租户数据存储陈维良
* * * * * * * * * * * * * * 从稀疏数据处理角度看 多租户数据存储 陈维良 2010-05-31 主要参考文献 1 Storage and Querying of E-Commerce Data VLDB 2001 2 Extending RDBMSs To Support Sparse Datasets Using An Interpreted Attribute Storage Format VLDB 2006 3 The Case for a Wide-Table Approach to Manage Sparse Relational Data Sets SIGMOD 2007 4 A Comparison of Flexible Schemas for Software as a Service SIGMOD 2009 5 The Design of the F Multitenant Internet Application Development Platform SIGMOD 2009 主要内容 一 稀疏数据处理背景解决方案 二 多租户数据存储与传统稀疏数据处理异同 三 基于稀疏表的多租户数据存储解决方案 四 分桶稀疏表存储方案(自己的想法) 稀疏数据处理背景传统解决方案 1 新生的电子商务应用需要数据模式的持续演变并且有稀疏的特点 2 传统的水平存储模式不能很好的满足这些需求 3 VLDB01 提出使用垂直存储(vertical table),在其上建立逻辑水平视图(logical horizontal view),并利用这些视图进行查询转换 4 VLDB06 提出扩展RDBMS去使用一种解释属性存储(Interpreted attribute storage)方法来处理空值(nulls) 5 SIGMOD07 从模式设计角度出发,认为单表解决方案是较合适的选择(single-table approach is a necessary component),因为单表解决方案使用户从繁重的模式设计工作中解脱。 6 SIGMOD09 提出了F的多租户存储架构 稀疏数据处理背景传统解决方案 一:电子商务数据特点 In trying to store all our electronic parts in one table using this scheme, we ran into the following problems: Large Number of Columns The current database systems do not permit a large numbers of columns in a table. This limit is 1012 columns in DB2 (also in Oracle), whereas we had nearly 5000 attributes across different categories. Sparsity Even if DB2 were to allow the desired number of columns, we would have had nulls in most of the fields. In addition to creating storage overhead1, nulls increase the size of the index and they sort high in the DB2 B+ tree index. Schema Evolution We would need frequent altering of the table to accommodate new parts and categories. The schema evolution is expensive in the current database systems. Performance A query incurs a large performance penalty if the data records are very wide but only a few columns are used in the query. 惩罚,不利 稀疏数据处理背景传统解决方案 二:垂直存储解决方案(Vertical Representation) However, once the data is stored in the vertical format, new problems arise
您可能关注的文档
- 12500243778477993彭水苗族土家族自治林木种苗站-彭水.DOC
- 105834_第二十五单元近代现的科学技术和文化-兰州十中.PPT
- 10107语文领域的教学评量从命题审题谈起邢小萍.PPT
- 20000勒克斯的光照条件下如果光合作用合成的有机物都是葡萄糖.PPT
- 2002007第一学期八年级生物学上册期中测试题.DOC
- 2005年五环境质量监测简报.DOC
- 2005年直部门科技进步奖励推荐项目汇总表-gedexamtutor.DOC
- 2006年江苏高考综合考试理科综合卷及答案和评分标准-乙太天下通.DOC
- 2008深圳国际茶业茶文化贸易博览会-深圳贸促委.DOC
- 2009年上海普通高等学校招收中等职业学校应届毕业生.DOC
文档评论(0)