《列存储概述》.pptVIP

  • 3
  • 0
  • 约3千字
  • 约 14页
  • 2015-12-10 发布于河南
  • 举报
《列存储概述》.ppt

2、列存储原理 列存储是关系数据的另一种物理存储方式,不同于行存储,其基本 原则是将逻辑表进行垂直划分,然后逐列存储数据,使得查询处理时 能只读取与查询相关的列,避免读取无关列,提高数据I/O效率,从而 提高查询处理的速度。 数据库以行、列的二维表的形式存储数据,以一维字符串方式在 存储器(硬盘)上存储,例如以下的一个表: 现在考虑这样一个例子,假设在一张客户信息表中我们要得到所有生日在七月份的客户的名字和电子邮件地址。在一个典型的OLTP数据库引擎中,查询优化器将根据返回行的百分比(比如在本例中,假设各月的生日都基本平均,则返回行数的百分比为1/12)来决定是否值得在该列上使用索引。因此,典型的数据库引擎对该查询可能会做全表的扫描。为了对扫描的成本做一估算,我们假设每个客户的行记录为3200个字节,共有1000万个条记录。因此,表扫描必须从硬盘中读取320亿个字节的数据。 列存储方式可以只读取查询所需的列。在本例中,有三个相关的列:客户全名、电子邮件地址和出生日期。假设全名为25个字节,电子邮件地址为25个字节,出生日期为4个字节(日期以二进制做内部编码)。那么只需要读取5.4亿个字节的数据——大约减少了59倍! 此外,传统的数据库引擎不能以一种通用的方式进行数据压缩,主 要是由于存在以下三个问题: 1.按行存储的数据存储方式不利于压缩。这是因为数据(大多为二进

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档