时态数据库的分史存储技术.docVIP

  • 2
  • 0
  • 约9.22千字
  • 约 6页
  • 2016-11-22 发布于北京
  • 举报
时态数据库的分史存储技术.doc

时态数据库的分史存储技术 唐常杰 于中华,张天庆,徐代刚,杨 峰 四川大学计算机系 摘要:根据应用中时态数据使用频率特点。本文提出三史制存储技术,将对象历史分为远、中、近三期,分介质、变粒度存储,并设置两个过渡期,提出了时代转移算法和压缩采样算法。定量分析了三史制时空效益,用实例说明时态存储密度和时态查询速度提高了一到二个数量级。 关键词:时态数据库,分史存储,时态转移算法,压缩采样,时态存储密度。 在TDB中,保存了被处理对象的历史,历史只能追加,不能删除。但除了以考古为目的的TDB,大多数TDB应用都是厚今薄古的,即当前或不久前的这些数据用得多,而历史久远的数据用得少。根据这一观察,本文提出三史制存储技术,将对象历史分为远、中、近三期,分介质、变粒度存储,本文将介绍作者在这一方案中对存储结构、算法、和显著的时空效益。HBase是国家自然科学基金支持的项目,项目背景和技术细节请参见文献[2]—[4]。 1 HBase的分史策略 HBase中,个历史按事务时间排序。 HBase把被管理对象按事务时间在[0,Now]上的历史划分为三个时期和两个过渡区间,如图1。这一存储制式又称为三史制,而传统的不划分时间的制式又称为单史制。HBase的三史制与文献[5]中分割 “TDB = 快照 + 历史” 有本质不同。HBase模型的当前期不是快照,而是[CB, N

文档评论(0)

1亿VIP精品文档

相关文档