- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
列存储数据库技术及图书馆共享域建设
列存储数据库技术及图书馆共享域建设〔摘 要〕传统图书馆各类应用软件平台的数据库大多为行存储模式的关系型数据库,真正运用以海量存储、高可靠性为特征的具备列(云)存储技术的比较少。本文以分析列存储技术特点为出发点,结合图书馆共享域建设的技术需求,提出与搭建开源数据库平台:Hbase,讨论该平台在未来图书馆共享域建设中可以发挥重要的作用
〔关键词〕列存储数据库;云存储;共享域
DOI:10.3969/j.issn.1008-0821.2011.12.021
〔中图分类号〕G250.74 〔文献标识码〕B 〔文章编号〕1008-0821(2011)12-0078-04
Column Oriented Database Systems and Library ConsortiaGao Jianzhong
(Library,Xi?an Jiaotong University,Xi?an 710049,China)
〔Abstract〕The traditional library database of most kinds of application software platform is RDBMS with row storage model,the column(cloud)storage technology with mass storage,high reliability rarely used here.Based on analysis of the column storage technology,combined with the technology needs of the library consortia,proposed and built the open source database platform:HBASE,to discuss the platform can play an important role in the construaciton of library consortia.
〔Key words〕column-oriented database;cloud storage;consortia
1 列存储的概念与背景知识
列存储的思想早在1985年ACM的SIGMOD会议上George P.Copeland和Setrag Khoshafian就在文章“A Decomposition Storage Model”[1]中对列存储进行了比较详细的介绍,它提出了“分解存储模型”(DSM,Decomposition Storage Model),DSM将关系垂直分为N个子关系,相同属性的值存储在一起,属性仅当需要时才加以存取访问。而Sybase在2004年左右推出了列存储的Sybase IQ数据库系统,主要用于在线分析、数据挖掘等查询密集型应用
2005年Michael Stonebraker在VLDB上发表文章“One Size Fits All:An Idea Whose Time Has Come and Gone”[2]指出随着时代发展,一种数据库可以统一所有应用的日子已经一去不复返,未来商业数据库市场将分裂为各种独立的数据库引擎的集合。同年,他开发出一种列存储的数据库原型系统――C-Store[3]。C-Store在优化查询、包含重复映射、利用密集压缩减少存储容量和分布式处理等方面有很大创新。特别是在查询性能上远远优于传统行存储数据库
综上所述,可对列存储作以下定义:列存储是一种将数据库表的所有记录中相同字段的数据聚合存储的方式,并通过表中的列来存储与访问数据
2 列存储存储模型、技术特点与应用范畴
2.1 行存储与列存储模型比较
由上图可见行存储是将数据组织成多行,这样可在操作中找到所有的列。缺点是操作时必须每次处理一整行,而不是只处理需要的列。优点是在处理相同对象的两列或多列查询时能够取得较快的速度,同时可提高更新、插入和删除速度
列存储是将数据组成多列存储在物理空间上,这样在查询对象少数列的时候可以显著提高查询速度,因为不需要一行行去读取对照从而找到需要的列。缺点是在对象需要频繁执行多列更新、插入和删除时速度不及行存储
2.2 行列存储技术特点比较
存储类型特 点数据存储数据读取数据压缩行存储数据按行存储――表中每行记录的所有属性在物理空间上存储在一起查询时将一行的所有属性读出―产生大量?I/O负载对于行中所有记录,采用统一的压缩方式列存储数据按列存储,表中同一属性在同一列中只访问查询涉及到的列――大量降低系统?I/O数据类型一致、特征相似――高效压缩
列存储数据库技术
您可能关注的文档
- 关于如何做好典型宣传思考.doc
- 关于园林植物病虫害防治方法探析.doc
- 关于完善中小企业内部控制建设几点思考.doc
- 关于完善我国新农村建设中农民问题探究.doc
- 关于完善我国行政补偿程序思考.doc
- 关于定量包装商品计量工作现状分析及对策.doc
- 关于实现企业存货规范管理思考.doc
- 关于如何确保企业资产保值增值若干问题探究.doc
- 关于室内装饰设计中人文关怀创新性思考.doc
- 关于对企业惩治及预防腐败相关问题初浅认识.doc
- springbooot+vue基于java的房屋维修系统毕业论文.doc
- 中国消防救援学院《单片机系统实验》2023-2024学年第一学期期末试卷.doc
- 2025年溧阳纺织化学品项目申请.pptx
- 景区门票包销合同模板(3篇).docx
- 【股票技术指标学习指南】第七章第三节货币需要量的测算.doc
- 2025春 _ 人教版七年级英语下册【unit4】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit5】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit6】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit7】看音标写单词.doc
- 2025春 _ 人教版七年级英语下册【unit8】看音标写单词.doc
文档评论(0)