数据云寻找在云计算上合适的大数据管理抽象层.PDF

数据云寻找在云计算上合适的大数据管理抽象层.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据云:寻找在云计算上合适的 大数据管理抽象层 王晓阳 复旦大学计算机科学技术学院 2012.10.13 NDBC 2012 Outline  背景:数据管理  大数据(Big data )、云计算(Cloud )  数据云(在云上管理大数据)  几种数据云上可能的数据模型  值得研究的问题   结论 数据管理 存储方式方法 使用方式方法 数据系统性质 数据模型(Data Model) Logical Data Manipulation Structure + Language Physical Access models patterns 数据系统性质 ACID CAP BASE 关系模型   结构简单且非常灵活、满足众多要求   SQL成熟可靠  行存储支持快速数据存取  列存储支持快速数据分析   事务管理(transaction management ) 大数据(Big Data)   数据性质:3V (或 4V )  Volume ,Velocity ,Variety , (and Value )   但不见得所有“大数据”3V 都占   Possibly only Volume+Velocity   Or only Volume+Variety 大数据(Big Data)  用户要求  快速导入、快速提取  大量数据上Analytics   “Do it cheap ” 云计算   大量低价硬件   高速内联网络   低价(开源)基础软件   包括操作系统、数据库 云的性质   支持计算   基础:多核、大量结点、高速网通讯   结点间无共享(Share nothing )   多错(经常宕机)   支持数据   特点:海量   一般:充分共享(拷贝昂贵)   支持Scale-out   要求:充分利用增加的节点 数据云 建立在云计算平台上的(大)数据管理系 统 数据云:数据模型?  Relation based  Key-value based  Graph based  Matrix based Relation based  NewSQL  专注 Volume +Velocity  Scale-out  Xeround Technical Problems: CAP property Something must give… Key-value based   A set of key-value pairs :任意key ,任意value   可以嵌套(既set of sets )   常用标准:JSON /BSON { firstName : John, lastName : Smith, male: true, age: 25, address: { streetAddress : 21 2nd Street, city: New York, state: NY, postalCode : 10021 }

您可能关注的文档

文档评论(0)

fkh4608 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档