- 1、本文档共103页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章 数据管理朝乐门 中国人民大学chaolemen@数据科学中的数据管理内容简介图7-1数据科学中的数据管理(1)目录目录图7-1数据科学中的数据管理(2)学习目的学习目的学习目的学习目的图7-2 大数据时代的数据管理需求目录目录图7-1数据科学的基础理论(2)7.1基本类型7.1 基本类型图7-3 数据管理技术的类型7.1基本类型7.1.1 关系数据库关系数据技术不断趋于成熟事务(Transaction)处理能力两段封锁(Two-Phase Locking,2PL)协议两段提交(Two Phase Commitment,2PC)协议坚实的理论基础标准化程度高产品的成熟度高 7.1基本类型7.1.1 关系数据库事务(Transaction)处理能力 图7-4 事务的特征7.1基本类型7.1.1 关系数据库两段封锁(Two-Phase Locking,2PL)协议封锁的基本类型有:X锁:排它锁,事务T1对数据对象D1加了X锁之后,只要并未释放该锁,其他事务不能对数据对象D1加任何类型的锁。S锁:共享锁,事务T1对数据对象D1加了S锁之后,虽并未释放S锁,其他事务也可以对D1加S锁,但不能加X锁。 7.1基本类型7.1.1 关系数据库两段封锁(Two-Phase Locking,2PL)协议在关系数据库中,两段锁协议是指事务必须分两个阶段队数据对象加锁阶段和解锁阶段:加锁阶段:在该阶段可以进行加锁操作。在对任何数据进行读操作之前要申请并获得S锁,而在进行写操作之前要申请并获得X锁。如果加锁不成功,则事务进入等待状态,直到加锁成功才继续执行。解锁阶段:当事务释放了一个封锁以后,事务进入解锁阶段,在该阶段只能进行解锁操作不能再进行加锁操作。 7.1基本类型7.1.1 关系数据库 图7-5 两段封锁协议示意图7.1基本类型7.1.1 关系数据库两段提交(Two Phase Commitment,2PC)协议实现分布式事务的关键就是两段提交协议(2PC协议)在2PC协议中,把分布式事务的某一个代理(根代理)指定为协调者(Coodinator),所有其他代理称为参与者(Participants)。 7.1基本类型7.1.1 关系数据库两段提交(Two Phase Commitment,2PC)协议图7-5 两段封锁协议示意图7.1基本类型7.1.1 关系数据库两段提交(Two Phase Commitment,2PC)协议图7-7 事务被回滚7.1基本类型7.1.1 关系数据库两段封锁(Two-Phase Locking,2PL)协议表决阶段:应用程序调用事务协调者中的提交方法执行阶段:事务协调者将事务的表决结果通知给每个参与者 7.1基本类型7.1.1 关系数据库坚实的理论基础关系代数Armstrong公理系统完整性约束理论规范化理论模式分解以及图论等 7.1基本类型7.1.1 关系数据库标准化程度高关系代数一般采用SQL语言进行数据库的查询、增加、更新、删除和索引操作,数据操作语言的标准化程度高。 7.1基本类型7.1.1 关系数据库产品的成熟度高Oracle公司的OracleIBM公司的DB2Sybase公司的Sybase微软公司的SQL ServerMySQL AB 公司开发的MySQL 7.1基本类型7.1.1 关系数据库表7-1 关系数据库的优缺点7.1基本类型7.1.2 NoSQL术语NoSQL并不是“No! SQL”的缩写,也就是说提出NoSQL技术的目的并不是要抛弃或否定关系数据技术;术语NoSQL可以理解为“Not Only SQL”的缩写,也就是说NoSQL为数据处理提供了一种补充方案;术语NoSQL容易产生歧义,Carlo Strozzi等人认为术语NoSQL并不完美,应该采用一个全新的名字,如NoREL。 7.1基本类型7.1.2 NoSQLNoSQL 是指那些非关系型的、分布式的、不保证遵循ACID 原则的数据存储系统。相对于关系数据库,NoSQL数据库的主要优势体现在:易于数据的分散存储与处理数据的频繁操作代价低以及数据的简单处理效率高适用于数据模型不断变化的应用场景 7.1基本类型7.1.2 NoSQL需要注意的是,提出NoSQL技术的目的并不是替代关系数据库技术,而是对其提供一种补充方案。如果需要处理关系数据库擅长的问题,那么仍然首选关系数据库技术;如果需要处理系数据库不擅长的问题,那么不再仅仅依赖于关系数据库技术,可以考虑更加适合的数据存储技术,如NoSQL技术等。 7.1基本类型7.1.2 NoSQL图7-8 关系数据库与NoSQL数据库之间的关系7.1基本类型7.1.3 关系云关系云是在云计算环境中部署和虚拟化的关系数据库,进而使传统关系数据库具备云计算的弹性计算、虚拟化、按需服务和高经济性等特
您可能关注的文档
最近下载
- 2024年高空作业考试题库附答案5套(完整版).DOC
- 印刷类原辅料进料检验标准.pdf
- 部编人教版四年级上册《道德与法治》全册教学反思.pdf VIP
- 江苏省南通市2023-2024学年高一上学期语文期中考试试卷(含答案).pdf VIP
- 国家开放大学《中国近现代史纲要》社会实践报告.docx VIP
- 领读经典-现代文学(1)(山东大学)中国大学MOOC慕课 章节测验期末考试答案.docx
- 《幼儿挑食、偏食行为的原因分析及对策》开题报告(含提纲)5800字.doc
- 2022年贵州省高职(专科)分类招生中职生文化综合考试试卷(语数英、含答案).pdf
- 小学语文优秀教学案例.docx VIP
- 冬季血压早达标远离心脑血管疾病-高血压慢性病培训讲座课件PPT.pptx
文档评论(0)