- 1、本文档共13页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据学习小结 什么叫大数据 大数据(big data),是指在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合。 特征 Volume(大量) Velocity(高速) Variety(多样) Value(价值) 为什么要研究大数据 著名的例子:啤酒喝尿布 全球零售业巨头沃尔玛在对消费者购物行为分析时发现,男性顾客在购买婴儿尿片时,常常会顺便搭配几瓶啤酒来犒劳自己,于是尝试推出了将啤酒和尿布摆在一起的促销手段。没想到这个举措居然使尿布和啤酒的销量都大幅增加了。如今,“啤酒+尿布”的数据分析成果早已成了大数据技术应用的经典案例,被人津津乐道。 身边的经典例子 个人上网,购物推荐提示 大数据分析技术 Apache Hadoop Hadoop是一个由Apache基金会所开发的分布式系统基础架构。 Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。 Hadoop的框架最核心的设计就是:HDFS和MapReduce。HDFS为海量的数据提供了存储,则MapReduce为海量的数据提供了计算。 ORACLE-表分区 1、范围分区 根据数据库某一字段的值范围划分分区 create table TestTable ( date_time datetime, …… ) partition by range(date_time) ( partition part1 VALUES less THAN to_date(2010-10-1, yyyy-mm-dd), partition part2 VALUES less THAN (2015-12-1) TABLESPACE TS02, partition partMax values less than (maxvalue) TABLESPACE TSMAX ) ORACLE-表分区 2、列表分区 列表分区明确指定了根据某字段的某个具体值进行分区,适合某列只有具体的一些值 create table TestTable ( testCol varchar2(2), …… ) partition by list(testCol) ( partition part1 values(1), partition part1 values(2), partition p_other values (default) ) ORACLE-表分区 3、散列分区 这类分区是在列值上使用散列算法,以确定将行放入哪个分区中。当列的值没有合适的条件时,建议使用散列分区。hash分区会将表中的数据平均分配到你指定的几个分区中 create table TestTable ( testCol varchar2(2), …… ) partition by hash(testCol) ( partition part1 tablespace tablespace01, partition part2 tablespace tablespace02 ) ORACLE-表分区 4、复合分区 分区内再建分区就是复合分区。 复合分区呢在10g中有两种:range-hash,range-list。注意顺序,根分区只能是range分区,子分区可以是hash分区或list分区。 create table TestTable ( date_time datetime,, testCol2 varchar2(2) ) partition by range(date_time) subpartition by hash(transaction_id) subpartitions 2 store in (tablespace01,tablespace02
您可能关注的文档
- 农业产业链融资模式比较和金融服务创新pdf.pdf
- 软件代码评审检查点--C-C++要领.doc
- C++ 第十八讲 继承和泒生类.ppt
- 教你怎样选购显示器.pdf
- 第三章 Oracle数据库教程 —— oracle RAC 更换存储迁移数据.pdf
- 系统架构设计-怎样设计架构.pdf
- 账套数据备份与恢复.ppt
- 国际金融中心支付清算体系比较与对上海的启示.pdf
- 执业药师血液系统疾病用药习题幻灯片.pdf
- visual studio学习第2章 变量及表达式.pptx
- 2023学年诸暨中学高三年级第二学期3月第二次模拟考试(政治)公开课教案教学设计课件资料.docx
- 运动的合成与分解(二)公开课教案教学设计课件资料.pptx
- 近五年浙江省各地图形的翻折(轴对称)原题公开课教案教学设计课件资料.doc
- 如何做教师-2019-11-13-中关村一小相关公开课教案教学设计课件资料.pptx
- 生活中的圆周运动 (水平面)正式版公开课教案教学设计课件资料.pptx
- 专题10 条件概率与全概率公式公开课教案教学设计课件资料.docx
- 金华市东阳市2019学年第二学期期末测试卷公开课教案教学设计课件资料.doc
- 5 琥珀(第二课时)【慕课堂版】公开课教案教学设计课件资料.pptx
- 项目五 打印米老鼠模型公开课教案教学设计课件资料.ppt
- (打印版)9月25日地理周练公开课教案教学设计课件资料.docx
最近下载
- 禽肉类食材配送及售后服务方案.docx
- 果树生产技术教学教案.pdf
- 英语三级大学英语历年考试真题汇总及答案.pdf VIP
- 2024年教师招聘体育专业知识点填空题及答案(共130题).pdf VIP
- 全国中学生物理竞赛内容提要(俗称竞赛大纲)2024年版.pptx
- 全套建筑工程施工质量验收全套资料土建部分.doc
- 天津忠旺铝业有限公司1#熔铸车间铸造井施工方案5.23改要点.doc
- 2024浙江省执业药师继续教育答案-前列腺增生的合理用药及健康管理.docx VIP
- 2023年全国交通运输行业技能大赛桥隧工竞赛理论试题库汇总(含答案).docx VIP
- 天津忠旺铝业有限公司1#熔铸车间铸造井施工方案改.doc
文档评论(0)