云计算分布式大数据Hdoop深入浅出案例驱动实战外训讲义.ppt

下载文档 降价啦

10
0
约3.46万字
约 214页
2018-06-09 发布于浙江
举报
版权申诉
保障服务

云计算分布式大数据Hdoop深入浅出案例驱动实战外训讲义.ppt

1、本文档共214页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

云计算分布式大数据Hdoop深入浅出案例驱动实战外训讲义

Struts2 + Jsp + bootstrap环境用户管理功能创建了用户管理相关的表创建新用户验证用户名和密码关注功能发布微博功能界面部分（JSP+Struts2 Actions）用户注册，登陆和注销发布微博，查看微博服务端部分表结构的设计 Hbase接口的实现 JSP和Action的实现 4、tab_follow 6、tab_post 话单入库多线程入库使用Protocol Buffer 话单查询 Ajax技术话单统计在Hbase中使用MapReduce HStore是怎样工作的? HStore MemStore StoreFile StoreFile StoreFile 向表中写入数据的过程：首先写入MemStore，同时写入HLog 但MemStore到达一定大小的时候，MemStore会flush成一个StoreFile（HFile文件）但StoreFile的数量达到一定阀值，会触发compact，将多个StoreFile合并成1个StoreFile 当单个StoreFile达到一定大小的时候，会触发split，将当前的Region拆分成2个Region，并且分发到不同的Region Server上 HStore是怎样工作的? HFile的存储格式 Data Block是HBase I/O的基本单元，每个Data块除了开头的Magic以外就是一个个KeyValue对拼接而成 KeyValue的存储格式开始是两个固定长度的数值，分别表示Key的长度和Value的长度。紧接着是Key，开始是固定长度的数值，表示RowKey的长度，紧接着是 RowKey，然后是固定长度的数值，表示Family的长度，然后是Family，接着是Qualifier，然后是两个固定长度的数值，表示Time Stamp和Key Type（Put/Delete）。Value部分没有这么复杂的结构，就是纯粹的二进制数据了。对于任意一个cell，都需要存储rowkey, column family, column qualifier Hbase系统实战 Hbase安装部署《细细品味Hadoop_Hadoop集群（第11期）_HBase简介及安装.pdf》《Ubuntu伪分布式安装Hbase-0.94.4.docx》 Hbase Shell 《Hbase shell常用命令.docx》微博介绍 Hbase实现微博接下来将要实现的功能用户管理 1、tab_global ：用户唯一id表 row param:userid row_userid 0 用户管理 2、tab_user2id：用户与id对应表 row info:id (username) (id) 3、tab_id2user：id与用户信息对应表 row info:username info:password (id) (username) (password) Reducer 对map阶段的结果进行汇总 Reducer的数目由mapred-site.xml配置文件里的项目mapred.reduce.tasks决定。缺省值为1，用户可以覆盖之 Shuffler 在mapper和reducer中间的一个步骤（可以没有）可以把mapper的输出按照某种key值重新切分和组合成n份，把key值符合某种范围的输出送到特定的reducer那里去处理可以简化reducer过程命令操作 hadoop jar /usr/local/hadoop/hadoop-examples-1.0.4.jar wordcount /app/hadoop/tmp/test.txt /app/hadoop/tmp/output WordCount的运算过程假设输入文件的内容如下： How are you Hello word, are you ok This is a test 文件被分成3个split Split1 How are you Split2 Hello word, are you ok Split3 This is a test Map的过程 Split1 How are you （How, 1) (are, 1)(you, 1) Split2 Hello word, are you ok (Hello, 1)(word,, 1)(are, 1)(you, 1)(ok, 1) Split3 This is a test (This, 1)(is, 1)(a, 1)(test, 1) Reduce的过程 (How, 1) (are, 1)(you, 1) (He