- 4
- 0
- 约1.51万字
- 约 93页
- 2017-08-10 发布于河南
- 举报
02 Google云技术分析 V1.0_From WJJ.ppt
* BigTable中的表设计 统计数据表 行键:网站URL(倒排) 列键:点击次数(如记录最近一个月每日的访问次数等)、页面关注度(如记录网站页面的访问比率)、来源网站(如记录TOP10)、目标网站(如记录TOP10)… 每个列中记录的内容是字符串,Analytics在查询后需要解析字符串获得统计结果 可根据统计内容的增多增加新的列 目前尺寸约20TB 业务流程分析 数据采集 原始点击数据表 数据处理 统计数据表 数据查询 MapReduce 基础设施 应用服务器集群 BigTable集群1 BigTable集群2 GFS集群 Chubby集群 MapReduce集群 数据采集 数据来源 页面内嵌脚本 点击行为脚本 应用服务器获取到数据后,存入BigTable 数据采集 数据存储流程 向BigTable中写入点击信息 寻找子表服务器 向内存临时子表写入信息(含排序) 如超过阈值则存储为子表文件 GFS:存储子表文件 子表合并、压缩 数据处理 例如,统计网站(如)过去一周网页访问比例 数据处理流程 数据查询 MapReduce操作 数据存储 点击数据表 统计数据表 GFS 数据处理:MapReduce Map操作 假设过去一周查询结果文件在GFS中包含M个Chunk,那么Master寻找M个空闲的Worker,分别处理这M个Chunk,得到每个网站中页面的访问次
您可能关注的文档
- %91融管理论文-全球金融危机及预警模型.pdf
- %99学——英语作为外语的人本主义教学法.pdf
- %AF不对称下委托代理契约纳什实施性研究.pdf
- ๑toffee apple๑.ppt
- (CNG)加气站工艺流程等相关情况简介.doc
- (讨论稿)小区联网型彩色可视对讲系统工程招标文件.doc
- 0.0.Google的R样式建议规范.doc
- 0.2级交直流电压电流表检定装置计量标准技术报告.doc
- 0.管理大视界--《创新思维》 课程讲义20150309.pdf
- 001方小丹,魏琏,关于建筑结构抗震设计若干问题的讨论.pdf
- 1+X软件开发实操考核真题及参考答案.docx
- 贵州省县中新学校计划项目高一上学期期中物理试卷(解析版).docx
- 2025年海南省海口市五校中考一模历史试题.docx
- 贵州省黔东南苗族侗族自治州2024-2025学年高一上学期1月期末英语试题.pdf
- 贵州省贵阳市修文县外研版(三起)五年级上册期末质量检测英语试卷(解析版).docx
- 2025届贵州省贵阳市第一中学高三一模考试语文试题.pdf
- 贵州省毕节市威宁彝族回族苗族自治县高一上学期期末考试政治试卷(原卷版).docx
- 贵州省毕节市威宁彝族回族苗族自治县高一上学期期末考试政治试卷(解析版).docx
- 贵州省六盘水市钟山区九年级上学期期末检测数学试题(解析版).docx
- 2026年中国皮鞋剥离试验机市场调查研究报告.docx
原创力文档

文档评论(0)