- 1、本文档共26页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
068 百度陈尚义---百度大数据引擎
百度大数据引擎
2014.8.20
百度大数据引擎
2014.8.20
目录
一、百度技术概览
二、百度大数据实践
三、百度大数据引擎
四、大数据引擎助力产业升级
3 3
全球最大的中文搜索引擎,最大的中文网站
百度每天响应来自 138个国家和地区的 70亿次
搜索请求,平均每个中国网民每天使用10次百度。
百度的大数据特征
容量 时效性 多样性
Volume Velocity Variety
• 数据总量EB级 • 毫秒-秒级响应时间 • 内容:网页、广告、
• 每日新增800TB • 极速搜索最快0.04秒 日志、UGC
• 网页量5000亿 • 类型:文本、图片、
• 单集群数万台服务器 视频
• 形式:结构化、半结
构化、非结构化
5
突破关键技术,构建完整、自主创新的大数据架构
大数据挖掘、分析、可视化
知识图谱 搜索指数 舆情监测 行业报告 趋势预测
数据仓库 深度学习
世界一流、超大规模 “百度大脑” 百度研究院
大规模软件基础设施
云计算中心调度 千PB海量数据处理 自动化智能运维
数据中心与服务器
亚洲一流数据中心 自主设计建设 数十万台自研服务器
6
基础设施自主设计
ARM服务器 GPU服务器 自研万兆交换机 整机柜服务器 百度IDC
•全球首个 •单GPU计算 •业内最大规 •国内首次规 •三大自建数
ARM架构服 能力可比百 模部署自研 模部署 据中心
务器规模化 片CPU 万兆交换机 •高效部署, •软硬件一体
应用 • GPU实 深 •接入成本下 提高交付效 化设计
•存储密度提 度神经网络
您可能关注的文档
- 02.《电力建设施工及验收技术规范》锅炉篇.pdf
- 2 鼓风式机械通风冷却塔数值模拟分析及优化.pdf
- 2×600mw机组锅炉安装指导说明书.pdf
- 3+mm圆锥喇叭聚焦天线的理论与仿真.pdf
- 04fj03防空地下室通风口部建筑设计_.pdf
- 4几种典型弹道.pdf
- 4人消费及其与后勤生活服务质量的关系.pdf
- 05、08-11年发输变电专业考试专业知识和专业案例真题.pdf
- 05.百度产品运营的职位要求及对应能力解析.pdf
- 05输变电工程项目建设实施考核办法.pdf
- 注册验船师高频真题题库2025.docx
- 注册验船师高频题库带解析2025.docx
- 注册验船师考试必备资料2025.docx
- 注册验船师精选题库带分析2025.docx
- 注册验船师考前冲刺必刷题附答案2025.docx
- 新高考生物二轮复习讲练测第10讲 人体的稳态与免疫调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第13讲 生物技术与工程(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第9讲 神经调节与体液调节(讲练)(原卷版).docx
- 新高考生物二轮复习讲练测第7讲 遗传的基本规律与伴性遗传(检测)(原卷版) .docx
- 新高考生物二轮复习讲练测第13讲 生物技术与工程(检测)(原卷版).docx
文档评论(0)