- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1
大数据引发的变革
与企业面临的挑战
陈育杰 Eric Chen
SYSEX精诚集团 Big Data 事业 资深总监
eric_chen@ , mobile :2
个人的一些经历
在IT产业第17个年头
从程序员开始第一份工作, 逐渐转移到销售与售前、产品经理、产品与技术管理、事业发展、新事业规划与开发
主要经验都是以软件为基础,含括数据库解决方案、电子商务解决方案、中间件(Middleware)、嵌入式系统(Embedded System)、安全解决方案(Security)、云操作系统(Cloud OS)、大数据一体机(Big Data Appliance)
2006年,开始参与大数据项目计划,引进Hadoop …………..
2009年,开始参与两岸云计算云操作系统项目计划
2010年,开始参与台湾云端运算联盟,为创会会员之一
Big Data 时代来临
Structured
Database
Spreadsheet
File in record format
Semi-structured
XML Docs
Logs
Click-stream
Equipment/ Device, RFID tag
Unstructured
Web Pages
E-mail
Multimedia
Instant Messages
Documents
Big Data
People
Devices
Sensors
移动互联网
Mobile Internet
物联网
Internet of Things
3
新量级、新处理模式、新企业智能
Big Data 带来的挑战
不同“看”数据的方式
需要更高性价比的数据计算与储存方式
不同的数据管理策略
超越企业现有 IT 的数据解决能量
4
不同“看”数据的方式
5
可视:结构化资料 15%
未视:半/非结构化数据 85%
DB/DW
主管们看的
战情数位仪表板,其实是残缺的…
10万
GB
10万
TB
需要更高性价比的数据计算与储存方式
6
数据库
数据仓库
计算更快 存储更省
7
不同的数据管理策略
当我们想要扩充时,
才发觉:
架构只能 scale-up,
scale-out 不易
处理时间过长,
time-to-value 受限
成本过高,
cost-efficiency 受限
15%
结构化的 DB/DW
遗憾
残缺
每天几百 GB、 几 TB 的资料,且持续成长中
储存
Storing
在收数据的同时做必要的前置处理 (pre-processing)
,并区分数据处理的优先等级 (prioritizing)
计算
Processing
如何有效的避免因硬件毁坏所导致的资料损毁
管理
Managing
如何从中挖掘出所关注事件的 pattern 或 behavior
分析
Analyzing
超越企业现有 IT 的数据解决能量
8
9
10
并行模式简单、编成较易
为程序员屏蔽通性、并发、同步与一致性等问题
计算与存储一体,计算向数据靠拢,高效专用存储模式
任务之间无依赖(share-nothing),具有高系统延展性 (scale-out)
并行计算匡架
分布式档案存储
11
大规模分布式结构化数据存储系统
HBase – Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统
利用 HDFS作为其文件存储系统 – HDFS为HBase提供了高可靠性的底层存储支持
利用 MapReduce来处理其中的海量数据 – MapReduce为HBase提供了高性能的计算能力
12
企业如何运用Hadoop
13
企业运用数据的流程
r
14
Distributed
Search
r
15
Distributed
Search
企业并不像互联网公司,
如何掌握这么多技术 ?
企业采用 Hadoop 架构的挑战
16
企业对 Hadoop 架构普遍陌生,
尚未建立 MapReduce 程序设计能力
对资料分析师、商业使用者不够直觉,难亲近
Hadoop 丛集规划、布署、管理与系统调校的技术门坎高。
商业顾问
专业服务
技术供给
?
缺乏在地、专业、有实务经验的 Hadoop 顾问服务厂商
先期咨询、需求分析、项目验证、与教育训练等服务来源欠缺。
缺乏能够提供完整 Big Data 解决方案设计、导入、与维护的专业厂商。
缺乏商业案例研讨
企业不知如何挖掘Big Data价值
缺乏成熟的导引步骤来降低企业导入风险 提高成功机率
精诚集团 Big Data 事业
17
商业顾问
专业服务
解决方案
面向企业Big Data需求的一站式服务
Big Data 应用程序
Big Data
您可能关注的文档
最近下载
- GBT45001-2020SO45001:2018 职业健康安全管理体系要求及使用指南.pdf VIP
- 个人业绩相关信息采集表含政治表现、最满意、主要特点、不足.pdf VIP
- 部编版六年级上册道德与法治教案:感受生活中的法律知识.docx VIP
- 货运保险与货损理赔通道整合2025年应用前景.docx VIP
- 《飞机构造基础》课件——第一章 飞机结构.pptx VIP
- 中医治疗“慢脾风”医案37例.doc
- 小学科学新教科版二年级上册第一单元 造房子教案(共6课)(2025秋).docx VIP
- 2025年广西公需科目第二套答案.docx VIP
- 设备供货配送方案.docx VIP
- 现代农业发展情况课件.ppt VIP
文档评论(0)