阿里巴巴离线大数据处理平台概述.pdf

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
阿里巴巴离线大数据处理平台概述阿里巴巴离线大数据处理平台概述 汤子楠 个人介绍个人介绍 汤子楠 数据平台事数据平台事业部部 ,,产品产品经理理 – 2007~2010 • 移动互联网移动互联网 ,触屏交互触屏交互 – 今至今 • 云计算,大数据 2 提纲提纲 大数据时代 阿里巴巴数据事业部 离线大数据处理平台离线大数据处理平台(ODPS)(ODPS) 我们面临的主要问题我们面临的主要问题 ODPSODPS部分功能概览部分功能概览 结语结语 大数据时代大数据时代 4 大数据时代的挑战大数据时代的挑战 • 社交网络、用户行为、购买关系 数据关联性 • 企业内外IT系统的整合 • 数据规模爆炸式增长 • 结构化与非结构化数据并存结构化与非结构化数据并存、噪声增多噪声增多 处理能力 • 组合离线、在线、流式等多项计算能力提供解决方案 • 在大数据上应用传统统计学和数据挖掘算法 • 用户隐私保护、商业数据泄漏、复杂的访问控制需求 数据安全 • 企业发展的达摩克利斯之剑企业发展的达摩克利斯之剑 • 如何利用大数据盈利 商业模式商业模式 • 数据驱动的新业务模式与企业传统业务模式的冲突 5 阿里巴巴的大数据产品探索阿里巴巴的大数据产品探索 淘宝贷款淘宝贷款 • 解决小微企业贷款难的问题: – 金额高 – 流程长 – 授信难 – 周期长周期长 • 完全以数据驱动的产品 •• 对既有数据进行二次挖掘对既有数据进行二次挖掘 • 颠覆原有业务模式 •• 规模优势规模优势 7 阿里巴巴大数据事业部阿里巴巴大数据事业部 离线存储 在线存储 实时计算 流式计算 与计算 与计算 任务调度 数据开发与数据 数据同步数据同步 数据质量监控数据质量监控 与管与管理 可视化视化界面 服务化务化 元数据管理

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档