- 1、本文档共28页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
随机机器学习算法_金榕
随机机器学习算法
——让大数据上的不可能变为可能
金榕金榕
阿里巴巴集团
大数据的挑战大数据的挑战
处理大量数据
数据量存量巨大
2012年,已存在 2.7 ZB 数据
2020年,将达到 40 ZB 数据
————数据来自数据来自 《《ComputerWorldComputerWorld》》
数据量快速
例如例如 :网络络用户户每每分钟钟都产生大都产生大量数据数据
YouTube用户上传超过300小时 新视频
SnapChatSnapChat用户传递用户传递 284284,722722篇信息篇信息
Facebook 用户共享4,166,667篇内容
/story/how-much-
data-created-internet-every-minute/2015-08-
14
2015.10.24 CNCC 合肥 2
大数据的挑战大数据的挑战
高维数据高维数据
例如:在图像分类和在线广告任务中,经常使用上百万维的特征
2015.10.24 CNCC 合肥 3
数据规模的重要性数据规模的重要性
是否有必要在如此大规模的时间上进行学习?是否有必要在如此大规模的时间上进行学习?
Yes
矩阵补全矩阵补全 (M(MattirixCComplletition))
广泛应用在分类、聚类、推荐系统等任务中
性能度量:恢复误差 recovery error
2015.10.24 CNCC 合肥 4
数据数据规模的重要性规模的重要性 (2)(2)
: PERFECT 完美恢复
观测到的
矩阵元素数量矩阵元素数量 : POOOOR 低质低质量恢复恢复
差
误
复复 未未
恢 知
矩阵元素数量
2015.10.24 CNCC 合肥 5
大大数据数据带来带来的困难的困难
考虑一个简单但非常基础的任务考虑一个简单但非常基础的任务 ———— 矩阵平均矩阵平均
矩阵矩阵 结果
规模: 1B x1M + + … + 规模: 1B x1M
特性: 稀疏 特性: 稀疏
2015.10.24 CNCC
您可能关注的文档
最近下载
- 检验科职业安全防护和职业暴露紧急处理.pptx
- 加油站安全风险分级管控清单.docx VIP
- T∕CBMF 37-2018 T∕CCPA 7-2018- 超高性能混凝土基本性能与试验方法.pdf
- 公开课----议论文阅读——论证思路省公开课获奖课件市赛课比赛一等奖课件.pptx
- 2024新苏教版一年级数学上册全一册全部教案(共21课时).pdf VIP
- 《我和小姐姐克拉拉》乐读分享ppt课件[文字可编辑].ppt
- 工程经济学第3版教学课件第二章 资金时间价值与现金流量.pdf
- 数据透视表教程-教学课件.pptx
- 日立GVF2、NPH系列FMT板、A板使用说明(2).pdf VIP
- 传染病预防控制必修和选修答案-2024年全国疾控系统“大学习”活动.docx VIP
文档评论(0)