- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
工程大数据分析
汽车传感器数据应用
马文辉
© 2015 The MathWorks, Inc.
1
内容
▪ 大数据及其带来的挑战
▪ MATLAB大数据处理
➢ tall数组
➢ 并行与分布式计算
▪ MATLAB与Spark/Hadoop集成
➢ MATLAB访问HDFS(Hadoop分布式文件系统)
➢ 在Spark/Hadoop集群上运行MATLAB代码
▪ 应用演示– 汽车传感器数据分析
2
大数据概述
大数据的”4V”特征:
▪ Volumes - 数据规模,数据规模巨大
互联网、社交网络的普及,全社会的数字化转型,数据规模向PB级发展
▪ Variety - 数据种类 ,数据种类繁多
结构化数据,半结构化数据,非结构化数据
▪ Value - 数据价值,数据价值密度低
价值密度的高低与数据总量的大小成反比
▪ Velocity - 数据处理速度,数据处理速度需要快速
数据处理速度是决定大数据应用的关键
3
大数据带来的挑战
▪ 传统的工具和方法不能有效工作
– 访问和处理数据变得困难;
– 需要学习使用新的工具和新的编程方式;
– 不得不重写算法以应对数据规模的增大;
▪ 现有处理或计算方法下的结果质量受到影响
– 被迫只能处理一部分数据(数据子集);
– 采用新的工具或重写算法会对现有生产力产生影响;
▪ 数据处理与分析所需时间增长
– 数据规模增大、数据复杂度增加,增加处理难度和所需时间;
4
MATLAB的大数据处理
▪ 内存与数据访问
▪ 64-bit processors ▪ 编程
▪ Memory Mapped Variables ▪ Streaming
▪ Disk Variables ▪ Block Processing
▪ Databases ▪ 计算
▪ Parallel-for loops
▪ Datastore ▪ Desktop (Multicore, GPU)
▪ GPU Arrays
▪ ImageDatastore ▪ Clusters
▪ SPMD and Distributed
Arrays ▪ Cloud Computing (MDCS
on EC2)
▪ MapReduce
您可能关注的文档
最近下载
- T∕TRSC 005-2024 黑参 团体标准.pdf VIP
- 机械加工工艺基础知识全集!.doc VIP
- 综合养老服务中心建设项目可行性研究报告.docx
- DB23_T3335—2022_黑龙江省超低能耗公共建筑节能设计标准_黑龙江省.pdf VIP
- 2025年行政执法证考试必考题库及答案.docx
- 模块二通用型带式输送机港口输送机械与集装箱机械课件.ppt
- 井下无线电磁波短距离传输技术发展及的研究.doc VIP
- 风电工程概算编制及投资控制提纲(风电).pdf VIP
- 疾病预防秋冬预防感冒(课件)小学生主题班会通用版.pptx VIP
- 《园林植物栽培与养护(第5版)》高职全套教学课件.pptx
原创力文档


文档评论(0)