Spark大数据技术与应用案例教程主讲教师:
目录项目一Spark入门项目二SparkRDD——弹性分布式数据集项目三SparkSQL——结构化数据处理项目四SparkStreaming——实时计算框架
目录项目五SparkMLlib——机器学习库项目六GraphFrames——图计算框架项目七综合案例——分析银行个人信贷 业务数据
项目五SparkMLlib——机器学习库
任务一加载鸢尾花数据任务二提取鸢尾花的特征任务三使用聚类算法处理鸢尾花数据任务四使用分类算法处理鸢尾花数据
第6页在大数据时代,仅依靠人工处理庞杂的数据已无法满足需求,因此促进了机器学习的迅速发展。Spark提供了强大的机器学习库MLlib,用户使用它可以实现大数据与机器学习的无缝对接。本项目结合分析鸢尾花数据案例,介绍SparkMLlib的组成、基本数据类型、运行流程、特征化工具(如特征提取、特征转换、特征选择等)、聚类算法和分类算法。
第7页了解SparkMLlib的组成。熟悉SparkMLlib的基本数据类型。理解SparkMLlib的运行流程。
第8页能使用SparkMLlib的特征提取、特征转换和特征选择等特征化工具处理数据。能使用SparkMLlib的聚类算法处理数据。能
您可能关注的文档
- windows 10案例教程 项目四 配置与管理用户账户.pptx
- windows 10案例教程 项目五 管理文件和文件夹.pptx
- windows 10案例教程 项目一 初识Windows 10.pptx
- 《大学语文》第八章 事务文书.pptx
- 《大学语文》第二章 立志敬业.pptx
- 《大学语文》第九章 公务文书.pptx
- 《大学语文》第七章 日常应用文.pptx
- 《大学语文》第三章 敦品励行.pptx
- 《大学语文》第十章 经济文书.pptx
- 《大学语文》第四章 人文情怀.pptx
- 2025年邢台市语文五年级试卷及答案.docx
- 2026年统编版八年级下册道德与法治期中(第1-3单元)复习课件.pptx
- 2026年统编版八年级下册道德与法治期末复习课件.pptx
- 《“一张图”建设工作问答》(自然资办函〔2026〕563号)解读PPT.pdf
- 《关于开展2026年度中央财政支持实施城市更新行动的通知》解读ppt.pdf
- 《国务院办公厅关于深化投资审批制度改革的意见》解读PPT.pdf
- 《关于更高水平更高质量做好节能降碳工作的意见》解读PPT.pdf
- 环境影响评价报告公示:某停车场建设项目.pdf
- 百灵达MDX2000使用说明书.pdf
- 环境影响评价报告公示:宁波鸿博森机械800万套轴承及700万只轮芯及250万只电梯配件生产项目.pdf
最近下载
- 城市老旧小区加装电梯项目可行性研究报告(2025年).docx
- 风电运维项目管理办法(试行).pdf VIP
- 超重肥胖儿童基层管理专家共识.pptx VIP
- 农民数字素养与乡村数字治理参与研究.docx VIP
- 最便捷DC_DC二次电源测试方案.pdf VIP
- 16G362 钢筋混凝土结构预埋件.docx VIP
- 钳工基础知识培训内容课件.pptx VIP
- 第九版方剂学方歌(全)参考范本.docx VIP
- 2025年甜菜碱盐酸盐的制备方法.docx
- AAMA 611-2020 Voluntary Specification for Anodized Architectural Aluminum阳极氧化铝合金建筑型材规范.PDF VIP
原创力文档

文档评论(0)