- 14
- 0
- 约小于1千字
- 约 2页
- 2023-09-22 发布于北京
- 举报
数据科学并行计算白琰冰电子版
本书致力于构建系统完整的基于并行计算技术的大数据处理方法及应用为特色的本科教育教学教材,适合所有具有基本计算机基础知识、R语言和Python语言编程基础的数据科学、统计学、人工智能等相关领域本科生及以上层次人员学习使用。本书通俗易懂地讲解大数据科学的基本概念、方法和原理,系统的介绍基于典型大数据场景的并行计算解决思路,同时涵盖丰富的常用并行计算工具的操作实践,使读者知其然更知其所以然。
在章节安排上,本书主要分为三个部分。第1、2章为第一部分,主要介绍大数据科学与并行计算基本知识,让学生在不具备深厚计算机理论基础的情况下,迅速地构建进行大数据并行计算所必需的计算机知识;第3章至第5章为第二部分,主要介绍如何使用R语言进行并行计算,使学生掌握利用已有计算资源轻松地处理中等规模的大数据;第6章至第9章为第三部分,主要介绍如何使用Python语言进行并行计算,重点关注如何使用性能更强大的云计算资源或者大型的集群设备来对更大规模的数据高效处理。
本书的特色在于:注重对于大数据科学方法核心应用的讲解,突出以利用并行计算思维解决大数据场景问题的案例实践教学;基于典型大数据场景案例数据集,循序渐进地引导读者利用Parallel、Sparklyr、Dask和Pyspark等主流并行计算工具实现数据的清洗、转换、描述和建模分析;帮助读者系统全面的构建大数据科学的基本知识体系,领会大数据分析并行计算方法的精髓,层次逻辑清晰的介绍不同编程语言和并行计算工具针对不同规模大数据集的优缺点,使读者拥有利用并行计算工具解决实际大数据分析问题的能力。
您可能关注的文档
- 教师读书演讲稿:《魏书生班主任工作漫谈》读后感.docx
- 教师队伍建设存在问题及整改措施.docx
- 敦煌莫高窟-简介PPT.ppt
- 教资综合素质艺术常识.doc
- 敬闪闪五星红旗,表拳拳爱国情意.docx
- 散文朗诵《绝不向一个提裤子的人开枪》.docx
- 教师教学情况问卷调查表三篇.doc
- 数独兴趣小组活动计划.doc
- 教师节班主任代表发言稿.doc
- 数独兴趣小组活动教案.docx
- 山西天一大联考2025-2026学年高二上学期期末学情监测语文试题(试卷+解析).docx
- 山西忻州部分学校2025-2026学年高一上学期2月质量检测数学试题(人教B版)(试卷+解析).docx
- 山西运城市2025-2026学年高二第一学期期末调研测试数学试题(试卷+解析).docx
- 陕西省榆林市榆阳区2025-2026学年八年级上学期期末地理试题(试卷+解析).docx
- 陕西西安市碑林区2025-2026学年度第一学期期末八年级生物试题(试卷+解析).docx
- 四川省广元市苍溪县2025-2026年八年级上学期期末道德与法治试题(试卷+解析).docx
- 江苏泰州市姜堰区2025-2026学年七年级上学期1月期末数学试题(试卷+解析).docx
- 江苏省扬州市邗江区2025-2026学年九年级上学期期末考试化学试题(试卷+解析).docx
- 江西上饶市铅山县2025-2026学年第一学期期末考试八年级数学试题(试卷+解析).docx
- 江苏扬州市高邮市2025-2026学年度第一学期期末学业质量监测试题九年级英语(试卷+解析).docx
原创力文档

文档评论(0)