数据科学并行计算白琰冰电子版.docxVIP

  • 14
  • 0
  • 约小于1千字
  • 约 2页
  • 2023-09-22 发布于北京
  • 举报
数据科学并行计算白琰冰电子版 本书致力于构建系统完整的基于并行计算技术的大数据处理方法及应用为特色的本科教育教学教材,适合所有具有基本计算机基础知识、R语言和Python语言编程基础的数据科学、统计学、人工智能等相关领域本科生及以上层次人员学习使用。本书通俗易懂地讲解大数据科学的基本概念、方法和原理,系统的介绍基于典型大数据场景的并行计算解决思路,同时涵盖丰富的常用并行计算工具的操作实践,使读者知其然更知其所以然。 在章节安排上,本书主要分为三个部分。第1、2章为第一部分,主要介绍大数据科学与并行计算基本知识,让学生在不具备深厚计算机理论基础的情况下,迅速地构建进行大数据并行计算所必需的计算机知识;第3章至第5章为第二部分,主要介绍如何使用R语言进行并行计算,使学生掌握利用已有计算资源轻松地处理中等规模的大数据;第6章至第9章为第三部分,主要介绍如何使用Python语言进行并行计算,重点关注如何使用性能更强大的云计算资源或者大型的集群设备来对更大规模的数据高效处理。 本书的特色在于:注重对于大数据科学方法核心应用的讲解,突出以利用并行计算思维解决大数据场景问题的案例实践教学;基于典型大数据场景案例数据集,循序渐进地引导读者利用Parallel、Sparklyr、Dask和Pyspark等主流并行计算工具实现数据的清洗、转换、描述和建模分析;帮助读者系统全面的构建大数据科学的基本知识体系,领会大数据分析并行计算方法的精髓,层次逻辑清晰的介绍不同编程语言和并行计算工具针对不同规模大数据集的优缺点,使读者拥有利用并行计算工具解决实际大数据分析问题的能力。

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档