数据分析基础——Python实现教学课件1.pptxVIP

  • 31
  • 0
  • 约1.74千字
  • 约 27页
  • 2022-06-13 发布于广东
  • 举报

数据分析基础——Python实现教学课件1.pptx

课程结构 第1章 数据分析与Python语言 第2章 Python数据处理 第3章 数据可视化分析 第4章 数据的描述分析 第5章 推断分析基本方法 第6章 相关与回归分析 第7章 时间序列分析;;学习目标 理解变量和数据的概念,掌握数据分类 了解数据来源和概率抽样方法 掌握Python语言的初步使用方法 思政目标 数据分析是一门应用性学科。思政建设应强调数据分析方法在反映我国社会主义建设成就中的作用 结合实际问题学习数据分析中的基本概念。结合数据来源和渠道,学习获取数据过程中可能存在的虚假行为,强调数据来源渠道的正当性以避免虚假数据 避免收集危害社会安全的非正当来源数据; 1.1 数据分析概述;从分析目的看 可以将数据分析分为描述性分析(descriptive analysis)、探索性分析(exploratory analysis)和验证性分析(confirmatory analysis)三大类 描述性分析和是对数据进行初步的整理、展视和概括性度量,以找出数据的基本特征;探索性分析侧重于在数据之中发现新的特征,为形成某种理论或假设而对数据进行的分析;验证性分析则侧重于对已有理论或假设的证实或证伪; 数据分析方法——数据分析的分类;商业软件——不推荐使用 商业类软件种类繁多,较有代表性的软件有SAS 、SPSS、Minitab、Stata等。多数人较熟悉的Excel虽然不是统计软件,但提供了一些常用的统计函数以及数据分析工具 这类软件虽有不同的侧重点,但功能大同小异,基本上能满足大多数人做数据分析的需要。商业类软件使用相对简单,容易上手 主要问题是价格不菲,多数人难以接近,此外,更新速度慢,难以提供最新方法的解决方案;非商业软件——推荐使用 非商业类软件则不存在价格问题。目前较为流行的软件有R语言和Python语言,二者都是免费的开源平台 R语言的一种优秀的统计软件,它是一种统计计算语言。R语言不仅支持各个主要计算机系统,还有诸多优点,比如,更新速度快,可以包含最新方法的解决方案;提供丰富的数据分析和可视化技术,功能十分强大。此外,R软件中的包(package)和函数均由统计专家编写,函数中参数的设置也更符合统计和数据分析人员的思维方式和逻辑,并有强大的帮助功能和多种范例,初学者也很容易上手 Python则是一种面向对象的解释型高级编程语言,并拥有丰富而强大的开源第三方库,也具有强大的数据分析可视化功能。Python于R的侧重点略有不同,R的主要功能是数据分析和可视化,且功能强大,多数分析都可以由R提供的函数实现,不需要太多的编程,代码简单,容易上手。Python的侧重点则是编程,具有很好的普适性,但数据分析并不是其侧重点,虽然从理论上说都可以实现,但往往需要编写很长的代码,帮助功能也不够强大,这对数据分析的初学者来说可能显得麻烦,但仍然不失为一种有效的数据分析工具;数据(data) 数据是个广义的概念,任何可观测并有记录的信息都可以称为数据,它不仅仅包括数字,也包括文本、图像等。比如,一篇文章也可以看作数据,一幅照片也可以视为数据,等等 本书使用的数据概念则是狭义的,仅仅是指统计变量的观测结果。因此,要理解数据的概念,需要先清楚变量的概念变量的观测结果;数据是变量的观测结果,因此,数据的分类与变量的分类是相同的 本书混合使用变量和数据这两个概念 在讲述分析方法时多使用变量的概念,在例题分析中多使用数据的概念 了解变量或数据的分类十分必要,因为不同的变量或数据适用的分析方法是不同的; 间接来源和直接来源; Python 的下载与安装; Anaconda 的下载与安装; Anaconda 界面; Anaconda ——创建Jupyter Notebook文件; Anaconda ——保存Jupyter Notebook文件; Anaconda ——Spyder界面; 模块的安装与加载; 模块的安装与加载; 模块的安装与加载; 查看帮助文件; 编写代码脚本; 编写代码脚本; 文件读取和保存; 文件读取和保存; 本书结构; THANKS

文档评论(0)

1亿VIP精品文档

相关文档