数据分析基础—R语言实现配套教材电子课件(完整版).pptx

数据分析基础—R语言实现配套教材电子课件(完整版).pptx

  1. 1、本文档共217页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
课程结构 第1章 数据分析与R语言 第2章 R语言数据处理 第3章 数据可视化分析 第4章 数据的描述分析 第5章 推断分析基本方法 第6章 相关与回归分析 第7章 时间序列分析;;学习目标 理解变量和数据的概念,掌握数据分类 了解数据来源和概率抽样方法 掌握R语言的初步使用方法 思政目标 数据分析是一门应用性学科。思政建设应强调数据分析方法在反映我国社会主义建设成就中的作用 结合实际问题学习数据分析中的基本概念。结合数据来源和渠道,学习获取数据过程中可能存在的虚假行???,强调数据来源渠道的正当性以避免虚假数据 避免收集危害社会安全的非正当来源数据; 1.1 数据分析概述;从分析目的看 可以将数据分析分为描述性分析(descriptive analysis)、探索性分析(exploratory analysis)和验证性分析(confirmatory analysis)三大类 描述性分析和是对数据进行初步的整理、展视和概括性度量,以找出数据的基本特征;探索性分析侧重于在数据之中发现新的特征,为形成某种理论或假设而对数据进行的分析;验证性分析则侧重于对已有理论或假设的证实或证伪; 数据分析方法——数据分析的分类;商业软件——不推荐使用 商业类软件种类繁多,较有代表性的软件有SAS 、SPSS、Minitab、Stata等。多数人较熟悉的Excel虽然不是统计软件,但提供了一些常用的统计函数以及数据分析工具 这类软件虽有不同的侧重点,但功能大同小异,基本上能满足大多数人做数据分析的需要。商业类软件使用相对简单,容易上手 主要问题是价格不菲,多数人难以接近,此外,更新速度慢,难以提供最新方法的解决方案;非商业软件——推荐使用 非商业类软件则不存在价格问题。目前较为流行的软件有R语言和Python语言,二者都是免费的开源平台 R语言的一种优秀的统计软件,它是一种统计计算语言。R语言不仅支持各个主要计算机系统,还有诸多优点,比如,更新速度快,可以包含最新方法的解决方案;提供丰富的数据分析和可视化技术,功能十分强大。此外,R软件中的包(package)和函数均由统计专家编写,函数中参数的设置也更符合统计和数据分析人员的思维方式和逻辑,并有强大的帮助功能和多种范例,初学者也很容易上手 Python则是一种面向对象的解释型高级编程语言,并拥有丰富而强大的开源第三方库,也具有强大的数据分析可视化功能。Python于R的侧重点略有不同,R的主要功能是??据分析和可视化,且功能强大,多数分析都可以由R提供的函数实现,不需要太多的编程,代码简单,容易上手。Python的侧重点则是编程,具有很好的普适性,但数据分析并不是其侧重点,虽然从理论上说都可以实现,但往往需要编写很长的代码,帮助功能也不够强大,这对数据分析的初学者来说可能显得麻烦,但仍然不失为一种有效的数据分析工具;数据(data) 数据是个广义的概念,任何可观测并有记录的信息都可以称为数据,它不仅仅包括数字,也包括文本、图像等。比如,一篇文章也可以看作数据,一幅照片也可以视为数据,等等 本书使用的数据概念则是狭义的,仅仅是指统计变量的观测结果。因此,要理解数据的概念,需要先清楚变量的概念变量的观测结果;数据是变量的观测结果,因此,数据的分类与变量的分类是相同的 本书混合使用变量和数据这两个概念 在讲述分析方法时多使用变量的概念,在例题分析中多使用数据的概念 了解变量或数据的分类十分必要,因为不同的变量或数据适用的分析方法是不同的; 间接来源和直接来源; R 的下载与安装; Rstudio 的下载与安装; 对象赋值与运行; 编写代码脚本; 查看帮助文件; 查看帮助文件; 包的安装与加载; 数据读取和保存; 本书结构; THANKS; 课程结构 第1章 数据分析与R语言 第2章 R语言数据处理 第3章 数据可视化分析 第4章 数据的描述分析 第5章 推断分析基本方法 第6章 相关与回归分析 第7章 时间序列分析;;学习目标 掌握R语言的数据类型及其处理方法 使用R语言进行数据抽样和筛选 掌握数据类型转换的方法 用R语言生成频数分布表 思政目标 数据处理是数据分析的前期工作。在数据处理过程中要本着实事求是的态度,避免为达到个人目的而有意加工和处理数据 数值数据分组的目的是通过数据组别对实际问题进行分类,分组的应用要反映社会正能量,避免利用不合理的分组歪曲事实;在R中分析数据或创建一个图形时,首先要有分析或绘图的数据集(data set) R处理的数据集类型包括向量(vector)、矩阵(matrix)、数组(array)、数据框(data frame)、因子(factor)、列表(list)等;矩阵 二

文档评论(0)

BLUED + 关注
实名认证
内容提供者

教师资格证持证人

全网 内容最全课件 价格最低 质量最高 不是之一,是唯一。 每个人使用的办公软件版本不一样,如有个别显示不出的文件,建议使用最新版。

版权声明书
用户编号:8070063100000015
领域认证该用户于2023年03月20日上传了教师资格证

1亿VIP精品文档

相关文档