《统计学—基于R》(第5版) 课件 第1章 数据与R语言(R5).pptx

《统计学—基于R》(第5版) 课件 第1章 数据与R语言(R5).pptx

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;数据与统计学;数据与统计学;数据与统计学;数据(data) 数据是个广义的概念,任何可观测并有记录的信息都可以称为数据,它不仅仅包括数字,也包括文本、图像等。比如,一篇文章也可以看作数据,一幅照片也可以视为数据,等等 本书使用的数据概念则是狭义的,仅仅是指统计变量的观测结果。因此,要理解数据的概念,需要先清楚变量的概念变量的观测结果;数据和变量分类 数据是变量的观测结果,因此,数据的分类与变量的分类是相同的 本书混合使用变量和数据这两个概念 在讲述分析方法时多使用变量的概念,在例题分析中多使用数据的概念 了解变量或数据的分类十分必要,因为不同的变量或数据适用的分析方法是不同的;间接来源 一是来源于直接的调查和实验,称为直接来源;二是来源于别人调查或实验的数据,称为间接来源 使用别人调查或实验的数据,对使用者来说就是二手数据,这就是数据的间接来源 二手数据主要是公开出版或公开报道的数据,这类数据主要来自各研究机构、国家和地方的统计部门、其他管理部门、专业的调查机构以及广泛分布在各种报纸、杂志、图书、广播、电视传媒中的各种数据等、在网络上获取所需的各种数据 使用二手数据要注意数据的含义、计算口径和计算方法,以避免误用或滥用。同时,在引用二手数据时,一定要注明数据的来源,以示尊重他人的劳动成果;直接来源 通过实地调查、互联网调查或实验取得 统计部门调查取得的数据 其他部门或机构为特定目的调查的数据 利用互联网收集的各类产品交易、生产和经营活动等产生的大数据 实验是取得自然科学数据的主要手段;简单随机抽样 从总体N个元素中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中 抽取元素的具体方法有放回抽样和无放回抽样 分层抽样 将总体单位按某种特征或规则划分为不同层,再从不同的层中随机地抽取样本 系统抽样 将总体中的所有单位(抽样单位)按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本元素 整群抽样 将总体中若干个单位合并为组(??),抽样时直接抽取群,再对中选群中的所有单位全部实施调查;?;Rstudio 软件下载与安装 在安装完R后,可以进入RStudio的官方网/products/rstudio/download/,点击Free下的Download,根据自己的计算机系统选择适合的版本用户可以根据自己的平台选择相应的版本;在提示符“>”后写命令 R软件的所有分析和绘图均由R命令实现 使用者需要在提示符“”后输入命令代码,每次可以输入一条命令,也可以连续输入多条命令,命令之间用分号“ ;”隔开 命令输入完成后,按“Enter”键,R软件就会运行该命令并输出相应的结果。比如,在提示符“”后输入2+3,按“Enter”键后显示结果为5。如果要输入的数据较多,超过一行,可以在适当的地方按“Enter”键,在下一行继续输入,R软件会在断行的地方用“+”表示连接;R 对象(object) R对象可以是一个数据集、模型、图形等任何东西 是使用者所赋予的名称 R语言的标准赋值符号是“-”,也允许使用“=”进行赋值 使用者可以给对象赋一个值、一个向量、一个矩阵或一个数据框等;编写代码脚本 在R控制台中单击“文件”?新建程序脚本命令,会弹出R编辑器,在其中编写代码即可 编写完成后,选中输入的代码,并单击鼠标右键,选择“运行当前行或所选代码”,即可在R中运行该代码并得到相应结果;查看帮助文件 R软件的所有计算和绘图均可由R函数完成,这些函数通常来自不同的R包,每个R包和函数都有相应的帮助说明 使用中遇到疑问时,可以随时查看帮助文件。比如,要想了解sum函数和stats包的功能及使用方法,可使用help(函数名)或“?函数名”查询 直接输入函数名,可以看到该函数的源代码 ;R软件中的包(package) 包含数据集、R函数等信息的集合。一个R包中可能包含多个函数,能做多种分析和绘图,对于同一问题的分析或绘图,也可以使用不同包中的函数来实现,用户可以根据个人需要和偏好选择所用的包 在最初安装R软件时,自带了一系列默认包,如base,datasets,utils,grDevices,graphics,stats,methods等,它们提供了种类繁多的默认函数和数据集,分析时可直接使用这些包中的函数而不必加载这些包。其他包则需要事先安装并加载后才能使用 使用library()或.packages(all.available=TRUE)函数,可以显示R软件中已经安装了哪些包,并列出这些包的名称。 在使用R软件时,可根据需要随时在线安装所需的包。对于放置在CRAN平台上的包,输入install.packages(包名称)命令,选择相应的镜像站点即可自动完成包的下载和安装 完成安装后,要使用该

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档