R语言:数据集的创建.ppt

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
R语言:数据集的创建 1.范式的起源 “范式”的概念和理论是美国著名科学哲学家托马斯·库恩(Thomas,Kuhn) 提出并在《科学革命的结构》(The Structure of Scientific Revolutions)(1962)中进行系统阐述并发展而来的。在库恩看来,范式也指一种对本体论、认识论和方法论的基本承诺,是科学家集团所共同接受的一组假说、理论、准则和方法的总和,这些东西在心理上形成科学家的共同信念。库恩说,范式也指那些公认的科学成就,它们在一段时间里为实践共同体提供典型的问题和解答”,这些成就一般具备两个基本特征,“一是它们空前地吸引一批坚定的拥护者,使他们脱离科学活动的其他竞争模式;同时,这些成就又足以无限制地为重新组成的一批实践者留下有待解决的问题。 1、从存储角度划分对象 R的数据对象可以划分为数值型、字符串型和逻辑型等主要存储类型。 (1)数值型 数值型(numeric)是计算机存储诸如年龄、身高和体重等数字形式数据的类型。具体表现形式,如25、1.76以及1.67E2等。 (2)字符串型 字符串型(character)是计算机存储诸如姓名、地名等字符形式数据的类型。具体表现形式,如”Li Ming”、“Hubei”等。 (3) 逻辑型 逻辑型(logistic)是计算机存储诸如是否同意、是否真假等是非判断形式的数据类型。逻辑型数据只有真(是)、假(非)两个取值,具体形式为大写的英语单词TRUE和FALSE。他们之间的关系是TRUE等于!FALSE,FALSE等于!TRUE。其中,符号“!”表示反向操作。 一、R的数据对象 (二)从数据结构角度划分 1、向量 向量(vector)是用于存储数值型、字符型或逻辑型数据的一维数组。它是R数据组织的基本单位,用于组织多个数据。由于统计分析的基本单位是变量,变量具有多个变量值。因此,一个向量也可以视为一个变量,是多个具有相同存储类型的数据的集合。若无特殊说明,向量均为列向量。 2、向量的赋值 (1)标向量 只含有一个元素的向量成为标量,创建标量的赋值语句的基本书写格式为: 对象名<-R常量 (2)操作实例: > V1<-27 > V1 V2<-"abcd"#字符串型向量要添加双引号。 > V2 > V3<-FALSE > V3 (3)向量类型的判断 “is.类型名”函数可用于判断数据对象是否为向量,基本书写格式为: is.vector(数据对象名称) is.numeric(数据对象名称)、is.character(数据对象名称)和is.logistic(数据对象名称)函数可用于判断对应的向量是否依次为数值型向量、字符串型向量或逻辑型向量。结果以TRUE 或FALSE的形式出现。 操作实例: > is.vector(V1) > is.character(V2) 3、多元素向量对象的赋值, 赋值语句的基本书写格式为: 对象名<-R函数 赋值操作符的左侧为R函数,其具体形式视具体情况而定。其中,常用的R函数是c函数,基本书写格式为: c(常量或向量名列表) 其中,各常量或向量名之间需用逗号隔开。 实例操作: V1<-c(1,3,5,7,9,-2,-4,-6,-8,-0.1,0.5) V2<-c(“red”,“black”,“green”) V3<-c(TRUE, FALSE, TRUE, TRUE, FALSE) 向量中所处元素位置查找的基本书写格式: 变量名称[c(a,b)]#用于查找向量中的第a个和第b个元素。 变量名称[c(a:b)]#用于查找向量中的第a至b个元素。 实例操作: > V1[c(4,6)] 用于查找V1变量中的第4个和第6个元素。 > V3[c(2:4)] 2、矩阵 矩阵(matrix)用于组织多个具有相同存储类型(数值型、字符型或逻辑型)的变量,是二维表格形式。通常情况下,矩阵的列为变量,行为观测。 (1)矩阵的创建 可以通过is.matrix函数判断数据对象是否为矩阵,基本书写格式为: is.matrix(数据对象名称) 若指定对象为矩阵,则结果为逻辑型常量TRUE或者FALSE。 (1)矩

文档评论(0)

gl5000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档