R软件与统计分析.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
R软件与统计分析

统计模型简介 这一节我们简单介绍S的统计模型。S中实现了几乎所有常见的统计模型,而且多种模型可以用一种统一的观点表示和处理。这方面S-PLUS较全面,它实现了许多最新的统计研究成果,R因为是自愿无偿工作所以统计模型部分还相对较欠缺。事实上,许多统计学家的研究出的统计算法都以S-PLUS程序发表,因为S语言是一种特别有利于统计计算编程的语言。 学习这一节需要我们具备线型模型、线型回归、方差分析的基本知识。 第9章 一元线性回归 §9.1 变量间关系的度量 §9.2 一元线性回归 §9.3 利用回归方程进行估计和预测 §9.4 残差分析 函数关系 是一一对应的确定关系 设有两个变量 x 和 y ,变量 y 随变量 x 一起变化,并完全依赖于 x ,当变量 x 取某个数值时, y 依确定的关系取相应的值,则称 y 是 x 的函数,记为 y = f (x),其中 x 称为自变量,y 称为因变量 各观测点落在一条线上 函数关系 (几个例子) 相关关系 (correlation) 变量间关系不能用函数关系精确表达 一个变量的取值不能由另一个变量唯一确定 当变量 x 取某个值时,变量 y 的取值可能有几个 各观测点分布在直线周围 相关关系 (几个例子) 相关关系 (类型) 散点图(scatter diagram) 散点图(例题分析) 【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的提高,这给银行业务的发展带来较大压力。为弄清楚不良贷款形成的原因,希望利用银行业务的有关数据做些定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据 散点图(例题分析) 散点图(例题分析) 例1 读取某公司雇员数据(R数据文件), 画出起始收入和现在收入的散点图。 load(E:/R/Employee data.Rdata); ls(); [1] Edata attributes(Edata); $names [1] ID GENDER BDATE EDUC JOBCAT SALARY [7] SALBEGIN JOBTIME PREVEXP MINORITY plot(Edata$SALARY,Edata$SALBEGIN); 相关系数(correlation coefficient) 对变量之间关系密切程度的度量 对两个变量之间线性相关程度的度量称为简单相关系数 若相关系数是根据总体全部数据计算的,称为总体相关系数,记为? 若是根据样本数据计算的,则称为样本相关系数,记为 r 相关系数 (计算公式) ? 样本相关系数的计算公式 相关系数(取值及其意义) r 的取值范围是 [-1,1] |r|=1,为完全相关 r =1,为完全正相关 r =-1,为完全负正相关 r = 0,不存在线性相关关系相关 -1?r0,为负相关 0r?1,为正相关 |r|越趋于1表示关系越密切;|r|越趋于0表示关系越不密切 相关系数(取值及其意义) 相关系数(例题分析) 相关系数的显著性检验 ( r 的抽样分布) 1. r 的抽样分布随总体相关系数和样本容量的大小而变化 当样本数据来自正态总体时,随着n的增大,r 的抽样分布趋于正态分布,尤其是在总体相关系?数很小或接近0时,趋于正态分布的趋势非常明显。而当远离0时,除非n非常大,否则r的抽样分布呈现一定的偏态。 当?为较大的正值时,r 呈现左偏分布;当?为较大的负值时,r 呈现右偏分布。只有当?接近于0,而样本容量n很大时,才能认为r是接近于正态分布的随机变量 相关系数的显著性检验 (检验的步骤) 1. 检验两个变量之间是否存在线性相关关系 等价于对回归系数 b1的检验 采用R.A.Fisher提出的 t 检验 检验的步骤为 提出假设:H0:? ? ? ;H1: ? ? 0 相关系数的显著性检验 (例题分析) ? 对不良贷款与贷款余额之间的相关系数进行显著性检(??0.05) 提出假设:H0:? ? ? ;H1: ? ? 0 计算检验的统计量 相关系数的显著性检验 (例题分析) 各相关系数检验的统计量 什么是回归分析?(Regression) 从一组样本数据出发,确定变量之间的数学关系式 对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著 利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度 趋向中间高度的回归 回归这个术语是由英国著名统计学家Francis

文档评论(0)

zijingling + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档