第4章多变量分析.pdf

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4章多变量分析

第 4 章 多变量分析 本章知识结构 第 4 章 多变量分析 引 言 多变量分析(multivariate analysis)也称为多元统计分析(multivariate statistical analysis), 是指统计资料中有多个变量(或称因素、指标) 同时存在时的统计分析,它既包含了一元统 计分析到多元情形的推广,又有其独特的新方法和技巧。例如对多名高血压病患者进行调 查,检查项目中除血压外,还有年龄、性别、体重、体胖等若干个项目(变量) 。如果用单 变量统计分析方法考察超重与血压的关系,可以发现,超重组与不超重组相比,高血压患 病率高出一倍以上。但如果把资料按体胖者与非体胖者划分成两组,再考察每组内的超重 与高血压患病率的关系,就不能发现超重与高血压患病率有任何明显的联系。也就是说, 单变量统计分析忽视了另外一些因素(如此例中的体胖及年龄等) 的影响。对于有多个变量 客观存在而又相互影响的资料,采用简单的单变量统计分析是不合理的,而多变量分析可 将变量间的内在联系和相互影响考虑在内来进行分析。 统计学中的多变量分析起源于医学和心理学。20 世纪30 年代它在理论上发展得很快, 但由于计算复杂,实际应用很少。20 世纪70 年代以来,由于计算机的蓬勃发展和普及, 多变量统计分析已渗入到几乎所有的学科。到20 世纪80 年代后期,计算机软件包已很普 遍,使用也非常方便,因此多变量分析方法也更为普及。 多变量统计的理论基础和工具是数学中的概率论和矩阵。但对于实际应用者而言,只 要有合适的计算机和软件包以及掌握一些初步的多变量统计知识,就可以使用它来解决实 际问题。多变量统计的内容很多,但从实际应用角度看,主要包括回归分析、判别分析、 因子分析、主成分分析、聚类分析、生存分析6 个大的分支。 本章将重点介绍多元回归分析、主成分分析、判别分析和聚类分析。 4.1 多元回归分析 在生物医学问题的研究中,经常遇到某个指标受到多个变量影响的情况,例如血糖浓 度的大小除了与年龄有关外,还受到饮食情况、体重、性别、家族史等多种因素的影响。 多元回归分析主要包括多元线性回归和Logistic 回归。 1.多元线性回归(Multiple Linear Regression) 多元线性回归是研究一个因变量与多个自变量之间线性依赖关系的统计方法。 ˆ 与一元线性回归相类似,多元线性回归方程为:y b =+b x +b x ++b x ,其中的 0 1 1 2 2 k k 各项待定系数( b0 除外)称为偏回归系数。回归方程中的各项系数用最小二乘法来确定,偏 回归系数的假设检验思想与一元线性回归类似。不同之处在于:不仅要对整个回归方程进 行假设检验,还要对每一个自变量进行偏回归显著性检验。如果不能得到显著性结论,则 应剔除此自变量后重新进行多元线性回归,直到最后所有的有显著意义的自变量都进入回 归方程。 多元线性回归在MATLAB 中也可以用regress 函数来进行回归分析。但regress 函数返 93 生物医学数据分析及其 MATLAB 实现 回的检验统计量stats 只能用于对整个回归方程进行假设检验。stats 的第一个值为确定系数 2 R ,通常其值越大,说明回归方程越有价值;第二

文档评论(0)

75986597 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档