医学多元统计分析 绪论PPT.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学多元统计分析 绪论PPT

多元统计分析基础(绪论);主要内容;背景:传统的医学统计学多采用单因素分析方法,如对数据作单变量的描述性分析、参数估计和假设检验等统计推断。 但随着医学的发展及人类疾病谱的改变,人们逐步认识到许多人类疾病和健康问题并非单一因素所致,通常都是多个因素的综合作用结果。而多个因素的作用效应或联合作用效应有轻重之分,有的因素起主要作用,有的仅是辅助作用,因素之间的作用关系相当复杂。 由于受到计算科学发展的限制,数理统计学中的多元统计分析技术在医学科研中的发展进展缓慢。直到上个世纪下半叶,由于计算机的发展和普及,医用多元统计分析得到飞速发展。 ;现代医学多元分析方法的应用 随着计算机和统计分析软件的发展,医学多元统计分析方法已经构成了一门独立的学科体系,包括数据库的建立、变量的定义、预处理和常规的统计分模型应用及多种统计模型的联合分析等。这门学科的形成与发展对现代医学的发展起到了具大的推动作用。 ;多元统计方法的应用领域 诸多慢性病的发病原因的研究。高血压、糖尿病、肿瘤等疾病的患病率和死亡率呈逐年上升趋势,人们一直想知道这些疾病的发病原因并采取相应的控制措施。对于这些疾病,用传统的单因素分析方法很容易得出一些片面的结果,因为这些疾病的发生与发展并非单一因素可以解释的。 这些都必须借助多元统计分析技术;比较;关系;预测;分类;评价;各种应用对应的多元统计分析方法;多元统计分析方法主要内容;本课程的要求;研究因素 从广义的角度看,所有可以测量的变量都可以成为研究因素,比如:年龄、性别、文化程度、人体的各种生物学特征和生理生化指标环境因素、心理因素等。狭义来看,研究因素是指可能与研究目的有关的影响因素 多元统计分析对多变量样本的要求 ①分布:多元正态分布、相互独立、多元方差齐 ②样本含量 目前尚没有多元分析的样本含量估计方法, 一般认为样本含量应超过研究因素5-10倍以上即可。 ;变量的分类及其转换 定量资料(数值变量)定性资料(分类变量)等级资料(有序分类变量)。若收集的资料中既有??值变量,又有分类变量而统计模型要求对变量的性质做转换,则需要考虑做变量变换。也就是要考虑引入模型的变量的尺度要适宜。 ; 数值变量→分类成有序分类变量 血压:﹤60mmHg (8KPa) 低血压 60~90 mmHg (8~12 KPa) 正常 ﹥90 mmHg(﹥12 KPa) 高血压 ;分类变量→数值变量(伪变量,哑变量) 性别:X=0男,X=1 女(指示变量) 血型:ABO: X1=0 X2=0 X3=0为A, X1=0 X2=1 X3=0为B, X1=1 X2=0 X3=0为O, X1=0 X2=0 X3=1为AB 哑变量的数量=K-1(K为分类数) ; 有序分类变量→数值变量(伪变量) 一般是按等级从低到高取0、1、2……或1、2、3…… ;主要内容: 多因素分析是研究多个变量之间的依存关系的统计方法。在多个研究因素中,应根据专业知识确定哪些是结果变量(反应变量),哪些解释变量(自变量),通过一些特殊的统计模型对数据进行拟合,找出众多的解释变量中与反应变量有关的因素(影响因素),并确定其作用的大小和方向。 ;研究目的 可以分为 2大类 ①研究因素的依赖性:即某一反应变量与多个解释变量间的依存关系。如多元线性回归、logistic回归、Cox回归、判别分析等。 ②研究因素间的互依性:即无反应变量和解释变量之分,研究多个因素间彼此关系或彼此影响。如主成份分析、因子分析、聚类分析、典型相关分析等。 ;主要任务 多因素间的关系错综复杂,因此多元统计分析的主要任务是使复杂问题简化,将无关的因素丢弃,即抓住西瓜丢去芝麻。即抓住主要矛盾将无关或影响甚微的因素去除。思路有2种:①直接减少研究因素; ②通过变量变换减少研究因素:主成分分析、因子分析、典型相关等。目的是使复杂问题简单化。 ;4.1多元线性回归分析 拟合以自变量(解释变量)估计应变量(结果变量)的多元线性回归方程。应变量和自变量都是数值变量。若自变量中有少数定性或等级指标需转换成定量指标。但这种变量不宜超过自变量的1/3。 多元线性回归:凭理论或经验决定引入自变量 有无影响 逐步回归:逐步拟合(探索性研究) 岭回归和通径分析:作为多元线性回归的补充 ;4.2主成份分析 在医学研究中需要以一些生物学现象进行描述并找出比较恰当的描述指标。如儿童的身高、体重等可用?X、S等描述其平均水平和变异程度。但有些

文档评论(0)

erfg4eg + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档