- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多因素分析;概念
多因素分析是同时对观察对象的两个或两个以上的变量进行分析。
常用的统计分析方法有:
多元线性回归、Logistic回归、COX比例风险回归模型、因子分析、主成分分析,等。;多变量资料数据格式;Y,X——直线回归
Y,X1,X2,…Xm——多元回归(多重回归) ;β0为回归方程的常数项(constant),表示各自变量均为0时y的平均值;
m为自变量的个数;
β1、β2、βm为偏回归系数(Partial regression coefficient)
意义:如β1 表示在X2、X3 …… Xm固定条件下,X1 每增减一个单位对Y 的效应(Y 增减β个单位)。
e为去除m个自变量对Y影响后的随机误差,称残差(residual)。; 为y的估计值或预测值(predicted value);
b0为回归方程的常数项(constant),表示各自变量均为0时y的估计值;;适用条件:;8; ;(1)用各变量的数据建立回归方程
(2)对总的方程进行假设检验
(3)当总的方程有显著性意义时,应对每个自变量的偏回归系数再进行假设检验,若某个自变量的偏回归系数无显著性,则应把该变量剔除,重新建立不包含该变量的多元回归方程。 ;例15-1(P.262) 27名糖尿病人的血清总胆固醇、甘油三脂、空腹胰岛素、糖化血红蛋白、空腹血糖的测量值列于表15-2中,试建立血糖与其它几项指标关系的多元线性回归方程。;由上表得到如下多元线性回归方程:;2、回归方程的假设检验——F检验;14;3、各个偏回归系数的假设检验——t检验;重新建立不包含提出因素的回归方程;对新建立的回归方程进行检验;对新方程的偏回归系数进行检验;1、确定系数(R2):; ;;四、各自变量的评价;回归方程中包含的自变量;2、标准化偏回归系数(standardized partial regression coefficient)
消除测量单位影响后的偏回归系数——标准化偏回归系数。
意义:;bj —— X的偏回归系数
Sj——为自变量的标准差
SY ——为应变量的标准差;∴对血糖影响大小的顺序依次为:糖化血红蛋白(X4)、胰岛素(X3) 、甘油三酯(X2)。
比较糖化血红蛋白和甘油三酯的标准偏回归系数:
0.413 / 0.354 =1.17(倍)
糖化血红蛋白对血糖的影响强度约为甘油三酯的 1.17倍。;五、自变量的筛选
基本思路:尽可能将回归效果显著???自变量选入方程中,作用不显著的自变量排除在外。
(1)全局择优法(all possible subsets selection):
(2)逐步选择法;1、全局择优法(最优子集回归)
(all possible subsets selection):
有m个自变量就有2m-1个自变量子集。在各子集中选择最优的回归方程。
仅适用于自变量个数不太多的情况。;2、向前筛选法(Forward selection):
事先给定一个入选标准,即?(通常? =0.05),然后根据各因素偏回归平方和从大到小,依次逐个引入回归方程至无显著性自变量可以入选为止,因素一旦入选便始终保留在方程中而不被剔除。
局限性:后续变量的引入可能会使先进入方程的变量变得不重要。;3、向后剔除法(Backward elimination)
首先建立全部自变量的全回归方程,给定剔除标准,根据各因素偏回归平方和从小到大,依次逐个将无显著性的自变量从回归方程中剔除。
优点:考虑到了自变量的组合作用,选中的自变量数目一般会比前进法选中的多。
缺点:当自变量数目较多或有某些自变量高度相关时,可能得不出正确的结果。;4、逐步法(Stepwise):
给出入选标准(通常 ?1 =0.05)和剔除标准( 通常?2 =0.10),每次选入一个在方程外且最具统计学意义的自变量后,就对原在方程中的自变量做剔除检验,这个过程逐步进行,直到没有有统计意义的自变量可以入选,也没有无统计学意义的自变量保留在方程中为止。
实际工作中,多采用逐步法。
用上述方法对上例资料进行分析。; ;(5)观测值重新量化问题; 上述以职员作为对比水平(基础水平)。哑变量X1、 X2、 X3分别代表了工人、农民、干部与职员相比的系数。;(7)自变量的联合作用分析
若要考虑X3、X4对应变量 y 的联合作用,可设置一个新变量X5= X3X4。若b3、b4和b5都有统计学意义,则说明X3、X4对应变量既有单独作用,又有交互作用。;说明X3、X4对应变量既有单独作用,又有交互作用
您可能关注的文档
最近下载
- 水闸横剖面图识读水利工程图识读与绘制.pptx VIP
- 国家建筑标准设计图集20S515 钢筋混凝土及砖砌排水检查井.pdf VIP
- 救援技术毕业论文题目(647个).doc VIP
- l临床医生三基考试试题及答案.doc VIP
- 苏教版高一生物必修一知识点总结.doc VIP
- 12J7-3-内装修吊顶标准规范(OCR).pdf VIP
- 全国翻译专业资格(水平)考试--CATTI精品课件.ppt VIP
- 《深化国有企业改革》课件.ppt VIP
- 基于AI技术的增强型汽车动力电池预测方法及系统.pdf VIP
- (2025秋新版)部编版三年级道德与法治上册《第10课《公共场所的文明素养》 教学设计.docx VIP
原创力文档


文档评论(0)