第十五章多元统计分析简介.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十五章多元统计分析简介多元线性回归多元线性回归分析(multiple linear regression)一、概念及数学模型:x1 -- x m与y间得线性依存关系 数学模型 y=?0+?1 x1+、、、+ ?m xm二、基本思想: 寻找一个最佳平面反映x与y得线性依存规律。多元线性回归分析 所求平面使得理论值与实际观察值最接近 用平面去描述这些观察点时,使得误差 基本原理一、资料整理格式多元线性回归分析二、回归模型估计方法 第i个个体得误差为:?ei =(?0+?1 xi1+、、、+ ?m xim)-yi所有n 个个体得误差为:? |ei | ?ei2=I从而,所求平面即使得I 为最小 正规方程组 求最小值点method of least squares(最小二乘法):Y得条件平均估计值多元线性回归分析与xj得计量单位有关三、回归模型评价方法3、1、 几个系数问题偏回归系数---------标准偏回归系数----------偏相关系数复相关系数R3、2、 回归方程得拟合优度检验确定系数R2=SS回/SS总方差分析F----检验: F= MS回/MS剩偏回归系数得t---检验消除xj计量单位得影响大家应该也有点累了,稍作休息大家有疑问的,可以询问和交流多元线性回归分析四、应用解释:利用自变量x去解释反应变量y得变异。筛选:运用变量筛选方法,提取对y有重大影响得自变量。预测:已知自变量x去估计反应变量y。控制:已知反应变量y去估计自变量x。多元线性回归分析五、筛选危险因素 常用方法有(1)前进法; (2)后退法; (3)逐步法:有进有出, 双向筛选。 实例测量得到27名糖尿病患者得血清总胆固醇X1、甘油三酯X2、空腹胰岛素X3、糖化血红蛋白X4、空腹血糖Y得数值。试建立血糖与其她几项指标得多元线性回归方程。回归系数T值P值标准化回归系数截距5、9433X10、14240、3900、050、0776X20、35151、7210、050、3093X3-0、2706-2、230、05-0、3395X40、63822、6230、050、3977Logistic回归Logistic回归分析数学模型:Logistic回归分析一、基本思想 用模型去描述实际资料时,须使得理论结果与实际结果尽可能得一致。 资料整理格式Logistic回归分析二、基本原理 1、结果问题 : 对于第i个个体而言,其理论结果为pi ,而实际结果就是?i 。 2、一致问题: 对于第i个个体而言, ?i =1pi ?i =0qiLogistic回归分析 pi ? i qi 1- ? i 对于全部n个研究对象而言,其一致性为: L=∏ pi ? i qi 1- ? i 使得L或 lnL最大得?及?j即为所求。Logistic回归分析三、基本方法 最大似然函数法四、参数解释 1、 偏回归系数?j 得意义 与指标得计量单位有关,从而,通常无实际得解释意义。 Logistic回归分析消除xj量纲得影响2、标准化偏回归系数?j1得意义(1)符号:取 “+”,xj 增大,则P增大,即促进阳性结果得发生,为“不利因素”; 取 “-”,xj增大,则P减小,即抑制阳性结果得发生,为“保护因素”。(2)大小 :∣ ?j1 ∣越大,则xj 对结果得影响也就越大。Logistic回归分析3、OR值得计算和意义 影响因素由X▲ 变化到X* 时,有 : (1)对多指标得共同效应进行评价:若OR1,则处于X*水平下得阳性结果发生风险要高于X▲水平,即“不利因素”占主导地位;若OR1,则处于X*水平下得阳性结果发生风险要低于X▲水平,即“保护因素”占主导地位;若OR=1,则处于X*水平下得阳性结果发生风险与X▲水平相等,即处于平衡状态。Logistic回归分析 (2)对单因素进行评价:对因素xj而言,当她由xj▲变化到xj*时,其OR值为: 若ORj 1,则xj 促进阳性结果得发生, 为不利因素;若ORj 1,则xj 抑制阳性结果得发生,为保护因素;若ORj =1,则xj 为非危险因素。Logistic回归分析4、筛选危险因素 常用方法有(1)前进法; (2)后退法; (3)逐步法:有进有出, 双向筛选。 实例研究吸烟X1、饮酒X2与食管癌Y关系,试作Logistic回归。回归系数x2值P值标准化回归系数截距-0、9099X10、885611、2070、052、7079X20、526144、8700、051、5443COX回归Cox比例风险模型一、基本概念 生存时间(survival time):从某种起始事件到达某终止事件所经历得时间跨度。 对于追踪研究,生存时间就就是追踪观察持续得时间。生存时间常用符号t表示。 例如,临床上冠心病病人在两次发作之间得时间间隔;流行病学中,从开始

文档评论(0)

kch + 关注
实名认证
文档贡献者

教师资格证持证人

该用户很懒,什么也没介绍

领域认证该用户于2023年10月08日上传了教师资格证

1亿VIP精品文档

相关文档