- 1、本文档共83页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第6讲 回归分析PPT
共线性检验 4、回归分析结果 容忍度 方差膨胀率 说明:仅X1的系数有统计意义。 注: (1)对于多元线性模型,通常还应检验其自变量之间是否存在共线性的问题。 (2)这里自变量的容忍度大于0.1,不存在共线性的问题。如果存在共线性的问题,应当通过增大样本量建立模型来解决此问题。 补充:共线性检验指标 指标名称 检验标准 容忍度(Tolerance) 若某自变量容忍度小于0.1,则存在共线性问题 方差膨胀率(VIF) 容忍度的倒数越大共线性问题越严重 特征根(Eigenvalue) 若多个维度的特征根等于0,则可能存在共线性问题 条件指数(Condition Index) 若某个维度的条件指数大于30,则可能存在共线性问题 5、共线性检验结果 特征根 条件指数 说明:按照上述的检验标准,该模型不存在共线性的问题 6、剔除变量列表 0.05,该模型中无需再对变量X3、X4进行分析 第三节 曲线拟合 拟线性,是指变量之间的关系是非线性关系,但是可以通过一些特殊的变化使之线性化。 譬如 非线性方程线性化 一、曲线拟合简介 曲线拟合就是研究两变量间拟线性关系的一种方法。 曲线拟合的基本步骤是首先选择一种常见的曲线模型及其数学表达式。然后对变量做变换使得曲线模型线性化,再利用已知数据,用最小二乘的方法来估计模型中的参数。 ◆ 注意:利用曲线拟合的方法来估计两变量间的关系,必须选取恰当的曲线模型。模型的选取首先依赖于实际问题,同时也依赖于数据的特征。这一点可以通过作变量间的散点图来对两变量间的关系做一个预估计。在根据预估计结果选择恰当的统计模型。 例3 已知有某次泥石流的各阵观测数据保存在如图所示的数据文件“nishiliu.sav”中,试拟合各阵泥石流泥面宽与泥深之间的关系。 二、引例(练习二) 1、作散点图,分析两者之间的关系 说明:通过观察散点可发现,有一个明显异常点,结合实践判断可能是录入错误,要剔除该数据。 2、剔除异常值 3、【Analyze】/【Regression】/【Curve Estimation】 曲线拟合的因变量(Y轴),可多个 曲线拟合的自变量(X轴),只能一个 时间作为自变量,因变量需为时间序列数据 定义图形中的标识变量 选择图形中是否含常数项 是否绘制拟合曲线的图形 定义拟合的曲线模型 是否输出曲线拟合模型检验的方差分析表 补充:曲线拟合的可选模型 Save:用于定义需要保存的统计量 定义预测观测值组 定义需要保存的中间统计量 选择是否保存预测值 选择是否保存残差 选择是否保存预测值的置信区间 对估计周期内的所有观测量估计其预测值 定义时间序列中最后一个观测值之后的n个值 显示当前估计周期 结果解读: 1、模型基本信息描述 2、直线模型(Linear) 等同于对两个变量进行线性回归分析 (1)直线模型拟合度检验 (2)直线模型方差分析表 说明:决定系数为0.606,模型的拟合效果一般。 说明:Sig.=00.05,模型具有显著的统计学意义。 (3)直线模型系数 说明:从各系数的Sig.可看出,各项系数具有显著意义。 可得: 其中:y表示泥深,x表示泥面宽 3、二次曲线模型(Quadratic) (1)二次曲线模型拟合度检验 (2)二次曲线模型方差分析表 说明:决定系数为0.733,模型的拟合效果不错。 说明:Sig.=00.05,模型具有显著的统计学意义。 (3)二次曲线模型系数 说明:从各系数的Sig.可看出,各项系数具有显著意义。 可得: 其中:y表示泥深,x表示泥面宽 4、三次曲线模型(Cubic) (1)三次曲线模型拟合度检验 (2)三次曲线模型方差分析表 说明:决定系数为0.737,模型的拟合效果不错。 说明:Sig.=00.05,模型具有显著的统计学意义。 (3)三次曲线模型系数 说明:从各系数的Sig.可看出,各项系数具有显著意义。 可得: 其中:y表示泥深,x表示泥面宽 5、三类模型的拟合曲线与原始观测值图形 说明:从图形上看,3个模型的拟合效果是比较近似的。 第四节 二分类变量Logistic回归 在Logistic回归模型中,因变量是定性变量。 特别地,因变量是二分类变量的情况十分普遍。 譬如: (1)致癌因素的研究中,收集了若干人的健康记录,包括年龄、性别、抽烟史、日常饮食及家庭病史等变量的数据。因变量为一个人得了癌症(Y=1),还是没有得癌症(Y=0)。 (2)在金融界,最关心的是企业的“健康”状况。自变量是公司的各项财务指标。而因变量即是公司的偿付能力(破产=0,有偿付能力=1)。 一、 Logistic回归简介 区别:线性回归与曲线拟合都要求因变量是定量变量。 二分类变量Logistic回归简介
您可能关注的文档
最近下载
- 量线四维看盘四号战法.pdf
- 初中物理2022课标VS2011课标新变化及“增删内容”对照.pdf
- 4-2 中化泉州石化 3 万吨年干气脱硫制二甲基亚砜项目反应器设计说明书 (2).pdf
- T∕HEESA 0001-2024 输变电工程建设过程碳排放计算导则.pdf VIP
- 《运动生物力学》课件.pptx VIP
- 高中-学法大视野-物理必修2.pdf
- GB/T 44353.1-2024动物源医疗器械 第1部分:风险管理应用.pdf
- 部编版二年级下册语文教材分析、学情分析(每一课都有,全).pdf
- 2024年云南省昆明市五华区云南大学附属中学中考三模语文试题.docx VIP
- 时尚休闲妆容课件.pptx VIP
文档评论(0)