- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
ChapSPSS回归分析衍生方法.
第9章 线性回归的衍生方法
第9章 线性回归的衍生方法
9.1 曲线拟合过程
9.2 加权最小二乘法
9.3 岭回归分析
9.4 最优尺度回归
2
曲线拟合过程
直线关系毕竟是较少数的情形,当因变量和自变量呈曲线关系时:
有明确的公式:利用变量变换将曲线直线化,然后加以拟合
关系不明:基于图形观察,拟合可能的曲线,从中挑选出最为合适的一个
具体拟合方法:根据所选择的公式,将自变量和因变量进行变量变换,然后按照直线回归的方式进行拟合
可拟合的曲线种类
高次方曲线:一、二、三次方曲线
指数、对数、幂曲线
特殊类型曲线:S形曲线、生长曲线等
3
案例:通风时间和毒物浓度的曲线方程
根据文献资料,随着通风时间的增加,密闭空间内污染物的浓度应当呈指数方程下降。
现考察某通风设备的换气效果,在室内放置了某种挥发性物质(模拟毒物),待其充分分散到室内空气中后开始通风,每一分钟测量一次室内空气中的毒物浓度,请建立时间与空气中毒物浓度的指数方程。curve.sav
已有明确的方程y=a×ebx,按此拟合即可。
等价于先进行变量变换,然后拟合直线方程。
4
案例:通风时间和毒物浓度的曲线方程
选择“分析”---》“回归”---》“曲线估计”
“因变量”列表框:y
“自变量”列表框:time
“模型”选项组:选择“指数”,去处“线性”
选中“显示ANOVA表格”复选框
5
第9章 回归分析衍生方法
9.1 曲线拟合过程
9.2 加权最小二乘法
9.3 岭回归分析
9.4 最优尺度回归
6
所针对的问题:方差齐性被违反
因变量的变异随着某些指标的改变而改变
以地区为观察单位调查某种事物的发生率
研究通货膨胀和失业率对股票价格的影响
高价股票的波动一般都会大于低价股票
需要人为调控各案例在回归中的重要性
解决办法
根据用户提供的可能预测因变量变异大小的指标,在拟合时对变异较小(即测量更精确)的测量值赋予较大的权重
7
案例:不等量样品数据的回归方程
实验中收集得15对数据,每对数据都是将n份样品混合后测得的平均结果,但各对数据的n大小不等,试求出X对Y的直线回归方程。wls.sav
加权后的决定系数基本上都是低于原模型的
8
第9章 回归分析衍生方法
9.1 曲线拟合过程
9.2 加权最小二乘法
9.3 岭回归分析
9.4 最优尺度回归
9
岭回归分析
一种专门用于共线性数据分析的有偏估计方法
有偏意味着对数据信息有所取舍
通过丢弃部分信息,以得到更为稳定的分析结果
实际上是一种改良的最小二乘法
由于是有偏估计,统计检验已经居次要地位,故一般不再给出
10
岭回归分析
程序方式调用
11
案例:用外形指标推测胎儿周龄
现测得22例胎儿的身长、头围、体重和胎儿受精周龄,具体数据见文件ridgereg.sav。研究者希望能建立由前三个外形指标推测胎儿周龄的回归方程
12
第9章 回归分析衍生方法
9.1 曲线拟合过程
9.2 加权最小二乘法
9.3 岭回归分析
9.4 最优尺度回归
13
所针对的问题:测量尺度非等距
变量为无序多分类时,类别间的差异如何较难探索
变量为有序多分类时,类别间的距离不一定相等,直接作为连续变量分析不妥
即使变量均为连续型变量,但其联系有可能为某种曲线,直接按照线性结构来拟合也不合适
14
解决办法
根据数据情况进行迭代搜索,找到适当的变换方法对原始分类变量进行转换,将原始变量一律转换为连续性评分,然后再进行方程拟合
分类变量越多优势越明显
从实用的角度出发,该方法可以被作为一种探索性方法使用
15
案例:生育子女数的回归模型
现收集了一批妇女的曾生子女数、年龄、居住地类别(1:城市,2:农村)、受教育程度(1~5分别代表文盲半文盲、小学、初中、高中、大学及以上),请建立后三个变量对曾生子女数的回归模型,数据见child.sav。
用此方法来探索一下受教育程度对因变量的影响趋势
选择“分析”---》“回归”---》“最佳尺度”
“因变量”列表框:childnum,在定义尺度中,选择“数值”
“自变量”列表框:age,area,edu,在“定义尺度”中,分别选择:“数字”,“名义”,“序数”。
16
文档评论(0)