- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第五节 虚拟变量 虚拟变量的建立: 设x是有k分类的名义变量,用k-1个取值为0或1的虚拟变量(dummy variable)分别代表各类别的属性,当案例属于一个虚拟变量所代表的类别时,这个虚拟变量就赋值为1,否则就赋值为0。 参照类(reference category):没有纳入线性回归方程的类别。 * 虚拟变量的应用 虚拟变量回归系数的意义: 表示该类别与参照类均值之差,因此又称其为差别截距。 若一个回归分析中只有虚拟变量且这些虚拟变量都代表某一个原变量的不同类别,则这一回归的整体检验等价于单因素方差分析。 若一个回归分析中只有两个因素形成的虚拟变量,则这一回归分析等价于双因素方差分析 。 * 虚拟变量的检验 采用虚拟变量的回归分析的检验: 由于虚拟变量的的取值只有0和1,因此,检验的只是取值为1的类别的平均值是否与参照类的平均值有明显差异 。 其他形式的分类变量编码: 效应编码(effect coding); 正交编码(orthogonal coding); 非正交编码(nonorthogonal coding)。 * 第六节 统计软件在线性回归分析中的应用 SPSS软件 模型设置、统计量选择、检验图形设置 分析结果的解释 STATA软件 各种设置的命令 分析结果的解释 * SPSS图形的检验功能 检验误差项是否呈正态分布(Histogram of *zresid): 做法:以回归方程的标准化误差为横坐标,以标准化误差的频数为纵坐标,并提供正态分布参照线 ; 回归方程预测值与误差项的关系图(散点图): 做法: 以回归方程标准化预测值为横坐标,以标准化误差为纵坐标。 作用: 线性关系的检查:若实际数据中变量间真为线性关系,该散点图无明显趋势; 均方差性的检查:若均方差性存在,横轴各点上散点的纵向分布宽度应该相等; 特异值的检查:若存在超出正负2区间的标准化误差值,便可认为是特异值。 * SPSS图形的检验功能 偏差散点图:(Patial residual plot of x1 with y): 即单个变量净解释作用的检查,检查单个自变量的边际影响。 检查的是:该自变量与其他自变量所不重合的信息与其他自变量解释因变量后所剩下的未解释信息之间的关系。 误差序列相关的检查: Durbin-Watson统计量 用来检验误差项之间是否存在序列相关。 d的值域为[0,4],在误差不存在序列相关时,d值应该在2左右。d值小于2时意味着相邻的误差之间存在正相关;d值大于2意味着相邻的误差存在负相关。 不一定只有时间序列数据才存在序列相关问题,各自独立的变量之间出现序列相关的原因: 变量设置问题,如,某自变量应该与因变量是二项式关系,但回归中只设为一次项关系; 遗漏了其他重要的自变量 。 * STATA相关分析的应用 相关分析: Pearson相关的命令 corr y x1 x2给出相关系数矩阵 corr y x1 x2,covariance给出的是协方差矩阵 配对相关的命令 pwcorr y x1 x2功能同corr,给出相关系数矩阵 pwcorr y x1 x2,sig给出显著性检验 pwcorr y x1 x2,sidak sig用sidak检验法将多重比较纳入考虑来调整显著度 Spearman级序相关测量的命令:spearman y x 肯德尔系数级序相关测量的命令:ktau y x 数量型变量的净相关分析: pcorr a b c控制其他变量后两变量之间的相关 * STATA线性回归模型设置 基本模型设置的命令: reg y x1 x2 x3 reg y x1 x2 x3,robust计算稳健标准差的估计值,称为稳健回归; reg y x1 x2 x3,beta给出标准化回归系数,便于变量解释能力大小的比较; sw reg y x1 x2 x3, pr(.05)反向剔除的逐步回归; xtreg y x1 x2 x3,re面板(横剖时间序列)数据线性回归分析 * STATA线性回归分析应用 模型的预测值、残差及作图 reg y x1 x2 x3基础模型 预测y值并给出标签 predict yhat label variable yhat ”predict y” 预测残差并给出标签 predict e, resid label variable e ”residual” 回归图形 graph twoway lfit y x1 x2 基本回归图 graph twoway lfit y x1 x2 || scatter y x1 x2回归线与散点图结合 * STATA线性回归分析的检验 模型系数的显著性检验 reg y x1 x2 x3基础模型; quietly reg y x1 x2 x3不输出回归表,
文档评论(0)