- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验报告分析工具1.doc
课程实验报告
课程名称 信息分析工具 班级 1204071 实验日期 2015.6.2 姓名 学号 120407122 实验成绩 实验名称 SPSS软件的使用及数据分析
实
验
目
的
及
要
求
根据《中国统计年鉴—2009》这一资料性年刊,通过应用SPSS软件基本操作进行数据分析,用以探究我国城镇居民消费结构及其趋势。
实
验
环
境
计算机
SPSS
实
验
内
容
及
实
验
步
骤
主要运用方法:
(一)方差分析:
方差分析就是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。其中,扣除了各种试验原因所引起的变异后的剩余变异提供了试验误差的无偏估计,作为假设测验的依据。
(二)回归模型——残差分析:
回归分析是一种处理变量的统计相关关系的一种数理统计方法。回归分析的基本思想是: 虽然自变量和因变量之间没有严格的、确定性的函数关系, 但可以设法找出最能代表它们之间关系的数学表达形式。多元回归分析是研究多个变量之间关系的回归分析方法。
实
验
内
容
及
实
验
步
骤
图一给出了基本的描述性统计图,图中显示各个变量的全部观测量的Mean(均值)、Std.Deviation(标准差)和观测值总数N。图2给出了相关系数矩阵表,其中显示3个自变量两两间的Pearson相关系数,以及关于相关关系等于零的假设的单尾显著性检验概率。
图1 描述性统计表
图1 描述性统计表
图2 相关系数矩阵
从表中看到因变量家庭设备用品及服务与自变量食品、衣着之间相关关系数依次为0.869、0.684,反映家庭设备用品及服务与食品、衣着之间存在显著的相关关系。说明食品与衣着对于家庭设备用品及服务条件的好转有显著的作用。自变量居住于因变量家庭设备用品及服务之间的相关系数为-0.894,它于其他几个自变量之间的相关系数也都为负,说明它们之间的线性关系不显著。此外,食品与衣着之间的相关系数为0.950,这也说明它们之间存在较为显著的相关关系。按照常识,它们之间的线性相关关系也是符合事实的。
图3给出了进入模型和被剔除的变量的信息,从表中我们可以看出,所有3个自变量都进入模型,说明我们的解释变量都是显著并且是有解释力的。
图3 变量进入/剔除信息表
图4给出了模型整体拟合效果的概述,模型的拟合优度系数为0.982,反映了因变量于自变量之间具有高度显著的线性关系。表里还显示了R平方以及经调整的R值估计标准误差,另外表中还给出了杜宾-瓦特森检验值DW=2.632,杜宾-瓦特森检验统计量DW是一个用于检验一阶变量自回归形式的序列相关问题的统计量,DW在数值2到4之间的附近说明模型变量无序列相关。
图4 模型概述表
图4给出了方差分析表,我们可以看到模型的设定检验F统计量的值为9.229,显著性水平的P值为0.236。
图5 方差分析表
图6给出了回归系数表和变量显著性检验的T值,我们发现,变量居住的T值太小,没有达到显著性水平,因此我们要将这个变量剔除,从这里我们也可以看出,模型虽然通过了设定检验,但很有可能不能通过变量的显著性检验。
图6 回归系数表
图7给出了残差分析表,表中显示了预测值、残差、标准化预测值、标准化残差的最小值、最大值、均值、标准差及样本容量等,根据概率的3西格玛原则,标准化残差的绝对值最大为1.618,小于3,说明样本数据中没有奇异值
图7 残差统计表
图8给出了模型的直方图,由于我们在模型中始终假设残差服从正态分布,因此我们可以从这张图中直观地看出回归后的实际残差是否符合我们的假设,从回归残差的直方图于附于图上的正态分布曲线相比较,可以认为残差的分布不是明显地服从正态分布。尽管这样也不能盲目的否定残差服从正态分布的假设,因为我们用了进行分析的样本太小,样本容量仅为5。
图8 残差分布直方图
从上面图4的分析结果看,我们的模型需要剔除居住这个变量,用本次实验中的方法和步骤重新令家庭设备用品及服务对食品和衣着回归,得到的主要结果如图9、图10所示,跟上面的分析类似,从中可以看出,剔除居住这个变量后,模型拟合优度为0.964,比原来有所降低;而方差分析的F检验为27.071,新模型与原来的模型相比,各个系数都通过了显著性T检验,因此更加合理,从而我们可以得出结论:剔除居住这个变量后的模型更加合理,因此在做预测过程中要使用剔除不显著变量后的模型。
图9 模型概述
图10 方差分析表
总
结
在将课本知识与实验过程相结合的过程中,实验步骤的操作也变得得心应手。也给了我一个启发,在实验前应该先将所涉及的内容梳理一遍,带着问题和知识点去 做实验可以让我们的实验过程不在那么枯燥
您可能关注的文档
- 壳聚糖AMDMDAAC三元接枝共聚物的合成及应用.pdf
- 壳聚糖乙二醛对大豆纤维织物的防皱整理的研究.pdf
- 壳聚糖对污染土壤中吸附态PbⅡ的解吸作用.pdf
- 壳聚糖的吸附行为及其FTIR光谱研究.pdf
- 壳聚糖的复合法降解及降解产物降血糖活性的研究.pdf
- 复习资料2012春季园林1031班园林绿地施工与养护.doc
- 复合吸附深度处理饮用水试验研究.pdf
- 复合喷动塔内蒸发特性的数值模拟与实验研究.pdf
- 复合微生物制剂对芦苇人工湿地去除污染物的影响.pdf
- 复合微生物菌剂强化堆肥技术研究.doc
- E-cadherin与N-cadherin在乳腺癌中的表达特征、关联及临床意义探究.docx
- C5-siRNA:开启大鼠心肌缺血损伤保护机制与应用探索新篇.docx
- 科技赋能与制度保障双轮驱动下公安机关执法办案管理系统的设计与实践.docx
- 天津电力公司车辆监控系统的设计与实现:技术融合与创新应用.docx
- Ⅱ期大肠癌肉眼观肿大淋巴结:临床意义剖析与机制溯源.docx
- 腹腔镜手术中不同成分液体对病人血糖变化的影响及机制探究.docx
- FGF21与AdipoRon:脂肪细胞命运与脂质代谢的分子调控密码.docx
- DPC4、P16及Bcl-2表达:揭秘口腔白斑与鳞癌的癌变密码.docx
- CK、CK7、PLUNC:脑膜癌病诊疗新视角与突破.docx
- DTI技术在颅内肿块囊性部分及瘤周区的诊断价值探究.docx
文档评论(0)