长江大学商业数据处理与分析.docx

下载文档 降价啦

26
0
约3.33千字
约 48页
2017-01-22 发布于湖北
举报
版权申诉
保障服务

长江大学商业数据处理与分析.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

长江大学商业数据处理与分析

实验一 SPSS的基本统计功能频数分析（Frequencies过程）实例一：抽查某高校一个班级7名学生的期末考试语文、数学和化学三门课程的成绩，如下图所示。现利用频数分析对这几名学生的语文成绩进行分析。从下表可以看出，有效样本为7个，没有缺失值。语文的平均成绩为75分，中位数为75，标准偏差5.1962，最小值为67，最大值为83等。从下表可以看出学生语文成绩的频数分布，从左至右依次是次数、百分比、有效百分比和累计百分比。从下图可以看出学生语文成绩的直方图，从图中可以看出学生的语文成绩基本服从正态分布，其中75-80分的学生居多。描述性分析（Descriptives过程）实例二：某高校一个班级的男生的身高资料，如下图所示。现利用描述性分析对这个班级的男神身高进行描述。从下表可以看出样本个数20个，有效的20个，范围为27，最小值为165，最大值为192，平均值为178.05，平均数的标准错误为1.6897，标准偏差为7.5566等信息。从下图可以看出描述性统计还可以把原始变量转换成标准化的变量并以变量的形式在数据窗口呈现，图所示的“Z身高”。探索分析（Explore过程）实例三：某公司20名员工一年的薪水资料，如下图所示。现利用探索分析对此公司员工的薪水进行分析。从下表可以看出女员工共5个样本，男员工共5个样本，没有缺失值。从下表可以看出女员工的平均薪水为39710，标准错误为6097.5077，平均值的95%置信区间为（22780.605，56639.395），5%修整的平均值是排除掉数据首尾两端5%的变量值后得出的平均值为25248.30等描述统计信息。下面一系列图为其他一些描述统计信息。4、交叉列联表分析(Crosstabs过程)实例四：一份关于工作满意度的调查问卷的结果，如下图所示。现利用列联表分析对男女员工对工作满意度是否有差异进行分析。从下表可以看出样本数为15，有一个缺失值。每种组合的十几计数、预期计数、百分比在性别内、百分比在工作满意度内等信息。下表为卡方测试的结果。实验二相关与回归分析两变量的相关分析（Bivariate过程）实例五：关于一组汽车价格、马力和燃料效率的资料统计，如下图所示。现利用双变量相关分析对价格和马力之间是否存在相关性进行分析。从下表可以看出，价格、马力的平均值和标准偏差从右表可以看出价格和马力的相关系数为0.924，右上角标示“ ** ”，相伴概率小于0.01，表示在0.01的显著水平上极显著，说明价格和马力呈显著正相关，即马力高的汽车，价格随之增高。从下表可以看出非参数相关性的结果，斯皮尔曼等级相关系数和肯德尔tau_b相关系数得出的结论与person相关系数一致。偏相关分析(Partial 过程)仍使用实例五。现利用偏相关分析对在控制变量“马力”存在的情况下，价格和燃料效率之间是否存在相关性进行分析。从下表可以看出，价格、燃料效率和马力三者的平均值和标准偏差。从下表可以看出，在不控制马力变量时，价格和燃料效率是显著负相关的，但是控制马力变量后，价格和燃料效率的相关性变得不显著，所以不能简单的判断汽车价格和燃料效率之间是否存在着相关关系，结论应该为在马力不变的前提下，汽车价格和燃料效率之间不存在显著的相关关系。距离分析(Distances过程)实例六：5个学生的百米成绩、跳远成绩和实心球成绩，如下如所示。现利用机理分析来分析学生体育成绩之间的相关性。个案间的距离分析----个案间的非相似性测量：从下表可以看出，个案数全部有效，无缺失值。相关性矩阵形式给出了两两个案之间的Euclidean距离，相似性矩阵形式给出了两两个案之间的pearson相关系数。线性回归分析(Linear过程)实例七：某公司员工的基本情况，如下图所示。现利用公司员工的一些基本情况来拟合多元线性回归方程。分析结果如下所示。5、曲线回归(Curve Estimation过程)实例八：1978年-2005年中国人均消费、人均可支配收入和教育支出的数据统计，如下图所示。现分析年人均可支配收入和教育支出之间的关系。从下表可以看出模型的一些描述信息，包括模型名称、因变量等，还可以看出共有28个个案，排出的为12个，从数据中可以看出1978-1989年教育支出数据缺失。从下表可以看出各个模型的拟合优度，可以看出立方的R方最高，其次为二次项和复合模型，最后为线性。同时，从模型的显著性检验结果看，显著性均小于0.01，说明模型成立的统计学意义都非常显著，同时可以看出立方模型的回归系数检验都小于0.5，说明立方模型的回归系数显著。下图为各个模型拟合回归线，从中可以看出线性相关对于其他3种模型，拟合优度较差。实验三聚类分析系统聚类法（Hierarchical Cluster过程）实例九：一些省市高校教职工的情况，如下图所示。现利用