实验2数据特征的描述统计分析.docVIP

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
实验2数据特征的描述统计分析 实验2数据特征的描述统计分析 PAGE 实验2数据特征的描述统计分析 实验2数据特征的描述统计分析 1.下表是一电脑公司某年连续120天的销售量数据(单位:台)。试对其进行频数分析,计算均值、中位数、众数、四分位数,标准差、最大值、最小值、全距,偏度、峰度系数;画出直方图、茎叶图、箱线图;解释结果并说明其分布特征。 操作步骤:1.输入数据并设置变量为V1 2.选择“分析”→“描述统计”→“频率”命令,弹出如下图的对话框。点击“频率”对话框,选择变量V1,点击中间的右箭头,使变量V1进入右边的列表框。点击“统计量”按钮,弹出如下对话框。选中“四分位数”、“均值”、“中位数”、“众数”、“标准差”、“范围”、“最小值”、“最大值”、“偏度”、“峰度”。 3.击“继续”回到“频率:统计量”界面。点击“图标”按钮,选择“直方图”,点击继续。回到《频率:统计量》界面,确定。 结果分析 1.描述性统计表 从表中可以看出:有效样本数为120,没有缺失值。销售平均值为,标准差为,最大值为237,最小值为141。 频率分布 该表给出了电脑公司的销售额的频数分布。该表从左到右分别是有效的样本值、频数、频数占总数的百分比、有效数占总数的百分比、累计百分比。 3.直方图 从直方图可以看出销售额近似服从正态分布,而且集中趋势在175。 茎叶图 这是数据的茎叶图。从左到右分别是频数、茎、叶三部分。其中茎代表数值的整数部分,叶代表数值的小数部分。由每行的茎叶构成的数字再乘以茎宽,则为实际数据的近似值。 5.箱线图 这是电脑公司销售额数据的箱线图,其中箱为四分位间距的范围,所谓四分位距就是百分数75代表的值减去百分数25代表的值。中间的粗线表示平均数,上面和下面的细线分别表示最大值和最小值。 下表是某班同学月生活费资料,试对其进行描述分析,并对结果作出说明。 操作步骤:1.输入数据,然后选择“分析”→“描述统计”→“描述”命令 在“描述性”对话框的左侧列表选择“人数f”,单击中间的右箭头,使之进入“变量”列表框。 2.选择“将标准化得分另存为变量”复选框。单击“描述性”对话框右上角的“选项”,然后选择“均值”,在“离散”选项组中选择“标准差”、“方差”、“范围”、“范围”、“最小值”、“最大值”、“均值的标准误差”复选框。在“分布”选项组选择“偏度”、“峰度”复选框。在“显示顺序”选项组中选择“变量列表”复选框。设置完毕后,单击“继续”,然后“确定”。 结果分析:如表,样本个数为8个,极差为7,最小值为2,最大值为9,均值为,均值的标准误差为,标准差为,方差为,偏度系数为,峰度系数为。 3.某项调查要研究城市居民居住年限的长短与对该地区百货公司熟悉程度之间的关系。随机调查266户居民,收集数据如下表: (1). 操作步骤:1.输入数据,对“熟悉程度”变量用“1”表示“不熟悉”,用“2”表示“熟悉”;对“居住时间”变量用“1”表示“小于13年”,用“2”表示“13-30年”,用“3”表示“30年以上”,如图: 2.对数据进行预处理,以计数变量对升学变量进行加权。选择“数据”→“加权个案”,在“加权个案”对话框中选中“加权个案”,然后在左侧的列表框中选中“计数”,单击中间右箭头,使之进入“频率变量”列表框。单击确定,完成数据预处理。 3.选择“分析”→“描述统计”→“交叉表”命令,选择“熟悉程度”并单击中间右箭头使之进入列表框。最后选中“显示复式条形图” 选择检验统计量的计算方法。单击“精确”,选中“仅渐进法”,单击继续,返回交叉表。然后选择相关统计检验。单击“交叉表”对话框右侧的“统计量”,选中“卡方”复选框,用于检验“熟悉程度”与“居住时间”之间是否相关。返回然后单击“交叉表”对话框右侧的“格式”,选中“升序”,然后单击确定。 结果分析: 1.样本总值为266,没有缺失值。 2.列联表。如表所示,居住时间小于13年的人中,%的人熟悉程度为不熟悉,%的人熟悉程度为熟悉;居住时间为13-30年的人中,%的人熟悉程度为不熟悉,%的人熟悉程度为熟悉;30年以上的人中,%的人熟悉程度为不熟悉,%的人熟悉程度为熟悉。 卡方检验结果。 可以看出,卡方值为,自由度为2,双侧概率为.由于p值为,小于,可以认为熟悉程度与居住时间有显著关系。

文档评论(0)

153****0212 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档