统计学辅修第三章数据的描述.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2. 定量数据的分组 可以等距分组,也可以不等距分组; 组数不要太少(5个以上), 也不要太多(20个以下)。 不重不漏; 左开右闭 (ai, ai+1]; 组中值:(ai+ai+1)/2. 3. 定量数据的散点图 散点图由横坐标和纵坐标两个变量的取值来确定: 二维变量的每一组值由平面中的一个点来描述. 例如:美国不同年代男士(或女士)的初婚年龄: 可将不同年代作为横坐标, 初婚年龄作为纵坐标. 散点图的制作: 1)输入数据文件(例marriage.sav) ; 2)选择菜单“图形”中的 “散点图”选项, 3)在对话框中选择放置在 Y轴的变量名,和X轴的变量名; 4)点击“确定(OK)”即可。 散点图允许多个变量的图画在同一张图中. 一个变量的选简单散点图(Simple Scatter). 多个变量的选重叠散点图(Overlay Scatter). 4. 定量数据的序列图 序列图的形状为一条折线; 折线的高度(纵坐标)代表变量的值; 而横向的位置为这些值(数据)的自然排序. 序列图的制作 1)输入数据文件(例sales.sav) ; 2)选择菜单“图形(Graphs)”中的 “序列图(Sequence)”选项, 3)在对话框中选择所要画序列图的变量名, 4)点击“确定(OK)”即可。 制作序列图的注意点: 在对话框中“时间轴标签(Time Axis Labels)” 一般不用人为选择,SPSS软件自动设定其为数 据的序号,见 sales.sav 的例子。 制作序列图的注意点: 时间轴也可以由某个时间变量来确定,见marriage.sav 的例子。 序列图也允许多个变量的图画在同一张图中。 §3.2 数据的数字特征描述 数据的数字特征描述就是借助某些公式,对数据(样本)进行运算,以此得到一些的量来描述数据某方面的性质。 数据的特征量 分布的形状 集中趋势 离散程度 众数 中位数 均值 变异系数 方差,标准差 全距(极差) 左偏、右偏 钟形对称 数据的位置特征 位置特征是描述数据相对的位置, 常用的位置特征量有: 均值、中位数、众数。 平均数(均值) 一组数据的“中心点”; 最常用的测量值; 用于数值型数据,不能用于定性数据。 平均数(均值)的计算公式 平均数的Excel计算 200个圆筒的内径数据放在A列的第1至第200个单元格上,然后在任意一个单元格上输入平均数函数名 “=average(a1:a200)”, 则显示 45.2915 推销员每获得一份订单平均需向顾客提出4.6次成交要求; 把一个包裹送到一个陌生人那里去,平均经过6个人的手; 上海市平均每个家庭有多少人? 年份 1950 1960 1970 1980 1990 2000 2010 人数 4.6 4.5 4.2 3.8 3.1 2.8 2.49 某路口早高峰时,一个绿灯2分10秒能通过250辆车,若有人闯红灯,最多通行120辆。 平均数有什么不足之处? 平均数受极端数据的影响大 2000年江苏省农民人均年纯收入增长了2.9%。 2000年江苏农民减收户达60%,平收和增收的农户只占1/3强。 中位数 (Me) 中位数是将数据按递增的顺序排列后位于中间的数值。 在中位数左边有一半的数; 在中位数右边有一半的数。 Me 50% 50% 假设有 n个数据:x1, x2,…, xn 。 首先将它们按由小到大的次序排列。 n为奇数,中间那个数为中位数; n为偶数,中间两个数的平均为中位数。 上海市人口年龄中位数 上海居民的年龄中位数 1964年 19.4?岁 1982年 29.2 岁 1990年 33.9 岁 2000年 37.6 岁 2010年 36.0岁 众数(Mo) 众数:数据中出现次数最高的数据值。 在“最喜欢喝哪一种饮料”的例子中, “可口可乐”的频数最高,因而“可口可乐”是众数。 男性:“可口可乐”是众数; 女性:“杏仁露 ”是众数. 众数 内在因素 事故数 频率(%) 察觉得晚 1191 59.6 判断失误 697 34.8 驾驶错误 96 4.8 其 他 19 0.8 合 计 2000 100.0 “察觉得晚”和“判断失误”共占94.4%。 交通事故驾驶过程因素分析 Mo=不满意 某城市家庭对住房状况评价的频数分布 回答类别 某城市 户数 (户)

文档评论(0)

178****4446 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档