网站大量收购独家精品文档,联系QQ:2885784924

第3章 样本数据特.ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 样本数据特

第3章 样本数据特征的初步分析 《管理统计学》 谢湘生 广东工业大学管理学院 提示 如何将你收集的数据中的信息概括或集中,并进行描述 3.1 样本数据结构的基本特征:频次与频率 3.1.1 频次与频率的基本概念 例 3.1.1 例 3.1.2 例 3.1.3 3.1.2 观察样本数据基本特征(频次和频率)的图形方法 1. 表示频次和频率的饼图(Pie Chart) 2. 表示频次和频率的条形图 3.1.3 样本数据集合的基本特征的延伸:累积频率(Cumulative Percentage) 1.累积频率的概念与表格表示 软件的使用 对于非数字表示的数据用Excel不能得到频次频率表和相应的图形,但用SPSS可以直接得到频次频率表,并作出饼图或条形图。 3.2 观察刻度级样本数据结构的茎叶图与直方图方法 3.2.1茎叶图(Stem-and Leaf Plot)的概念与作法 1. 茎叶图的基本概念与适用范围 2.茎叶图的基本作法 (1)依据样本数据集合中数字的大小,确定“茎”的数字位和“叶”的数字位; (2)把样本数据集合中的所有样本数据,分成“茎节”、“叶”两部分; (3)把样本数据集合中的所有“茎节”,从小到大,从上到下纵向排列,并在“茎节”后标出小数点,小数点纵向对齐; (4)依次将数据集合中的所有“茎节”相同的数据取出来,把这些数据的“叶”,按从小到大的顺序,排列在这个“茎节”后小数点的右边,直到这个样本数据集合中的所有数据处理完。 例 3.2.1 3.2.2 直方图(Histogram)的概念与作法 1 直方图的基本概念与适用范围 2. 数据分组 确定分组区间长度的方法 确定分组区间起点位置的方法 关于直方图的几个概念 Excel的直方图 R语言中的直方图 SAS中的直方图 3.3 样本数据的位置特征:对数据中心的描述 样本数据集合的另一重要特征,就是样本数据集合中心所处的位置,它在一定程度上反映了样本集合的位置。样本数据集合中心通常用下面三个概念刻画。 样本中位数 样本众数 样本均值 3.3.1 样本众数(Sample Mode) 样本众数的定义1及例子 样本众数定义2及例子 3.3.2 样本中位数(Sample median) 3.3.3 样本均值(Sample Mean) 均值、中位数与众数的区别 3.4 样本数据的离散特征 3.4.1 对样本数据的离散特征的点状描述:极值、四分点和百分位点 1. 极大值(maximum)与极小值(minimum) 2. 下四分点(Lower Quartile)与上四分点(Upper Quartile) 3. 上、下百分位点(Percentile) 3.4.2 对样本数据离散特征的区间描述:极差、四分位距与离差 2. 四分位距(Interquartile Range) 3.4.3 离散状况的统计描述:样本方差(Sample Variance) 补充:斜度(Skewness) 补充:峰度(Kurtosis) 3.5 样本数据特征的综合表述: 箱形图 箱形图的基本构造 修正的箱形图 箱形图的例子1 箱形图的例子2 1 3 5 6 4 2 1 组频次 1 1, 1, 1 2, 1, 1, 1 2, 2, 2 1, 1, 1, 1 1, 1 1 频次 190 183, 185, 186 178, 180, 181, 182 175, 176, 177 168, 170, 171, 172 163, 165 160. 身高 [187.5,192.5) [182.5,187.5) [177.5, 182.5) [172.5,177.5) [167.5, 172.5) [162.5,167.5) (157.5, 162.5) 组界 组7 组6 组5 组4 组3 组2 组1 组别 绘直方图: (1)在横轴上,从小到大依次标出分组区间的边界; (2)沿纵轴方向,依据各区间的组频次或组频率的大小,分别绘制不同高度的矩形。 身高频次条形图 身高频次直方图 样本众数的定义1: 样本数据集合中出现频次最高的那个样本值,称为样本众数,简称为众数。 按此定义,对给定的样本数据集合,样本众数可能不唯一。若样本众数是唯一的,称为单一众数,否则称为复众数。 例如 某单位职工受教育程度的结构为(顺序级数据) 则对应的样本数据集合的众数为“大学”。 家具基色调出现的频次(名义级数据) 则对应的样本数据集合的众数为“Y(即淡黄褐色)”。 某商品价格出现的频次(刻度级数据) 对应的样本数据集合的众数为9.99、10.00和10.01(复众数) 样本众数的定义2:对刻度级的样本数据集合,其直方图中,最高的矩形(即直方图中的峰peak)对应的数据区间,称为该数据集合的众数区间,简称为众数。 如右图表示的数据集合的众数

文档评论(0)

ranfand + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档