第3章 样本数据特征的初步.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章样本数据特征的初步整理ppt

第3章 样本数据特征的初步分析 《管理统计学》 谢湘生 广东工业大学管理学院 提示 如何将你收集的数据中的信息概括或集中起来 3.1 样本数据结构的基本特征:频次与频率 3.1.1 频次与频率的基本概念 例 3.1.1 例 3.1.2 例 3.1.3 3.1.2 观察样本数据基本特征(频次和频率)的图形方法 1. 表示频次和频率的饼图(Pie Chart) 2. 表示频次和频率的条形图 3.1.3 样本数据集合的基本特征的延伸:累积频率(Cumulative Percentage) 1.累积频率的概念与表格表示 3.2 观察刻度级样本数据结构的茎叶图与直方图方法 3.2.1茎叶图(Stem-and Leaf Plot)的概念与作法 1. 茎叶图的基本概念与适用范围 2.茎叶图的基本作法 (1)依据样本数据集合中数字的大小,确定“茎”的数字位和“叶”的数字位; (2)把样本数据集合中的所有样本数据,分成“茎节”、“叶”两部分; (3)把样本数据集合中的所有“茎节”,从小到大,从上到下纵向排列,并在“茎节”后标出小数点,小数点纵向对齐; (4)依次将数据集合中的所有“茎节”相同的数据取出来,把这些数据的“叶”,按从小到大的顺序,排列在这个“茎节”后小数点的右边,直到这个样本数据集合中的所有数据处理完。 例 3.2.1 3.2.2 直方图(Histogram)的概念与作法 1 直方图的基本概念与适用范围 2. 数据分组 确定分组区间长度的方法 确定分组区间起点位置的方法 关于直方图的几个概念 Excel的直方图 R语言中的直方图 SAS中的直方图 3.3 样本数据的位置特征:对数据中心的描述 样本数据集合的另一重要特征,就是样本数据集合中心所处的位置,它在一定程度上反映了样本集合的位置。样本数据集合中心通常用下面三个概念刻画。 样本中位数 样本众数 样本均值 3.3.1 样本众数(Sample Mode) 样本众数的定义1及例子 样本众数定义2及例子 3.3.2 样本中位数(Sample median) 3.3.3 样本均值(Sample Mean) 均值、中位数与众数的区别 3.4 样本数据的离散特征 3.4.1 对样本数据的离散特征的点状描述:极值、四分点和百分位点 1. 极大值(maximum)与极小值(minimum) 2. 下四分点(Lower Quartile)与上四分点(Upper Quartile) 3. 上、下百分位点(Percentile) 3.4.2 对样本数据离散特征的区间描述:极差、四分位距与离差 2. 四分位距(Interquartile Range) 3.4.3 离散状况的统计描述:样本方差(Sample Variance) 补充:斜度(Skewness) 补充:峰度(Kurtosis) 3.5 样本数据特征的综合表述: 箱形图 箱形图的基本构造 修正的箱形图 箱形图的例子1 箱形图的例子2 身高频次条形图 身高频次直方图 样本众数的定义1: 样本数据集合中出现频次最高的那个样本值,称为样本众数,简称为众数。 按此定义,对给定的样本数据集合,样本众数可能不唯一。若样本众数是唯一的,称为单一众数,否则称为复众数。 例如 某单位职工受教育程度的结构为(顺序级数据) 则对应的样本数据集合的众数为“大学”。 家具基色调出现的频次(名义级数据) 则对应的样本数据集合的众数为“Y(即淡黄褐色)”。 某商品价格出现的频次(刻度级数据) 对应的样本数据集合的众数为9.99、10.00和10.01(复众数) 样本众数的定义2:对刻度级的样本数据集合,其直方图中,最高的矩形(即直方图中的峰peak)对应的数据区间,称为该数据集合的众数区间,简称为众数。 如右图表示的数据集合的众数区间为 175?2.5(厘米) 众数区间也有单一众数区间与复众数区间之分。 设对样本集合中所有数据的排序结果为x1 ? x2 ? … ? xn, n为样本容量,则在上述排序的序列中,处于“正中间位置”上的数据,称为样本中位数。 当样本数据集合中的所有数据排序后,正中间位置的数据即中位数Me按下式确定: 正中间位置: 数据集合(已经排序) 17.0 17.1 17.2 17.5 17.5 17.6 17.6 其中位数为Me=x4=17.5 数据集合(已经排序) 16.8 17.0 17.1 17.2 17.5 17.5 17.6 17.6 其中位数为 对名义级数据,不考虑中位数;对顺序级数据,只在样本容量n为奇数时,考虑中位数。 样本均值仅适合于刻度级数据。 样本数据集合的样本均值(又称为样本平均值),是把样本数据集合中所有数据加起来,然后再除以样本数据集合中样本个数(样本容量)所得

文档评论(0)

zyzsaa + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档