- 1、本文档共65页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 样本数据特
第3章 样本数据特征的初步分析 《管理统计学》 谢湘生 广东工业大学管理学院 提示 如何将你收集的数据中的信息概括或集中,并进行描述 3.1 样本数据结构的基本特征:频次与频率 3.1.1 频次与频率的基本概念 例 3.1.1 例 3.1.2 例 3.1.3 3.1.2 观察样本数据基本特征(频次和频率)的图形方法 1. 表示频次和频率的饼图(Pie Chart) 2. 表示频次和频率的条形图 3.1.3 样本数据集合的基本特征的延伸:累积频率(Cumulative Percentage) 1.累积频率的概念与表格表示 软件的使用 对于非数字表示的数据用Excel不能得到频次频率表和相应的图形,但用SPSS可以直接得到频次频率表,并作出饼图或条形图。 3.2 观察刻度级样本数据结构的茎叶图与直方图方法 3.2.1茎叶图(Stem-and Leaf Plot)的概念与作法 1. 茎叶图的基本概念与适用范围 2.茎叶图的基本作法 (1)依据样本数据集合中数字的大小,确定“茎”的数字位和“叶”的数字位; (2)把样本数据集合中的所有样本数据,分成“茎节”、“叶”两部分; (3)把样本数据集合中的所有“茎节”,从小到大,从上到下纵向排列,并在“茎节”后标出小数点,小数点纵向对齐; (4)依次将数据集合中的所有“茎节”相同的数据取出来,把这些数据的“叶”,按从小到大的顺序,排列在这个“茎节”后小数点的右边,直到这个样本数据集合中的所有数据处理完。 例 3.2.1 3.2.2 直方图(Histogram)的概念与作法 1 直方图的基本概念与适用范围 2. 数据分组 确定分组区间长度的方法 确定分组区间起点位置的方法 关于直方图的几个概念 Excel的直方图 R语言中的直方图 SAS中的直方图 3.3 样本数据的位置特征:对数据中心的描述 样本数据集合的另一重要特征,就是样本数据集合中心所处的位置,它在一定程度上反映了样本集合的位置。样本数据集合中心通常用下面三个概念刻画。 样本中位数 样本众数 样本均值 3.3.1 样本众数(Sample Mode) 样本众数的定义1及例子 样本众数定义2及例子 3.3.2 样本中位数(Sample median) 3.3.3 样本均值(Sample Mean) 均值、中位数与众数的区别 3.4 样本数据的离散特征 3.4.1 对样本数据的离散特征的点状描述:极值、四分点和百分位点 1. 极大值(maximum)与极小值(minimum) 2. 下四分点(Lower Quartile)与上四分点(Upper Quartile) 3. 上、下百分位点(Percentile) 3.4.2 对样本数据离散特征的区间描述:极差、四分位距与离差 2. 四分位距(Interquartile Range) 3.4.3 离散状况的统计描述:样本方差(Sample Variance) 补充:斜度(Skewness) 补充:峰度(Kurtosis) 3.5 样本数据特征的综合表述: 箱形图 箱形图的基本构造 修正的箱形图 箱形图的例子1 箱形图的例子2 1 3 5 6 4 2 1 组频次 1 1, 1, 1 2, 1, 1, 1 2, 2, 2 1, 1, 1, 1 1, 1 1 频次 190 183, 185, 186 178, 180, 181, 182 175, 176, 177 168, 170, 171, 172 163, 165 160. 身高 [187.5,192.5) [182.5,187.5) [177.5, 182.5) [172.5,177.5) [167.5, 172.5) [162.5,167.5) (157.5, 162.5) 组界 组7 组6 组5 组4 组3 组2 组1 组别 绘直方图: (1)在横轴上,从小到大依次标出分组区间的边界; (2)沿纵轴方向,依据各区间的组频次或组频率的大小,分别绘制不同高度的矩形。 身高频次条形图 身高频次直方图 样本众数的定义1: 样本数据集合中出现频次最高的那个样本值,称为样本众数,简称为众数。 按此定义,对给定的样本数据集合,样本众数可能不唯一。若样本众数是唯一的,称为单一众数,否则称为复众数。 例如 某单位职工受教育程度的结构为(顺序级数据) 则对应的样本数据集合的众数为“大学”。 家具基色调出现的频次(名义级数据) 则对应的样本数据集合的众数为“Y(即淡黄褐色)”。 某商品价格出现的频次(刻度级数据) 对应的样本数据集合的众数为9.99、10.00和10.01(复众数) 样本众数的定义2:对刻度级的样本数据集合,其直方图中,最高的矩形(即直方图中的峰peak)对应的数据区间,称为该数据集合的众数区间,简称为众数。 如右图表示的数据集合的众数
您可能关注的文档
最近下载
- 2025年二建《建设工程施工管理》精选考点汇总.pdf VIP
- 出口扫描系列·变局篇:找寻出口商品的“稳定之星”.pdf VIP
- 开关站10kV开关柜检修试验标准化作业指导书1.pdf
- 2023年江西机电职业技术学院高职单招语文/数学/英语考试题库答案详解.docx
- 人教版高中数学必修五1.1.1《正弦定理》教学课件1 (共13张PPT).ppt VIP
- GB_T 15114-2023 铝合金压铸件.docx
- 2024年度组织生活会支部班子对照检查材料.doc VIP
- 5.1+人要自强+课件-+2024-2025学年统编版道德与法治七年级下册.pptx VIP
- 弱电系统维保方案(三篇).pdf VIP
- 义务教育劳动课程标准(2022年版).pdf
文档评论(0)