- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 资料的描述统计分析
通过试验或调查收集的原始数据资料,一般具有“大量”和“杂乱无章”的特点,不能直接考察其潜在的特征。所以首先要进行描述统计分析,使人们对资料特征有大致的了解。数据资料的描述统计分析包括资料整理和特征数计算两个内容。资料只有经过整理和计算特征数,才能从中提取有用的信息,系统地、准确地反映现象的特征和规律性。资料整理是对原始资料审核、分组、汇总、描述和归纳,使之条理化和便于统计分析和推断的形式的工作过程。
统计整理的主要内容:
(1)数据资料的审核与订正,主要是检查数据中是否有在记录和登记过程中的人为错误、是否有异常数据存在,如小数点错位、数字末尾少写或多写一个0等,有无由于测量仪器的系统偏差,保证数据的可靠性。
(2)统计数据的分组与汇总,以显示研究对象内部结构、类型和特征。
(3)由原始数据或汇总资料计算各种数据资料的数字特征。
(4)用统计表或统计图展示资料,以便通过简单形式直观反映资料的基本特征和变化趋势。
2.1异常数据的判断和处理
异常数据是指观察数据中存在的过大或过小的值。异常数据可能只是数据中内在随机变异性的一种极端表现,也可能是因为试验过程中出现的操作错误或条件改变所导致。对于前一种异常数据,必须予以保留并与其他数据一起参与统计分析过程。对于后一种数据,必须舍弃或修正。因此一个过大或过小的值是否为真的异常值,需要首先进行判断,判断的方法是进行测验。如果数据服从正态分布,检验的方法有格拉布斯(Grubbs)、奈尔、迭克生(Dixon)、平均绝对离差、标准误差检验等方法。这里主要介绍格拉布斯检验方法。
格拉布斯检验
格拉布斯检验用于总体方差未知的异常值检验,检验的统计量为T
或
式中是样本数据的平均数,S是样本标准差,x(1) 是样本内最小次序观察可疑极端值,x(n) 是样本内最大次序观察可疑极端值。
根据样本数据的个数以及显著性概率值,查格拉布斯去异常值数据的临界值表,得临界值,当最小值或最大值对应的统计量T大于临界值时,判断该值异常,剔除该值。剔除异常值后,需要对剩下的数据重新进行异常值检验,即重复进行以上过程,直到没有异常值为止。
表2.1 格拉布斯去异常值数据的临界值(TG)表
样本容量 显著水平 样本容量 显著水平 0.05 0.01 0.05 0.01 3 1.15 1.15 22 2.76 3.06 4 1.48 1.50 23 2.78 3.09 5 1.71 1.76 24 2.80 3.11 6 1.89 1.97 25 2.82 3.13 7 2.02 2.14 26 2.84 3.15 8 2.13 2.27 27 2.86 3.17 9 2.21 2.39 28 2.88 3.18 10 2.29 2.48 29 2.89 3.19 11 2.34 2.56 30 2.91 3.20 12 2.41 2.64 31 2.92 3.25 13 2.46 2.70 32 2.94 3.27 14 2.51 2.76 33 2.95 3.29 15 2.55 2.81 34 2.97 3.30 16 2.59 2.85 35 2.98 3.32 17 2.62 2.89 36 2.99 3.33 18 2.65 2.93 37 3.00 3.34 19 2.68 2.97 38 3.01 3.36 20 2.71 3.00 39 3.03 3.37 21 2.73 3.03 40 3.04 3.38
2.2 资料的分类
统计资料是指反应事物、现象或过程的数据资料,包括原始资料和次级资料。与一般资料相比,统计资料有如下特点:(1)数字性:一般资料有数字形式,也有文字形式,但统计资料都应是数字形式(或可转换为数字形式);(2)大量性:统计资料是大量相象或对同类相象观察所取得的数据资料,而不是个别相象的少量或个别数据;(3)具体性:统计资料是已经实现事实的记载,而不是拟议中的数据资料,故各种质量标准或技术规范等资料不是统计资料。
资料的分类是统计归纳的基础,根据资料的收集方法及数据的取值特性,通常可将资料分为以下类型。
2.2.1 连续性资料
连续性资料(continuous data)是指在一定范围内可取任何实数值的数据资料,例如动物个体的体重、奶牛的产奶量、羊的产毛量等指标(变量)进行测定所得到的数据,它们通常是用度量衡等计量工具测量后得到的,因而也称为计量资料。连续性资料的连续性受实际测定规模和测量工具精度的限制,实际得到的资料并不是完全连续的,也就是说这种连续性只是理论上的。
2.2.2 离散性资料
离散性资料(discrete data)是在一定范围内只取有限种可能值的数据资料。又可进一步分为
(1)计数资
您可能关注的文档
最近下载
- 课件:第五章 自由主义社会福利思想(《现代社会福利思想》课程).pdf VIP
- 第二课 美的本质和特征课件 --中职技校《美育》第四版.pptx VIP
- 二 1~6的表内除法(单元教学设计)苏教版 二年级上册数学2025版.pdf
- 2025春新人教版九年级化学下册《第九单元 溶液》大单元整体教学设计[2022课标].docx
- 美育——美即生活-1.1美的起源和发展-教案.doc VIP
- 教科版科学五年级上册 第一单元《光》大单元教学设计.pdf VIP
- 2025年最新交通局辅警招聘考试题库(附答案).docx VIP
- 全国地图-县级.pptx VIP
- 《规划与自然资源语料库建设导则》.docx VIP
- 幕墙工程幕墙施工专项方案.pdf VIP
文档评论(0)