- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据资料的整理与特征数
2 数据资料的整理与特征数 1 数理统计中的常用术语 1.1 总体与样本 总体:根据研究目的确定的研究对象的全体称为总体(population); 个体:总体中的每一个研究单位称为个体(individual); 样本: 依据一定方法由总体中抽取部分个体所组成的集合称为样本(sample); 有限总体:含有有限个个体的总体称为有限总体; 无限总体:包含有无限多个个体的总体称为无限总体; 样本容量:样本中所包含的个体数目叫样本容量或大小(sample size),样本容量常记为n。通常把n≤30的样本叫小样本,n 30的样本叫大样本。 试验研究的目的:了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。 为了能可靠地从样本来推断总体,要求样本具有一定的含量和代表性。 如何获取有代表性的样本?采用随机抽取。 所谓随机抽取(random sampling) 是指总体中的每一个个体都有同等的机会被抽取到样本中。 样本毕竟只是总体的一部分,尽管样本具有一定的含量也具有代表性,通过样本来推断总体也不可能是百分之百的正确。有很大的可靠性但有一定的错误率这是统计分析的特点。 1.2 参数与统计量 为了表示总体和样本的数量特征,需要计算特征数。 参数:由总体计算的特征数叫参数(parameter);常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差; 统计量:由样本计算的特征数叫统计量(staistic)。常用拉丁字母表示统计量,例如用 表 示样本平均数,用s表示样本标准差,用R表示极差。 总体参数由相应的统计量来估计,例如用 估计μ,用S估计σ等。 1.3 准确性与精确性 准确性(accuracy)也叫准确度,指观测值与其真值的接近程度。设某一试验指标或性状的真值为μ,观测值为 x,若 x与μ相差的绝对值|x-μ|越小, 则观测值x的准确性越高; 反之则低。 精确性(precision)也叫精确度,指同一试验指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,即任意二个观测值xi 、xj 相差的绝对值|xi -xj |越小,则观测值精确性越高;反之则低。准确性、精确性的意义见图2-1。 正确地进行试验数据资料的分类是统计资料整理的前提。在调查或试验中,由观察、测量所得的数据资料按其性质的不同,一般可以分为数量性状资料、 质量性状资料和半定量(等级)资料三大类。 数量性状(quantitative character)是指能够以测量、计量或计数的方式表示其特征的性状 。观察测定数量性状而获得的数据就是数量性状资料 数量性状资料的获得有测量和计数两种方式 ,因而数量性状资料 又分为计量资料和计数资料两种。 用测量方式获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数量性状资料。其数据是用长度、容积、重量等来表示。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定 , 它们之间的变异是连续性的。因此,计量资料也称为连续性变异资料。 2.1.2 计数资料 指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连续性变异资料或间断性变异资料。 2.2 质量性状资料 质量性状(qualitative character)是指能观察到而不能直接测量的,只能用文字来描述其特征的性状,如食品颜色、 风味等等。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种: 2.2.1 统计次数法 在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,苹果中全红果个数与半红果个数。 由质量性状数量化而得来的资料又叫 次数资料。 三种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。 例如,酸奶中的乳杆菌总数得到的资料属于计数资料,根据化验的目的,可按乳杆菌总数正常或不正常分为两组,清点各组的次数,计数资料就转化为质量性状次数资料;如
文档评论(0)