网站大量收购独家精品文档,联系QQ:2885784924

统计资料的整理与分析.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计资料的整理与分析 1 数理统计中的常用术语 1.1 总体与样本 总体:根据研究目的确定的研究对象的全体称为总体(population); 个体:总体中的每一个研究单位称为个体(individual); 样本: 依据一定方法由总体中抽取部分个体所组成的集合称为样本(sample); 有限总体:含有有限个个体的总体称为有限总体; 无限总体:包含有无限多个个体的总体称为无限总体; 样本容量:样本中所包含的个体数目叫样本容量或大小(sample size),样本容量常记为n。通常把n≤30的样本叫小样本,n 30的样本叫大样本。 试验研究的目的:了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。 为了能可靠地从样本来推断总体,要求样本具有一定的含量和代表性。 如何获取有代表性的样本?采用随机抽取。 所谓随机抽取(random sampling) 是指总体中的每一个个体都有同等的机会被抽取到样本中。 样本毕竟只是总体的一部分,尽管样本具有一定的含量也具有代表性,通过样本来推断总体也不可能是百分之百的正确。有很大的可靠性但有一定的错误率这是统计分析的特点。 1.2 参数与统计量 为了表示总体和样本的数量特征,需要计算特征数。 参数:由总体计算的特征数叫参数(parameter);常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差; 统计量:由样本计算的特征数叫统计量(staistic)。常用拉丁字母表示统计量,例如用 表 示样本平均数,用s表示样本标准差,用R表示极差。 总体参数由相应的统计量来估计,例如用 估计μ,用S估计σ等。 1.3 准确性与精确性 准确性(accuracy)也叫准确度,指观测值与其真值的接近程度。设某一试验指标或性状的真值为μ,观测值为 x,若 x与μ相差的绝对值|x-μ|越小, 则观测值x的准确性越高; 反之则低。 精确性(precision)也叫精确度,指同一试验指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,即任意二个观测值xi 、xj 相差的绝对值|xi -xj |越小,则观测值精确性越高;反之则低。准确性、精确性的意义见图2-1。 随机误差 也叫 抽样误差 (sampling error) , 是由于许多无法控制的内在和外在的偶然因素所造成的 。随机误差带有偶然性质,在试验中,即使十分小心的进行试验操作也难以消除。随机误差不可避免,但可减少。 随机误差影响试验的精确性。 统计上的试验误差是指随机误差。这种误差愈小,试验的精确性愈高。 系统误差 也叫 片面误差 (lopsided error), 这是 由于试验对象相差较大,测量的仪器不准 、 标准试剂未经校正,以及观测、记载、抄录、计算中的错误等等所引起。系统误差可以通过改进方法、正确试验设计来避免、消除。 系统误差影响试验的准确性。 正确地进行试验数据资料的分类是统计资料整理的前提。在调查或试验中,由观察、测量所得的数据资料按其性质的不同,一般可以分为数量性状资料、 质量性状资料和半定量(等级)资料三大类。 数量性状(quantitative character)是指能够以测量、计量或计数的方式表示其特征的性状 。观察测定数量性状而获得的数据就是数量性状资料 数量性状资料的获得有测量和计数两种方式 ,因而数量性状资料 又分为计量资料和计数资料两种。 用测量方式获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数量性状资料。其数据是用长度、容积、重量等来表示。这种资料的各个观测值不一定是整数,两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精度而定 , 它们之间的变异是连续性的。因此,计量资料也称为连续性变异资料。 2.1.2 计数资料 指用计数方式获得的数量性状资料。在这类资料中,它的各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现。这些观察值只能以整数来表示,各观察值是不连续的,因此该类资料也称为不连续性变异资料或间断性变异资料。 2.2 质量性状资料 质量性状(qualitative character)是指能观察到而不能直接测量的,只能用文字来描述其特征的性状,如食品颜色、 风味等等

文档评论(0)

seunk + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档