第二章 统计数据的收集与整理.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 统计数据的收集与整理 第一节 总体与样本(1) 变数(Variable):对某一性状考察得到的所有数据的集合(X,Y)。 变量(Variate):变数中各个具体的值为变量,又称为观察值(Observation)(x1,x2,……)。 总体(Population):由共同性质的个体组成的集合。 有限总体(finite population): 我国18岁男青年的身高 无限总体(infinite population): 新生儿的体重 第一节 总体与样本(3) 7. 样本容量(Sample size or capacity, n):样本中包含的观察值的数目。 第二节 数据类型和频数(率)分布 一、资料的性质(1) (一)数量性状的资料- (Quantitative variables) 连续性变数(continuous variable = measurement data):在任两个观察值之间都可能出现只有微量差异的第三个观察值的一类变数。 非整数,与某种标准比较,可提高精确度(变小数) 对其分析的方法为变量的方法(method of variable). 例:长度(株高),时间,重量 一、资料的性质(2) 间断性变数(discontinuous variable)又称离散型数据或计数数据(discrete data or count data):观察值一般只能取整数的一类变数。 对其分析的方法为属性的方法(method of attribute). 整数,不能细分,不能提高精确度 例:细胞数,种子粒数,每胎仔数 一、资料的性质(3) (二)质量性状的资料(Categorical data): 只能观察,不能度量的资料。 质量性状数量化的方法: 1) 0,1表示 2) 计数 二、次(频)数分布 变数的频(次)数分布: 由不同区间内观察值出现的次数组成的分布。 简称频(次)数分布(frequency distribution) (一) 频(次)数分布表 将频(次)数分布做成表格的形式。简称频(次)数表。 1. 连续性变数的次数分布表 次数分布表的制作步骤(1) 1) 求得极差(range)R: R的定义为: R=max(X) — min(X) 表1-2资料,p4 R= 170 - 140 = 30 次数分布表的制作步骤(2) 2)确定组数和组距: 组数(K) :指准备将变数出现的整个数量范围分成多少个组区间. 组距(i):指每个组区间的高限和低限之差,即组区间极差。 记作:i的近似值为: R/(K一1)(但应取舍成整数或位数较少的小数,以求其简) 次数分布表的制作步骤(2) 附表 样本容量和组数(盖本,p.38) 观察值数目(n) 分组数目 50 5-10 100 8-16 10-20 12-24 500 15-30 1000 20-40? 次数分布表的制作步骤(2) 表1-2资料,p4 k=11 i=30/(11-1)=3 次数分布表的制作步骤(3) 确定第一组的组界(L1,U1)和组中值(m1) 第一组区间:数值最小的组区间。 在确定其低限L1时应注意: ①L1应小于最小的观察值,并使L1十(1/2)i(即最小组的组值)和最小的观察值接近; ②L1十(1/2)i应是一个数字位数较少、便于计算的值。 次数分布表的制作步骤(3) 表1-2资料,p4 L1=Min(X)-i/2 =140 - 3/2=138.5 U1=Min (X)+i/2 =140+3/2=141.5 m1 =(L1+U1)/2= Min(X) =140 次数分布表的制作步骤(4) 4)写出组区间的数列: 从L1开始,加上一个组距i,就可列出第一组的组区间;继续加上一个个组距,就可列出整个数量范围的各个组界区间,成为组界区间数列,或叫分组数列(由各组的组界组成)。 一般组界(分组数列)都要遵守三个原则(1) ①? 互斥:即各个组界的数量范围要互相排斥,一个观察值只能列入一个组内,不能模棱两可。 即:[Li,Ui) 一般的分组数列都要遵守三个原则(2) ②完全:即分组数列必须将全部观察值皆包括进去(但又要尽可能避免使用低限或高限不明确的组界)。 ? ③一致:即同一分组数列的各组组距一般都应取同一值。 次数分布表的制作步骤(4) 表1-2资料,p4 L

文档评论(0)

锦绣中华 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档