第二篇 资料整理.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二章 资料整理 第一节 几个常用术语 一、总体 总体:指根据试验目的确定、符合指定条件的全部观察对象。总体中的每一个成员称为个体。 构成总体的个体数称为总体容量()。根据总体容量的大小,一般可将总体分为有限总体和无限总体两大类。 对总体的全部个体进行观察测定所获得的总体特征数,称为总体参数,主要由两个指标,即总体平均数()和总体方差()。 参数是反映总体规律性的数值,科学试验的目的在于对总体参数的了解和把握。但对于无限总体由于个体数无穷而不可能直接获得总体参数;对于有限总体也常由于个体数太多或由于破坏性试验而难以对每一个个体都进行调查分析。因此,在统计学上需通过对总体的一部分个体进行观察测定从而了解总体的特征和规律性。 二、样本 样本:指从总体中按一定的方法所抽取出来的一部分个体。一个样本所包含的个体数称为样本容(含)量(),的样本称为大样本,而的样本称为小样本。 对一个样本的全部个体进行观察测定所获得的样本特征数,称为样本统计数,主要有两个指标,即样本平均数()和样本方差(,又称均方)。 统计分析的核心在于由样本统计数推断总体参数,因此获取样本仅仅是一种手段,而推断总体才是真正目的。 从总体中按一定方法抽取个体组成样本的过程称为抽样(取样),达到通过样本准确推断总体的特征,抽样必须要注意以下三个问题: 1. 总体要真实。 2. 抽样要随机。 3. 样本容量要适当。 三、变数 观察值:对每一个个体的某一性状通过观察测定所获得的数值。 变 数:同一性状全部观察值的集合。 变 量:变数中的每一个成员,即变量的具体数值就是观察值。 根据变数的来源和性质,可以将资料分为数量性状资料和质量性状资料。 1. 数量性状资料 指用工具测量、度量、称量、分析化验或计数的方法所获得的数据资料,可以直接用数字表示。根据数据获取的方式和性质的不同,又可分为: 1.1 连续性变数资料(计量资料) 由测量、度量、称量、分析化验等方式获得。各个观察值并不限于整数,在相邻的两个变量之间,随着测试工具精度的提高,还会有其它数值存在,如产量、株高、Vc含量等。 1.2 间断性变数资料(计数资料) 又称不连续性变数资料,由计数的方法获得,其变量分布仅限于非负整数,如植株数、结果数、开花数。 2. 质量性状资料 质量性状指只能观察描述而不能量测的性状,如果色、花色等。质量性状资料是指只能用文字描述而不能直接用数字表示大小的资料,但可以通过赋值(给分)法或统计次数法来获得这类性状的数量资料进行间接表示,结果类似间断性变数。 第二节 数量性状变数资料的整理 一、次数分布表 对观察值较多的原始数据要求通过一定的方法加以整理,以便分析整个资料的集中性和变异情况,从而对资料得到一个初步的认识和了解。 在资料的初步整理中,最常用的方法是制作次数分布表。操作步骤如下: 1. 排序 将原始数据按从大到小或从小到大的次序排列成依次表。 2. 求极差 即资料中最大值与最小值之差(),表示整个资料的变异幅度,为下一步的分组提供依据。 3.分组 3.1 确定组数 根据极差的大小和观察值个数的多少来确定组数。观察值个数与分组时组数之间的关系如教材。 确定组数的原则是即要便于计算,同时又能反映出整个资料的集中性和变异情况。 3.2 确定组距(i) 组距是指相邻两组间数据差距的大小。,然后取整数。 4. 确定组限和组中值 组限是各组的变异范围,即各组的上下限度。在各组中的最小值称该组的下限,最大值则称该组的的上限。 确定组限最关键的是确定第一组的下限,当第一组的下限加上组距就可以得到第一组的上限(也就是第二组的下限),再加上组距就可以得到第二组的上限和第三组的下限,其余依此类推,即可完成。 第一组下限确定的原则是:第一组的下限不应该由原始资料的最小值开始,但原始资料的最小值又必须包含在第一组之内,在确定第一组的下限时,可以用原始资料最小值减去组距的一半作为下限。各组上下限的平均值即为该组组中值,作为这一组变量的平均数的代表值。 5.资料归组 将各个观察值用划记号的方法逐个归入相应的组内,并统计次数,制成资料分布表。 为了更详细地了解各组次数分布的情况,还应计算各组的相对次数和累积次数。 次数分布表中各组次数分布应该近似于正态分布。 质量性状资料的次数分布表制作比较简单,先根据性状表现进行分级,然后直接统计各级的次数即可。 特别强调:当前统计表一般要求用“三线表”,同时完整的表格必须包含表序、表题和表格三个部分,并且缺一不可。表序和表题一般位于表格上方中间位置。 二、次数分布图 除了用次数分布表来表示试验资料的分布情况外,还可以依据次数分布表绘制成次数

文档评论(0)

xuefei111 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档