网站大量收购闲置独家精品文档,联系QQ:2885784924

实用生物统计第七章 实验设计.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用生物统计第七章 实验设计

第七章 实验设计 7.1 实验设计的基本原理 及应注意的事项 误差的产生与控制 误差的种类:随机误差、系统误差、差错 误差的表示 误差控制 保证实验材料的均一性及实验环境的稳定性 统一操作程序,进行必要培训 注意尽量消除系统误差 设置必要数量的重复 目的:分离误差,提高精度 重复数估计:将所需检验的差异大小L视为95%置信区间宽度的一半,代入公式,求出所需重复数n。 样本随机化 目的:保证样本独立性,减少系统误差。 设置适当对照 阴性对照:消除假阳性 阳性对照:消除假阴性 7.2 抽样方法简介 有限总体的抽样 定理:有限总体随机抽样得到的样本均值与样本方差S2分别为总体均值μ及总体方差σ2的无偏估计。其样本均值的方差为: 分层随机抽样 若在抽样前对所要研究的总体就有一些了解,则可按照尽可能保证亚总体均一性的原则进行划分,然后对每个亚总体分别进行抽样。这种方法就称为分层抽样。 方法:比例分配与最优分配 分级抽样 同样由于均一性,总体仍然要被分为一些亚总体 。在分级抽样中,先随机抽取一些亚总体,然后再从每个抽中的亚总体中进一步随机抽取一些个体组成样本。这种在不同级别上进行多次抽样的方法就称为分级抽样。 序贯抽样 思路:统计量落在分位数附近时才易发生判断错误。因此只有远离分位数时才做出判断,否则就继续增加样本含量。 需解决的问题: 构造适当的统计量,并确定计算两个阈值的公式; 证明这种抽样过程一定会终止; 证明这一抽过程所需的总样本容量比同样精度的固定容量抽样要少。 序贯抽样统计量的构造:似然比 定义 设总体X的分布依赖于某个参数θ。以函数f(x,θ)表示它的分布密度或概率分布,以(x1, x2, …xn)表示从总体X中抽取的一个容量为n的样本的测量值。考虑对零假设:H0:θ=θ0和备择假设:HA:θ=θ1进行统计检验,令 则λn称为似然比;若有数k,使λn≤ k则接受H0,λn k则拒绝H0,那么这种统计检验就称为似然比检验。 序贯抽样阈值的选取 近似公式: 可以证明:?? + ?? ? ? + ? 序贯抽样的可行性与优越性 结论1:不论总体X有何种概率分布,只要采用似然比为统计量,且阈值A,B满足: 0 A 1, B 1, 则序贯抽样进行有限次就能作出判断的概率为1。 结论2:序贯抽样所需的总样本含量n实际是一个随机变量,相对于?,?相同的固定样本含量随机抽样所需样本数N,我们不能保证每次都有n N,但可证明n的数学期望约等于N/2。 几种常见分布序贯抽样公式的推导 二项分布 Poisson分布 正态分布 7.3 调查数据的收集与整理 特点:时空范围大,信息分散;必须获取大量数据,并进行适当统计处理。 统计调查:相对短暂的时间内,在较大范围内进行信息收集。 按考虑的时间范围可分为:现状调查、回顾调查、前瞻调查。 按工作进程可分为:计划阶段和实施阶段。 计划阶段:主要工作有: 明确目的,确定调查项目 设计调查表格 内容包括:一般项目和统计项目 遵循原则:全面性、明确性、客观性、可统计性 确定调查对象与调查范围 制定实施的程序和步骤 规定资料核实、整理、汇总的步骤 实施阶段:主要步骤有: 建立组织领导和技术领导班子 培训人员,统一方法,标准化用具 向调查对象开展适当宣传 严格按照程序和步骤实施调查 对资料进行整理与统计 登记调查:一般是长期持续的工作,时间越长价值越大。目的常是积累基础资料,常由政府机构负责完成。需注意: 登记内容的选择和登记表的设计 建立有效登记制度 建立有效核查制度 7.4 异常值的判断和处理 异常值的概念和处理原则 概念:异常值是指样本中的个别值,其数值明显偏离其余观测值。它可能是样本随机性的极端表现;也可能是条件、方法等变化或差错的结果。 处理原则:理论上应区别原因,前者保留,后者剔除。 剔除时一定要慎重,同时要有记录。最高剔除数量不得超过总数据量的10-15%。 每次只能剔除一个异常值。 判断和处理异常值的目的 识别与诊断 排除异常值,提高准确度 估计参数 检验假设 不同的目的影响方法的选择 若目的为识别,则应注重准确性,且应考虑犯两类错误的风险; 若目的为提高准确性,也可采用稳健的方法,甚至直接舍弃最大最小值。 正态样本异常值的判断和处理 标准差已知:Nair检验法 标准差未知: Grubbs检验法 Dixon检验法 峰度-偏度检验法 方法的比较: 只有一个异常值:最好用Grubbs法; 需重复使用:偏度-峰度法最好,但需要先确定为正态总体;Dixon法次之;一般不用Grubbs法。 指数样本异常值的判断和处理 单侧检

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档