- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用生物统计第七章 实验设计
第七章 实验设计 7.1 实验设计的基本原理及应注意的事项 误差的产生与控制 误差的种类:随机误差、系统误差、差错 误差的表示 误差控制 保证实验材料的均一性及实验环境的稳定性 统一操作程序,进行必要培训 注意尽量消除系统误差 设置必要数量的重复 目的:分离误差,提高精度 重复数估计:将所需检验的差异大小L视为95%置信区间宽度的一半,代入公式,求出所需重复数n。 样本随机化 目的:保证样本独立性,减少系统误差。 设置适当对照 阴性对照:消除假阳性 阳性对照:消除假阴性 7.2 抽样方法简介 有限总体的抽样 定理:有限总体随机抽样得到的样本均值与样本方差S2分别为总体均值μ及总体方差σ2的无偏估计。其样本均值的方差为: 分层随机抽样 若在抽样前对所要研究的总体就有一些了解,则可按照尽可能保证亚总体均一性的原则进行划分,然后对每个亚总体分别进行抽样。这种方法就称为分层抽样。 方法:比例分配与最优分配 分级抽样 同样由于均一性,总体仍然要被分为一些亚总体 。在分级抽样中,先随机抽取一些亚总体,然后再从每个抽中的亚总体中进一步随机抽取一些个体组成样本。这种在不同级别上进行多次抽样的方法就称为分级抽样。 序贯抽样 思路:统计量落在分位数附近时才易发生判断错误。因此只有远离分位数时才做出判断,否则就继续增加样本含量。 需解决的问题: 构造适当的统计量,并确定计算两个阈值的公式; 证明这种抽样过程一定会终止; 证明这一抽过程所需的总样本容量比同样精度的固定容量抽样要少。 序贯抽样统计量的构造:似然比 定义 设总体X的分布依赖于某个参数θ。以函数f(x,θ)表示它的分布密度或概率分布,以(x1, x2, …xn)表示从总体X中抽取的一个容量为n的样本的测量值。考虑对零假设:H0:θ=θ0和备择假设:HA:θ=θ1进行统计检验,令 则λn称为似然比;若有数k,使λn≤ k则接受H0,λn k则拒绝H0,那么这种统计检验就称为似然比检验。 序贯抽样阈值的选取 近似公式: 可以证明:?? + ?? ? ? + ? 序贯抽样的可行性与优越性 结论1:不论总体X有何种概率分布,只要采用似然比为统计量,且阈值A,B满足: 0 A 1, B 1, 则序贯抽样进行有限次就能作出判断的概率为1。 结论2:序贯抽样所需的总样本含量n实际是一个随机变量,相对于?,?相同的固定样本含量随机抽样所需样本数N,我们不能保证每次都有n N,但可证明n的数学期望约等于N/2。 几种常见分布序贯抽样公式的推导 二项分布 Poisson分布 正态分布 7.3 调查数据的收集与整理 特点:时空范围大,信息分散;必须获取大量数据,并进行适当统计处理。 统计调查:相对短暂的时间内,在较大范围内进行信息收集。 按考虑的时间范围可分为:现状调查、回顾调查、前瞻调查。 按工作进程可分为:计划阶段和实施阶段。 计划阶段:主要工作有: 明确目的,确定调查项目 设计调查表格 内容包括:一般项目和统计项目 遵循原则:全面性、明确性、客观性、可统计性 确定调查对象与调查范围 制定实施的程序和步骤 规定资料核实、整理、汇总的步骤 实施阶段:主要步骤有: 建立组织领导和技术领导班子 培训人员,统一方法,标准化用具 向调查对象开展适当宣传 严格按照程序和步骤实施调查 对资料进行整理与统计 登记调查:一般是长期持续的工作,时间越长价值越大。目的常是积累基础资料,常由政府机构负责完成。需注意: 登记内容的选择和登记表的设计 建立有效登记制度 建立有效核查制度 7.4 异常值的判断和处理 异常值的概念和处理原则 概念:异常值是指样本中的个别值,其数值明显偏离其余观测值。它可能是样本随机性的极端表现;也可能是条件、方法等变化或差错的结果。 处理原则:理论上应区别原因,前者保留,后者剔除。 剔除时一定要慎重,同时要有记录。最高剔除数量不得超过总数据量的10-15%。 每次只能剔除一个异常值。 判断和处理异常值的目的 识别与诊断 排除异常值,提高准确度 估计参数 检验假设 不同的目的影响方法的选择 若目的为识别,则应注重准确性,且应考虑犯两类错误的风险; 若目的为提高准确性,也可采用稳健的方法,甚至直接舍弃最大最小值。 正态样本异常值的判断和处理 标准差已知:Nair检验法 标准差未知: Grubbs检验法 Dixon检验法 峰度-偏度检验法 方法的比较: 只有一个异常值:最好用Grubbs法; 需重复使用:偏度-峰度法最好,但需要先确定为正态总体;Dixon法次之;一般不用Grubbs法。 指数样本异常值的判断和处理 单侧检
您可能关注的文档
最近下载
- 2024年北京市公务员考试面试真题(完整版) .pdf VIP
- 2024年度医院病理科医务人员述职报告课件.pptx
- 某高速服务区餐饮市场分析与可行方案.doc
- PCS7过程控制系统.pdf
- 2024继续教育公需课答案-法治建设与国家治理现代化.pdf VIP
- 七年级生物上册识图填空题精选 .pdf
- 日立电梯HGE-S型微机控制变压变频速乘客电梯随机资料.pdf
- 2024年黑龙江省大庆市中考语文试卷(附答案).docx VIP
- Do_Androids_Dream_of_Electric_Sheep_TEXT__英文原版.doc
- 2024年黑龙江省大庆市中考语文试卷(附参考答案).pdf VIP
文档评论(0)