- 1、本文档共130页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计推断:由样本信息推断总体特征。 见P34~36表3-1 1、抽样误差: 由个体变异产生的、抽样造成的样本统计量与总体参数的差别 均数的抽样误差:由于抽样造成的样本均数与总体均数的差别 原因:1)抽样 2)个体差异 t分布概述 抽样误差的分布规律 ↓ 样本 → 总体 ↑ t分布 理论 ↑ 手段 (桥梁) 目的 总体均数可信区间的计算 需考虑: (1)总体标准差?是否已知, (2)样本含量n的大小 通常有两类方法: (1)t分布法 (2)u分布法 1. 95%的可信区间的理解: (1)所要估计的总体参数有95%的可能在我们所估计的可信区间内。 (2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的可信区间,平均约有95个可信区间包含了总体均数 。 (3)但在实际工作中,只能根据一次试验结果估计可信区间,我们就认为该区间包含了总体均数?。 2.可信区间的两个要素 (1)准确度:用可信度(1??)表示:即区间包含总体均数?的理论概率大小 。 当然它愈接近1愈好,如99%的可信区间比95%的可信区间要好 。 (2)精确度:即区间的宽度 区间愈窄愈好,如95%的可信区间比99%的可信区间要好 。 当n确定时,上述两者互相矛盾。 提高准确度(可信度),则精确度降低 (可信区间会变宽),势必降低可信区间的实际应用价值,故不能笼统认为99%可信区间比95%可信区间要好。 相反,在实际应用中,95%可信区间更为常用。 在可信度确定的情况下,增加样本含量可减小区间宽度,提高精确度。 对于大样本,也可以近似用u检验。 t检验和u检验的应用条件: 1. t检验应用条件: 样本含量n较小时(如n60) (1)正态分布 (2)方差齐性(homogeneity of variance) 2. u 检验应用条件: 样本含量n较大,或n虽小但总体标准差已知 (1)正态分布 (2)方差齐性(homogeneity of variance) 例3-5 某医生测量了36名从事铅作业男性工人的血红蛋白含量,算得其均数为130.83g/L,标准差为25.74g/L。问从事铅作业工人的血红蛋白是否不同于正常成年男性平均值140g/L? 130.83g/L ≠140g/L 原因: 1.可能是总体均数不同 2.是抽样造成的 一、单样本 t 检验 (one sample / group t-test) 即样本均数 (代表未知总体均数?)与已知总体均数?0(一般为理论值、标准值或经过大量观察所得稳定值等)的比较。其检验统计量按下式计算 例3-6 为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,某人随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-3第(1)~(3)栏。问两法测定结果是否不同? ???? 第五节 假设检验注意事项 一、I型错误和II型错误 假设检验是利用小概率反证法思想,根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。见表3-8。 表3-8 可能发生的两类错误 图3-6 I型错误与II型错误示意图(以单侧u检验为例) 二、假设检验应注意的问题 1.要有严密的研究设计 这是假设检验的前提。组间应均衡,具有可比性,也就是除对比的主要因素(如临床试验用新药和对照药)外,其它可能影响结果的因素(如年龄、性别、病程、病情轻重等)在对比组间应相同或相近。保证均衡性的方法主要是从同质总体中随机抽取样本,或随机分配样本。 2.不同的资料应选用不同检验方法 应根据分析目的、资料类型以及分布、设计方案的种类、样本含量大小等选用适当的检验方法。如:配对设计的计量资料采用配对t检验。而完全随机设计的两样本计量资料,若为小样本(即任一ni 60)且方差齐,则选用两样本t检验;若方差不齐,则选用近似t?检验(Cochran Cox法或Satterthwait
文档评论(0)