- 1、本文档共39页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章节区间估量-假设检验
一、使用INSIGHT模块
二、使用“分析家”
三、使用TTEST过程;二、使用“分析家”
1. 总体均值的置信区间
【例3-4】在“分析家”中求【例3-1】中每箱药材平均重量在95%置信水平下的置信区间。; 3) 在打开的“One Sample t – test for a Mean”对话框中设置均值的置信区间。
结果表明,药材的平均重量以95%的概率位于50.08千克至52.92千克之间。;2. 单样本总体均值的假设检验
【例3-5】使用“分析家”检验【例3-2】中食品重量是否符合要求。
检验变量WEIGHT:
H0:μ = 100, H1:μ ? 100
由于方差未知,所以使用 t 检验法。
步骤如下:
1) 在“分析家”中打开数据集Mylib.spzl;
2) 选择菜单“Statistics”→“Hypothesis Tests”
→“One Sample t – test for a Mean”,
打开“One Sample t – test for a Mean”对话框;; 4)按图所示设置均值检验,单击“OK”按钮.;显示结果表明 t 统计量的 p 值为 0.0105 0.05,
所以拒绝原假设,即认为总体的均值不等于100。;3. 两样本总体均值的比较:成对匹配样本
【例3-6】使用“分析家”对例3-3中两套试卷检验有无显著差异。
μ1和μ2分别表示两套试卷的平均成绩,
检验: H0:μ1 – μ2 = 0, H1:μ1 – μ2 ? 0;
分析步骤如下:
1) 在“分析家”中打开数据集Mylib.sjdf;
2) 选择菜单“Statistics”→“Hypothesis Tests”
→“Two Sample Paired t - Test for a Mean(均值的成对双样本t - 检验)”;; 3) 在打开的对话框中,按图左所示设置双样本均值检验,单击“OK” ,
t 统计量的 p 值 = 0.0005 0.05,
所以拒绝原假设,两总体的均值有显著差异。;4. 两样本总体均值的比较:独立样本
【例3-7】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排一些个工人进行操作试验,每个工人组装一件产品所需的时间如下表所示。试以95%的置信水平推断两种方法组装产品所需平均时间有无差异。 ;这是一个(独立)两样本均值检验问题,
μ1,μ2分别为两种方法组装一件产品所需平均时间,
则检验:H0:μ1 – μ2 = 0,H1:μ1 – μ2 ? 0;;将数据存放在数据集Mylib.zzcpsj中,将两个样本观测值记在同一分析变量F下???
不同的样本用一个分类变量 g 加以区分。
分析步骤如下:
1) 在“分析家”中打开数据集Mylib.zzcpsj;
2) 选择菜单“Statistics” →“Hypothesis Tests”
→“Two Sample t - Test for Mean(两样本均值的t - 检验)”;; 3) 在打开的对话框中,按图所示设置双样本均值检验,单击“OK”
由于 t 统计量的 p 值 0.05,
所以在95%的置信水平下,拒绝原假设,
即两种方法所需时间有差异。;三、使用TTEST过程
单样本均值的t检验、配对数据的 t 检验、
双样本均值比较的t检验。
1. 语法格式
PROC TTEST 选项列表;
[CLASS 分组变量名;]
[VAR 分析变量名列表;]
[PAIED 变量名列表;] [BY 分组变量名;]
RUN;
其中,PROC TTEST和RUN语句是必须的,
其余语句都是可选的,而且可调换顺序。;CLASS语句指定的分组变量用来进行组间比较;
BY语句指定的分组变量将数据分为若干更小样本,以便分别在各小样本内进行各自独立的处理。
VAR语句引导要检验的所有变量列表, 对引导的所有变量分别进行组间均值比较的 t 检验。;PAIED语句指定配对 t 检验中进行比较的变量对,所带变量名列表一般形式及产生的效果见下表。 ;PROC TTEST后选项及其表示的含义如表所示。;2. 总体均值的置信区间
【例3-8】考虑【例3-3】中的样本数据。假定其中数据使用如下数据步存放在数据集sjcj中,两套试卷得分的变量名分别为A和B。
data sjcj;
input A B@@;
cards;
78 71 63 44 72 61 89 84 91 74
49 51 68 55 76 60 85 77 55 39
;
run;;使用最简代
文档评论(0)