- 7
- 0
- 约1.2万字
- 约 17页
- 2018-06-26 发布于福建
- 举报
统计学二次上机
STATA实习二内容
实习一遗留问题:
1.Excel导入Stata:Stata7 复制粘贴,Stata11及以上可以直接用菜单栏“File--Import”导入。
2.图片背景黑色问题:菜单栏“Pref—graph preference”调整背景颜色。Stata11及以上默认白色背景。
本节实习内容:
1. t分布模拟
2. 完全随机设计两连续样本的检验
3. 完全随机多组连续样本的检验
1. t分布模拟
若随机变量X服从正态分布, 那么从总体中随机抽取的样本,其均数服从抽样分布(图1)。对于任何一个横轴变量为,均数为µ,标准误为的正态分布,都可以通过u变换,使之成为µ=0,=1的标准正态分布(图2)。
实际工作中常常未知,用样本标准差估计,这时对正态变量采用的不是u变换,而是t变换: (图3)。t值实际上是u值的估计值,随着样本含量增加,t值对u值的估计性能越好,t值也就越接近u值。
原始总体分布为N(100,62) ,产生1000个样本量为4的样本
stata 程序:
clear
set memory 30m
set obs 1000
set seed 123
gen x1=invnorm(uniform())*6+100
gen x2=invnorm(uniform())*6+100
gen x3=invnorm(uniform())*6+100
gen x4=invnorm(uniform())*6+100
gen mean=(x1+x2+x3+x4+x5+x6+x7+x8)/8
gen ss=(x1-mean)^2+(x2-mean)^2+(x3-mean)^2+(x4-mean)^2
gen var=ss/3
gen std=sqrt(var)
gen t=(mean-100)*2/std
su t
graph t,bin(50) xlabel ylabel norm
原始总体分布为N(100,62) ,产生1000个样本量为8的样本
clear
set memory 30m
set obs 1000
set seed 123
gen x1=invnorm(uniform())*6+100
gen x2=invnorm(uniform())*6+100
gen x3=invnorm(uniform())*6+100
gen x4=invnorm(uniform())*6+100
gen x5=invnorm(uniform())*6+100
gen x6=invnorm(uniform())*6+100
gen x7=invnorm(uniform())*6+100
gen x8=invnorm(uniform())*6+100
gen mean=(x1+x2+x3+x4+x5+x6+x7+x8)/8
gen ss=(x1-mean)^2+(x2-mean)^2+(x3-mean)^2+(x4-mean)^2+(x5-mean)^2+(x6-mean)^2+(x7-mean)^2+(x8-mean)^2
gen var=ss/7
gen std=sqrt(var)
gen t=(mean-100)*sqrt(8)/std
su t
graph t,bin(50) xlabel ylabel norm
2. 完全随机设计两连续样本的检验
统计方法选择原则:
如果两组资料的方差齐性和相互独立的,并且每组资料服从正态分布(大样本资料可以忽略正态性问题),则用成组t检验。,否则可以用成组Wilcoxon秩和检验。
例2 为研究噪声对纺织女工子代智能是否有影响,一研究人员在某纺织厂随机抽取接触噪声95dB(A)、接触工龄5年以上的纺织女工及同一单位、条件与接触组相近但不接触噪声的女职工,其子女(学前幼儿)作为研究对象,按韦氏学前儿童智力量表(中国修订版)测定两组幼儿智商,结果如下。问噪声对纺织女工子代智能有无影响?(接触组group=0,不接触组group=1)
资料及其结果如下:
group
x
0
79
0
93
0
91
0
92
0
94
0
77
0
93
0
74
0
91
0
101
0
83
0
73
0
88
0
102
0
90
0
100
0
81
0
91
0
83
0
106
0
84
0
78
0
87
0
95
0
101
1
101
1
100
1
114
1
86
1
106
1
107
1
107
1
94
1
89
1
104
1
98
1
110
1
89
1
103
1
89
1
121
1
94
1
95
1
92
1
109
1
98
1
98
1
120
1
104
1
110
原创力文档

文档评论(0)