- 1、本文档共3页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
. .. .. .
第一章
方差分析
例 1、 1977 年,美国的某项调查从三种受过不同教育类型的妇女中各分别抽取了
50 位全日制工作的妇女
样本,她们的年收入(单位:千美元)数据整理后归纳如下:
完成的学历年数
收入平均值 X (
)
(X X)2
初中( 8 年) X1
7.8
1835
高中( 12 年) X2
9.7
2442
大学( 16 年) X3
14.0
4707
解:
: =
:三组收入均值有显著差异
F =
,即组间均方 / 组内均方
其中,组间自由度
=3-1=2 ,组内自由度
=(50-1)
╳ 3=147
由于样本均值
=(7.8+9.7+14.0)/3=10.5
所以组间偏差平方和
=50
=50*(
+
+)=1009
组内偏差平方和
=
=1835+2442+4707=8984
所以,F=
≈ 8.2548419
(2,147)=3.07
拒绝原假设;认为不同学历的妇女收入存在差异。
例 2、 月收入数据:
男: 2500,2550, 2050,2300, 1900
女: 2200,2300, 1900,2000, 1800
如果用 Y 表示收入,哑变量 X 表示性别( X=1 为女性),计算 Y 对 X 的回归方程,并在 5%的水平下
检验收入是否与性别无关(先求回归系数的置信区间) 。
解:令Y= + X+
根据最小二乘法,可知=
(1)
VAR( )=
(2)
=
(3)
计算如下:
:收入与性别无关
收入与性别不完全无关
学习参考
.
..
..
.
Y
2500
2550
2050
2300
1900
2200
2300
1900
2000
1800
X
0
0
0
0
0
1
1
1
1
1
240
290
-210
40
-360
160
260
-140
-40
-240
=2150
=0.5
根据公式
1,得 =-220 ;
,即 Y=-220X+
根据公式
2、 3,得 VAR( )=
≈ 156.3549577
n=10. , n-2=8 ;当 df=8 时,
=2.306
的 0.05
置信区间求解方法如下:
-2.036= =2.306, 得 140.57769.
由于原假设 =0落入了这个置信区间,所以接受原假设,认为 系数不显著,收入与性别
无关。
第二章 相关分析
例 1、 10 对夫妇的一个随机样本给出了如下的结婚年龄数据
结婚时丈夫的年龄 y 24 22 26 20 23 21 24 25 22 23
结婚时妻子的年龄 x 24 18 25 22 20 23 19 24 23 22
计算样本相关系数 r;
2) 求总体相关系数 的 95%置信区间;
以 5%的水平,检验“夫妻的结婚年龄之间没有什么线性联系”这一原假设。
解: (1) =
由于 =22, =23; =
≈0.3426
(2) 由于 se( )= , n=10, df=8 =2.306 ,所以 :
se( )=0.332
-2.036= =2.306
得 1.062072
学习参考
. .. .. .
:夫妻的结婚年龄之间没有线性相关,
夫妻的结婚年龄之间不完全没有线性相关, ≠0
根据第 (2) 题的计算结果,
1.062072
由于 的原假设落入了该置信区间,所以接受原假设,认为夫妻的结婚年龄之间没有线性相关关系。
第三章
卡方检验和交互分析
例 1、为了研究性别和“最希望看到的有关奥运会的电视节目类型”之间的关系,
2004 年在 10 城市调查
了 1000 个样本,调查数据如下:
频
次
性 别
女
男
希望看到的节目类型
赛事直播
261
235
新闻报道
69
42
专题报道
33
40
精彩赛事集锦
36
42
开幕式和闭幕式
87
108
其他
32
15
陈述 H0;
2) 计算 2和 H0的概值。
解: (1) :性别与希望看到的电视节目类型无关
性别与希望看到的电视节目类型不完全无关
理论频数表如下:
频
次
性 别
女
男
合计
希望看到的节目类型
赛事直播
257
239
496
新闻报道
57.5
53.5
111
专题报道
37.8
35.2
73
精彩赛事集锦
40.4
37.6
78
开幕式和闭幕式
101
94
195
其他
24
23
47
合计
518
482
1000
所以 = + +... ≈16=11.07
自由度 df=1*5=5 ;
所以拒绝原假设,备择假设 成立,性别与希望看到的电视节目类型是有关联的。
学习参考
文档评论(0)