- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章
双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值
亿,丫2 ),???,(Xn,Yn )
目的:研究X和Y的数量关系
方法:归与相关
方法:
归与相关
历史背景:
英国人类学家F.Galton首次在《自然遗传》
一书中,提出并阐明了 “相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和 英国统计学家Karl Pearson对上千个家庭的身
高、臂长、扌乍长(伸开大拇指与中指两端的最 大长度)做了测量,发现:
儿子身高(匕英寸)与父亲身高(X, 英寸)存在线性关系: 。
f = 33.73+ 0.516T的子代在成年之后的身 高平均来说不是更高,而是稍矮于其父代水 平,而矮个子父代的子代的平均身高不是更 矮,而是稍高于其父代水平。柯将这种 趋向于种族稳定的现象称之“回归” o
目前,“回归”已成为表示变量 之间某种数量依存关系的统计学术语, 并且衍生出“回归方程” “回归系数” 等统计学概念。如研究糖尿病人血糖 与其胰岛素水平的关系,研究儿童年 龄与体重的关系等。
第一节两相关变量的散点图
一、直线回归的概念
目的:研究应变量Y对自变量X的数量依
存关系。
特点:统计关系。X值和Y的均数的关系,
不同于一般数学上的X和Y的函数 为了直观地说明两相关变量的线性 依存关系,用表12?1第(2)、(3) 列中大白鼠的进食量和体重增加量 的数据在坐标纸上描点,得图12?1所 示的散点图(scatter* plot)。
例12?1用某饲料喂养12只大白鼠, 得岀大白鼠的进食量与体重增加量 如表12-1,试绘制其散点图。
表12?1 12只大白鼠的进食量
序号
逬食量
体重增加量炸)T
(1)
⑵
(3)
1
305.7
23 6
188.6
14.7
3
277.2
19.2
4
364 8
77 ~
5
285 3
18.9
6
244.7
16.1
7
9
17.2
8
149 8
12.9
9
268.9
18.3
10
247 6
17.7
11
1688
13.7
12
200.6
15.6
合计
2957.9
215.6
(龙卫
(
(g)与体重增加量(g)测量结果
-V2
F2
XY
(4)
(5)
(6)
93452.49
556.96
7214.52
35569.96
216.09
?*
76839.84
368.64
5322.24
133079.04
767.29
10104.96
81396.09
357.21
5392.17
59878.09
259.21
3939.67
65484.81
295.84
4401 48
22440 04
166 41
1932.42
72307.21
334.89
4920.87
61305.76
313.29
4382.52
28493.44
187.69
2312.56
4024036
243.36
3129.36
770487.13
4066.9
55825.2
S厂〉
(SA1)
5 0 5 0 T—I T—I
、亠二三迂苣一 0
130 180 230 280 330 380
进食量(g) , X
图12-1 12只大白鼠进食量与体重增重量散点图
在定量描述大白鼠进食量与体重增 加量数量上的依存关系时,习惯上将进 食量作为自变量(independent variable), 用X表示;体重增加量作为应变量
(dependent variable),用 Y表示。
由图12?1可见,体重增加量有随进食 量增加而增大的趋势,且散点呈直线趋势, 但并非12个点都在直线上,此与两变量间 严格的直线函数关系不同,称为直线回归
(linear regression),其方程叫直线回归方程,以
区别严格意义的直线方程。
回归是回归分析中最基本、
回归是回归分析中最基本、
故又称简单回归。
第二节
回归方程
?、直线回归方程的一般表达式为
Y^a+bX (12-1)
Y为各X处Y的总体均数的估计。
1?a为回归直线在丫轴上的截距。
0,表示直线与纵轴的交点在 原点的上方;
?0,则交点在原点的下方;
? = 0,则回归直线通过原点。
2为回归系数,即直线的斜率。
Z?0,
Z?0,大;
直线从左下方走向右上方,Y随X增大而增
A bvO,直线从左上方走向右下方,Y随X增大而减 小;
b=0,表示直线与X轴平行,X与Y无直线关系。
万的统计学意义是:X每增加(减)一个 单位,丫平均改变方个单位。
二、直线回归方程的求法>残差(residual)或剩余值,即实测值丫与假定回归线上的估计隹r的纵向距罢r - r.
a求解:实际上就是“合理地”找到一条 能最好地代表数据点分布趋势的直线。
原则:最小二乘法(
原创力文档


文档评论(0)