- 2
- 0
- 约1.62千字
- 约 7页
- 2022-05-07 发布于福建
- 举报
讲义精讲 | 借鉴参考
PAGE
PAGE 6
word文档 | 实用可编辑
第一章统计案例
回归分析的根本思想及其初步应用
1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化。变量间的这种相互关系,称为具有不确定性的相关关系.
〔1〕按方向分类
? 正相关:两个变量的变化趋势一样,从 散点图可以看出各点散布的位置是从左下角到右上角的区域,即一个变量的值由小变大时,另一个变量的值也由小变大。
? 负相关:两个变量的变化趋势相反,从散点图可以看出各点散布的位置是从左上角到右下角的区域,即一个变量的值由小变大时,另一个变量的值由大变小。
正相关 负相关 不相关
〔2〕相关性系数r〔在?必修3?中有介绍〕
用相关系数r来衡量两个变量之间的相关关系
2、两变量之间的关系存在两种不同的类型
(1)相关关系——非确定性关系
(2)函数关系——确定性关系
回归分析是对具有相关关系的两个变量进展统计分析的一种常用方法。
其根本步骤是: = 1 \* GB3 ①画出两个变量的散点图;
= 2 \* GB3 ②求回归直线方程;
= 3 \* GB3 ③并用回归直线方程进展预报。
4、回归直线方程:
例如:
5、相关指数是用来刻画回归效果的,
越大,残差平方和越小,模型的拟合效果就越好。
独立性检验的根本思想及其初步应用
1、列联表
假设有两个分类变量X和Y,它们的值域分另为{x1, x2}和{y1, y2},其样本频数列联表为:
y1
y2
总计
x1
a
b
a+b
x2
c
d
c+d
总计
a+c
b+d
a+b+c+d
独立性检验
〔1〕利用随机变量来判断“两个分类变量有关系〞的方法称为独立性检验,并且能较准确地给出这种判断的可靠程度。
〔2〕具体的做法是,由表中的数据算出随机变量K2的值。K2的值越大,说明“X与Y有关系〞成立的可能性越大。
下表k是观测值,概率P为犯错误的概率。
0.50
0.40
0.25
0.15
0.10
0.05
0.025
0.010
0.005
0.001
0.455
0.708
1.323
2.072
2.706
3.841
5.024
6.635
7.879
10.828
例如:
4、利用列联表直接计算发现和相差很大,就判断两个分类变量之间有关系。
文档内容总结
(1)第一章统计案例
回归分析的根本思想及其初步应用
1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化
(2)第一章统计案例
回归分析的根本思想及其初步应用
1、数学变量相关关系的定义:当一个或几个相互联系的变量取一定的数值时,与之相对应的另一变量的值虽然不确定,但它仍按某种规律在一定的范围内变化
(3)〔2〕具体的做法是,由表中的数据算出随机变量K2的值
(4)K2的值越大,说明“X与Y有关系〞成立的可能性越大
(5)下表k是观测值,概率P为犯错误的概率
原创力文档

文档评论(0)