变量间的相关关系教案05.docxVIP

  • 1
  • 0
  • 约8.26千字
  • 约 12页
  • 2024-04-29 发布于安徽
  • 举报

变量间的相关关系

合作讨论

1.某5名学生的总成绩和数学成绩如下表:

学生

学科

A

B

C

D

E

总成绩(x)

482

383

421

364

362

数学成绩(Y)

78

65

71

64

61

问题:

(1)画出散点图;

(2)求数学成绩对总成绩的回归直线方程;

(3)如果一个学生的总成绩为450,试预测这个同学的数学成绩.

解:(1)散点图略.

(2)Ⅰ.先把数据列成表.

序号

x

Y

x2

Y2

xY

A

482

78

232324

6084

37596

B

383

65

146689

4225

24895

C

421

71

177241

5041

29891

D

364

64

132496

4096

23296

E

362

61

131044

3721

22082

2012

339

819794

23167

137760

Ⅱ.计算b,a的值.

由上表分别计算x,y的平均数得=,=,代入公式:

b=,a=,得(注意:不必把,化为小数,以减小误差).

b==,

a==.

Ⅲ.写出回归直线方程.

数学成绩Y对总成绩x的回归直线方程为:

=+.

这里的回归系数b=,它的意义是:总成绩每增加一分,数学成绩平均增加分.

(3)根据上面求得的回归直线方程,当总成绩为450时,

y=+×450=,即数学成绩大约为分.

2.当两个变量相关时,为了描述两个变量的相关程度,我们引入相关系数是位于-1到1之间的一个数.当r是正号时表示正相关;当r是负号时表示负相关;绝对值表示相关的程度.

r

相关程度

~±

微相关

±~±

实相关

±~±

显著相关

±~±

高度相关

当一个变量是总数列(连续变量),另一个变量是二分列(称名变量,如,男与女、好与坏、对与错等),研究二分称名变量与连续变量的相关程度通常用到公式:

rPbi=.

其中,P:表示在二分变量中,其中的一项在全变量中所占的比例;

q:表示在二分变量中,另一项在全变量中所占的比例q=1-P

P:表示P部分所对应的Y数列平均值.

q:表示q部分所对应的Y数列平均值.

sy:表示全体连续变量y的标准差.

【例】为了研究电教媒体对男、女学生的作用差异,从一次数学考试试卷中,随机抽出16份,成绩和性别(男:1,女:0)如下表.问成绩与性别的相关程度怎样?

性别

分数

性别

分数

性别

分数

性别

分数

1

68

1

92

1

100

1

80

0

97

1

74

1

78

0

64

1

97

0

93

1

77

0

89

1

75

0

89

0

55

0

88

解:P==,q=1-P=,

P===,q===.

sy===.

rPbi===.

结论:近似零相关,成绩与性别无关,媒体的作用与性别无关.

新题解答

当两个变量相关时,为了描述两个变量的相关程度,我们引入相关系数是位于-1到1之间的一个数.当r是正号时表示正相关,当r是负号时表示负相关;绝对值表示相关的程度.

r

相关程度

~±

微相关

±~±

实相关

±~±

显著相关

±~±

高度相关

我们通常用下列公式计算相关系数r:公式rxy=.

其中,rxy:表示x和y两个数列之间的相关系数.

x=X-,y=Y-.

sx,sy:分别为x、y两个数列的标准差.N:成对量数的次数.

下表中记录了学生李明14次考试中语文与数学的成绩,据此讨论他的语文与数学成绩的相关程度.

1

2

3

4

5

6

7

语文成绩

数学成绩

x=X-

x2

y=Y-

y2

xy

(X)

(Y)

60

62

62

80

53

77

57

65

59

67

49

53

48

58

41

67

46

65

58

68

51

68

55

69

78

58

74

88

∑X=791

∑Y=945

=

∑x2=

=

∑y2=

∑xy=

解:甲:sx==.

乙:sy==.

rxy===.

结论:正向相关,属实相关.

思维过程

本节课学习了变量间的相互关系和两个变量的线性相关,以及最小二乘法和回归直线的定义,体会了用最小二乘法解决两个变量线性相关的方法,在解决问题中要熟练掌握求回归系数b、a的公式,精确计算.同时,要注意培养学生的观察分析两变量的关系和抽象概括的能力.

变量间的相互关系有两种:一类是确定性的函数关系,如正方形的边长和面积的关系;另一类是变量间确实存在关系,但又不具备函数关系所要求的确定性,它们的关系是带有随机性的.例如,学生的总成绩和他的单科成绩,一般说来“总成绩高者,单科成绩也高”,我们说总成绩和单科成绩具有相关关系.相关关系又分为两种:(1)正相关:两个变量具有相同的变化趋势.(2)负相关:两个变量具有相反的变化趋势.

判断两个变量有没有相关关系的方法:画出散

文档评论(0)

1亿VIP精品文档

相关文档