第十章:判别分析及其应用.pdfVIP

  • 0
  • 0
  • 约3.76万字
  • 约 14页
  • 2026-02-11 发布于北京
  • 举报

第十章判别分析

1.质心是数据组围绕的点。它由特定组中每个自变量的平均得分定义。

2.回归分析和判别分析之间的区别在于因变量的性质。回归模型中的因变量通常假设某个实际

(连续)值。而判别问题中的因变量是离散的或整数值。

3.另一种分类规则可以测量一个观测点到其的k个邻居的直线距离,并将该观测点分配给其

的k个邻居所属的大多数组。

2

.

4从图10.4中,我们有R=0.571。从图10.7中,80%(或20个中的16个)的观测点

正确分类

已分类。

5.查看文件:Prb10_5.xlsx

a.

质心

组别GPAGMAT

1‑良好3.21521.8

2‑弱2.65442.3

b.判别分数=4.501‑0.683*GPA‑0.00207*GMAT分类规则:如果观察值的判别分数小于或等

于1.5,则将该观察值归类为第1组(代表好学生);否则,将其归类为第2组(代表弱学生)。

c.

预测组别

12总计

实际112315

组别211415

总计131730

总体分类准确率为26/30或86.7%。

d.

判别预测

NAMEGPAGMAT得分组别

迈克·迪莫普洛斯3.024501.5052

斯科特·弗雷泽2.975871.2561

葆拉·3.955510.6611

特里·弗里曼2.454841.8252

达娜·斯3.265241.1881

6.新的截止值=(1.22+1.78)/2+0.06622/(1.22‑1.78)*LN((1/2)*(p2/p1)).

如果我们假设p=p1,我们得到一个新的临界值=1.582。

2

新的分类规则是:如果一个观察值的判别得分小于或等于1.582,则将该观察值归类为第1组(代

表好学生);否则,将其归类为第2组(代表差学生)。

7.a.参见文件:Prb10_7.xlsx

Chapter10

DiscriminantAnalysis

1.Acentroidisthepointaroundwhichagroupofdataiscentered.Itisdefinedbytheaveragescoreoneach

tvariableforaparticulargroupinaDAproblem.

2.ThedifferenceweenregressionanalysisandDAhastodowiththenatureofthedependentvariable.

Thedependentvari

文档评论(0)

1亿VIP精品文档

相关文档