第10章判别分析:质心、分类规则与预测.pdfVIP

  • 0
  • 0
  • 约3.98万字
  • 约 14页
  • 2026-02-02 发布于北京
  • 举报

第10章判别分析:质心、分类规则与预测.pdf

第10章判别分析

1.质心是数据组围绕的点。它由特定组在判别分析问题中每个自变量上的平均得分定义。

2.回归分析和判别分析之间的区别在于因变量的性质。回归模型中的因变量通常假设某些实际

(连续)值。判别问题中的因变量是离散的或整数值。

3.另一种分类规则可以测量从一个观测点到其k个邻的直线距离,并将该观测点分配给其k个邻所

属的组。

2

4.从图10.4中,我们得到R=0.571。从图10.7中,80%(或20个中的16个)的观测点被正确分类。

5.参见文件:Prb10_5.xlsx

a.质心组别GPAGMAT1‑优秀

3.21521.82‑较弱2.65

442.3

b.判别分数=4.501‑0.683*GPA‑0.00207*GMAT分类规则:如果一个观测值的判别分数小于

或等于1.5,则将该观测值归类为第1组(代表优秀学生);否则,将其归类为第2组(代表较弱

学生)。

c.

预测组别

12总计

实际112315

组别211415

总计131730

总体分类准确率为26/30或86.7%。

d.

判别预测

NAMEGPAGMAT得分组别

迈克·迪莫普洛斯3.024501.5052

斯科特·弗雷泽2.975871.2561

葆拉·3.955510.6611

特里·弗里曼2.454841.8252

达纳·西蒙斯3.265241.1881

6.新的临界值=(1.22+1.78)/2+0.06622/(1.22‑1.78)*LN((1/2)*(p2/p1))。如果我们假设p=p1,

2

我们得到一个新的临界值=1.582。新的分类规则是:如果一个观测的判别分数小于或等于1.582,

则将该观测分类为第1组(代表好学生);否则,将其分类为第2组(代表差学生)。

7.a.查看文件:Prb10_7.xlsx

Chapter10

DiscriminantAnalysis

1.Acentroidisthepointaroundwhichagroupofdataiscentered.Itisdefinedbytheaveragescoreoneach

tvariableforaparticulargroupinaDAproblem.

2.ThedifferenceweenregressionanalysisandDAhastodowiththenatureofthed

文档评论(0)

1亿VIP精品文档

相关文档