多元统计应用第讲聚类分析资料.pptxVIP

  • 1
  • 0
  • 约3.53千字
  • 约 44页
  • 2025-10-20 发布于北京
  • 举报

多元(duōyuán)统计应用第讲聚类分析;第一节聚类分析方法

第二节聚类统计量

第三节无量纲化方法

第四节Q型系统(xìtǒng)聚类法

第五节R型系统(xìtǒng)聚类法

第六节快速聚类法

推荐阅读;第一节聚类分析方法(fāngfǎ);基本程序:是根据一批样品的多个观测指标,具体地找出一些(yīxiē)能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。

具体进行聚类时,由于目的、要求不同,因而产生各种不同的聚类方法:

由小类合并到大类的方法

由大类分解为小类的方法

静态聚类法、动态聚类法

按样本聚类(Q)、按指标聚类(R);在社会经济领域中存在着大量分类问题(wèntí),如:

对我国31个省市自治区独立核算工业企业经济效益进行分析,一般不是逐省市自治区去分析,而较好地做法是选取能反映企业经济效益的代表性指标,如百元固定资产实现利税、资金利税、产值利税率等,根据这些指标对全国各省市自治区进行分类,然后根据分类结果对企业经济效益进行综合评价,就易于得出科学的分析。

;第二节聚类统计(tǒngjì)量;概述(ɡàishù);Q型聚类统计(tǒngjì)量(距离);3、明考斯基距离(jùlí)(Minkowski)

4、兰氏距离(jùlí)

5、马氏距离(jùlí)

6、切比雪夫距离(jùlí)(Chebychev)

;R型聚类统计(tǒngjì)量;1、夹角余弦(yúxián)

2、相关系数

3、同号率;第三节无量(wúliàng)纲化方法;1、极差正规化(规格化变换、阈值法)

2、标准化变换

3、功效(gōngxiào)系数法

4、相对化变换;例:某年我国部分省市经济效益情况

用以上几种(jǐzhǒnɡ)方法对其无量纲化。;第四节Q型系统(xìtǒng)聚类法;步骤(bùzhòu):;类与类间距离(jùlí)的确定;最短距离法(NearestNeighbor);60

=[(7.

d71=d(3,4,5)1=max{d13,d14,d15}=13.

80d62=d(3,4)2=max{d23,d24}=24.

第六节快速(kuàisù)聚类

数量经济技术(jìshù)经济研究2003.

接下来,度量剩余的样本和小类间的亲疏程度,并将当前最接近的样本或小类再聚成一类;

4、按照距初始类中心最小的原则将各观察量分到聚类中心所在的类中去,形成第一步迭代的k类

然后(ránhòu),按照某???方法度量所有样本之间的亲疏程度,并把最相似的样本首先聚成一小类;

6、重复3、4步,直至指定(zhǐdìng)的迭代次数或达到终止的条件

6125

Q型聚类以距离作为统计(tǒngjì)量,R型聚类以相似系数作为统计(tǒngjì)量。

重心(zhòngxīn)法

接下来,度量剩余的样本和小类间的亲疏程度,并将当前最接近的样本或小类再聚成一类;

第四节Q型系统(xìtǒng)聚类法

2、对样本人为或随机分类,以每类的重心作为凝聚(níngjù)点;d61=d(3,4)1=min{d13,d14}=13.12d62=d(3,4)2=min{d23,d24}=24.06

d65=d(3,4)5=min{d35,d45}=2.21

6125

60

D2=113.120

224.0611.670

52.2112.8023.540

d71=d(3,4,5)1=min{d13,d14,d15}=12.80;d72=d(3,4,5)2=min{d23,d24,d25}=23.54

712

D3=70

112.800

223.5411.670;d78=min{d71,d72}=12.80

78

D4=70

812.80

河南(hénán)3

甘肃4

青海5

辽宁1

浙江2;最长距离法(furthestneighbor);d13=13.80d14=13

文档评论(0)

1亿VIP精品文档

相关文档