- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
聚类分析在农村家庭出售主要农产品中的应用研究
摘 要:聚类分析是对统计样本进行定量分析的一种多元统计分析方法。包括谱系聚类、动态聚类、有序聚类等方法。系统聚类分析是一门多元统计分类法,对不同的要素划分类别往往反映不同目标的等级序列,能自然地、客观地得到一张完整的分类系统图。本文利用系统聚类分析的方法,分析2006年各地区农村居民家庭人均出售主要农产品。将31个地区聚为5类,并且分析各个类的特点,并提出合理的建议。
关键词:聚类分析;系统聚类;农村居民家庭;人均主要农产品
1 引言
聚类分析又称群分析、点群分析, 是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。例如,可以根据各个银行网点的储蓄量、人力资源状况、营业面积、特色功能、网点级别、所处功能区域等因素,将网点分为几个等级,再分析各个银行之间不同等级网点数量对比状况。在有些问题中我们事先不知道研究的问题分为几类,更不知道观测到的个体的具体分类情况,我们的目的是:需要通过对观测数据所进行的分析处理,选定一种度量个体接近程度的统计量,确定分类的数目,建立一种分类方法,并按接近程度对观测对象给出合理的分类。
改革开放以来,我国农村流通市场规模不断扩大,各种农村有形市场迅速崛起,形成了结构相对完善的有形市场网络。农村新型流通业态呈现良好发展势头。由于地理位置和气候等条件的不同,各个城市和地区的各种农产品的种植面积和产量不同,进而不同省或直辖市农村居民家庭人均出售主要农产品也有差异。将各个地区的情况进行聚类,客观、准确地分析地理位置和气候等条件对农产品产量的影响。
2 聚类分析法基本原理
2.1 聚类的基本概念
聚类分析是一种分类技术。所谓聚类,根据已知的观察数据,计算所观察的各个样品或变量之间亲疏关系的统计量。然后,依据某种准则,使同一类内的差别较小,而类与类之间的差别较大,最终将所观察的样品或变量分为若干类。聚类的数学定义是:设F为n维空间的一个点集,求自然数k(n)及集合,使得
(2-1)
聚类的方法分为谱系数聚类法(系统聚类法,分层聚类法),动态聚类法(逐步聚类法),有序样本聚类法(Fisher最优分割法)。
2.2 基本思想
所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系———以样品间距离衡量)。于是根据一批样品的多个观测指标,找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类,把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类,直到把所有的样品(或指标)聚合完毕。这就是聚类分析的基本思想。其中,类指相似元素的集合。聚类分析的概念认为所研究的样品或指标之间存在着程度不同的相似性,根据一批样品的多个观测指标,找出能够度量样品或变量之间相似程度的统计量,并以此为依据,采用某种聚类法,将所有的样品或变量分别聚合到不同的类中,使同一类中的个体有较大的相似性,不同类中的个体差异较大。
2.3 系统聚类的一般原则
系统聚类(Hierarcheical Clustering Methods)有两个基本的思路。一个是将被评价对象每一个单元(或样本)看成一个类,通过建立相似性度量,逐步将类由多变少。另一个思路是相反地将全部被评价对象看成一类,通过建立相似性度量将类由少变多。就其应用于综合评价问题遵循如下原则:
(1)首先将被评价的n个个体看成n个类,这时类间距离与样品间距离是相等的。
(2)按照被评价对象的评价指标体系的特征,选择适当的“距离”作为不相似性度量,并求出最小类间距离。
(3)将最小距离的类并为一类,并求出新类与其余类之间的聚类,并选出最小类间距离。
(4)重复(3)步骤,直至所有类归为一类。
(5)在所取“距离”意义下,画出按相似性或相似程度连结的谱系图。
(6)按综合评价的精度要求,选阀值,确定聚类结果并给综合评价结果。
2.4 系统聚类的方法及步骤
谱系聚类方法的类与类之间的距离有不同的定义法。兰斯好威廉姆斯1967年给出了它们统一形式的递推公式:
(2-4)
其中对于不同的聚类方法有不同的取值见下表2-4.
表2-4 谱系聚类方法统一公式参数表
方法
单键法
1/2
1/2
0
-1/2
完全连锁法
1/2
1/2
0
1/2
中间距离法
1/2
1/2
0
质心法*
0
类平均法
0
0
可变类平均法
0
MCQ相似分析法
0
0
Ward法*
0
【注释】“*
文档评论(0)