聚类分析在农村家庭出售主要农产品中应用的研究.docVIP

下载本文档

10
0
约7.32千字
约 9页
2017-08-31 发布于安徽
举报
版权申诉

聚类分析在农村家庭出售主要农产品中应用的研究.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

聚类分析在农村家庭出售主要农产品中的应用研究于冬梅滕翠玲辽宁工程技术大学理学院，辽宁阜新(123000) 摘要：聚是一,分析2006年各地区农村居民家庭人均出售主要农产品。将31个地区聚为5类,并且分析各个类的特点，并提出合理的建议。关键词： 1 引言聚类分析又称群分析、点群分析, 是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。例如，可以根据各个银行网点的储蓄量、人力资源状况、营业面积、特色功能、网点级别、所处功能区域等因素，将网点分为几个等级，再分析各个银行之间不同等级网点数量对比状况。在有些问题中我们事先不知道研究的问题分为几类，更不知道观测到的个体的具体分类情况，我们的目的是：需要通过对观测数据所进行的分析处理,选定一种度量个体接近程度的统计量，确定分类的数目，建立一种分类方法，并按接近程度对观测对象给出合理的分类。改革开放以来，我国农村流通市场规模不断扩大，各种农村有形市场迅速崛起，形成了结构相对完善的有形市场网络。农村新型流通业态呈现良好发展势头。由于地理位置和气候等条件的不同，各个城市和地区的各种农产品的种植面积和产量不同，进而不同省或直辖市农村居民家庭人均出售主要农产品也有差异。将各个地区的情况进行聚类，客观、准确地分析地理位置和气候等条件对农产品产量的影响。 2 聚类分析法基本原理 2.1 聚类的基本概念聚类分析是一种分类技术。所谓聚类，根据已知的观察数据，计算所观察的各个样品或变量之间亲疏关系的统计量。然后，依据某种准则，使同一类内的差别较小，而类与类之间的差别较大，最终将所观察的样品或变量分为若干类。聚类的数学定义是：设F为k(n)及集合，使得 2.2 基本思想　所研究的样品(网点)或指标(变量)之间存在程度不同的相似性(亲疏关系———以样品间距离衡量)。于是根据一批样品的多个观测指标，找出一些能够度量样品或指标之间相似程度的统计量，以这些统计量为划分类型的依据。把一些相似程度较大的样品(或指标)聚合为一类，把另外一些彼此之间相似程度较大的样品(或指标)又聚合为另一类，直到把所有的样品(或指标)聚合完毕。这就是聚类分析的基本思想。其中，类指相似元素的集合。聚类分析的概念认为所研究的样品或指标之间存在着程度不同的相似性，根据一批样品的多个观测指标，找出能够度量样品或变量之间相似程度的统计量，并以此为依据，采用某种聚类法，将所有的样品或变量分别聚合到不同的类中，使同一类中的个体有较大的相似性，不同类中的个体差异较大。 2.3 系统聚类的一般原则系统聚类（Hierarcheical Clustering Methods）n个个体看成n个类，这时类间距离与样品间距离是相等的。 (2)按照被评价对象的评价指标体系的特征，选择适当的“距离”作为不相似性度量，并求出最小类间距离。 (3)将最小距离的类并为一类，并求出新类与其余类之间的聚类，并选出最小类间距离。 (4)重复(3)步骤，直至所有类归为一类。 (5)在所取“距离”意义下，画出按相似性或相似程度连结的谱系图。 (6)按综合评价的精度要求，选阀值，确定聚类结果并给综合评价结果。 2.4 系统聚类的方法及步骤谱系聚类方法的类与类之间的距离有不同的定义法。兰斯好威廉姆斯1967年给出了它们统一形式的递推公式：（2-4）其中对于不同的聚类方法有不同的取值见下表2-4. 表2-4 谱系聚类方法统一公式参数表方法单键法 1/2 1/2 0 -1/2 完全连锁法 1/2 1/2 0 1/2 中间距离法 1/2 1/2 0 质心法* 0 类平均法 0 0 可变类平均法 0 MCQ相似分析法 0 0 Ward法* 0 【注释】“*”表示样本点之间的距离必须采用欧氏距离。谱系聚类方法按其采用的类间距离命名。对于在实际应用中采取那一种方法，没有一个界定的标准的，一般采用以下两种处理方法：(1)根据分类问题本身的专业知识，结合实际需要来选择分类方法；(2) 多用几种方法，在结果中发现共性。本文采用ward法距离。谱系聚类法的基本步骤如下：（1）原始数据的预处理。（2）计算距离（或相似系数）矩阵。（3）基于距离矩阵的类搜索与合并操作。（4）绘制谱系聚类图。（5）决定分类的个数及各类的成员。 2.5 系统聚类的类个数的确定根据问题的实际背景，在经验基础上确定类的个数；此间，可借助直观：一是观察原始数据的散点图中点的聚集情况，二是在谱系聚类图中聚类指数跃迁较大之处进行截断。借助一些特定的统计量（统计量、半偏统计量、伪统计量、伪统计量），对可能的类个数逐一进行评价，以确定效果较好的分类。 3