基于系统聚类江西旅游发展研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于系统聚类江西旅游发展研究

基于系统聚类江西旅游发展研究   [摘要]旅游业的发展对于江西省实现“中部崛起”具有重大意义,既能充分利用江西省各种特色丰富的旅游资源,促进江西省经济健康、可持续发展,又能转移江西省剩余劳动力、实现产业结构优化升级。应用系统聚类法采用SPSS18.0软件测试版对江西省11个地级市的旅游基本情况进行分类,提出萍乡、宜春、新余及抚州应在基础设施建设、旅游线图设计、旅游产品开发、信息共享方面协同考虑,景德镇、上饶、鹰潭以及南昌应结合自然生态资源禀赋,大力发展绿色生态家园旅游业,赣州、吉安应借鉴九江市先进经验,基础设施的建设空间布局等方面加强协作。   [关键词]系统聚类法;江西省;旅游业;资源共享   一、系统聚类法   1.系统聚类法简介   聚类分析(Cluster Analysis)是根据事物本身的特性来定量研究分类问题的一种多元统计分析方法。其基本思想是同一类中的个体有较大的相似性,不同类中的个体差异较大,于是根据一批样品的多个测量指标,找出能够度量样品(或变量)之间相似度的统计量,并以此为依据,采用某种聚类法(Method),将所有的样品(或变量)分别聚合到不同的类中。   聚类分析使用的方法大致分为两类:系统聚类法(Hierarchical Clustering)和非系统聚类法(Non-hierarchical Clustering),前者用于所给数据所分类别数目未知的情形,后者用于所给数据所分类别数目已知的情形。本文选择系统聚类法。   在实际应用中,根据分类对象的不同有样品(Case)聚类(又称Q型聚类)和变量(Variable)聚类(或称R型聚类)之分。前者对样品(或事件)进行分类,后者以变量为单位进行聚类。本文选择前者进行聚类。   2.采用SPSS进行系统聚类(Hierarchical Cluster)的基本步骤   目前进行聚类分析的软件很多,SPSS、SAS、R、S-plus、 Matlab等,本文采用SPSS18.0测试版进行聚类分析,其基本步骤如下:   第一步,选择分析变量,生成变量矩阵 , , , 、 分别为样本数和变量数。   第二步,数据标准化。本文采用标准化变换来消除各变量间的量纲。具体做法如下,通过标准化公式   ( , ) (1)   将原始数据 变换为 ,其中, 为第 个变量的样本标准差。经过这样标准化变换后的数据,每个变量的样本均值为0,标准差为1,与变量的量纲无关。   第三步,选择距离或相似系数的计算公式,生成距离矩阵或相似矩阵作为相应的聚类统计量,距离主要用于样品分类,相似系数主要用于变量的分类。本文是对样品进行分类,所以选择欧氏距离平方作为聚类统计量,其矩阵表达形式为:   (2)   其中, 为变量个数, 为样品数目。   第四步,选择聚类方法,将距离最近的两个样品合成一类。本文选择离差平方和法(WARD法)进行聚类,WARD法必须采用欧式距离计算。当 和 合并为 后, 与其他类 的距离递推公式为:   (3)   其中, 、 、 和 分别为 、 、 和 各类中样品的数目。   第五步,重复上述步骤,直至所有样品归为一类。   第六步,输出聚类结果和系统聚类图,并根据实际情况、分类准则等得出最终分类结果。   二、系统聚类在江西省各地市旅游中的应用   1.数据的收集   数据的收集一般分为一手资料和二手资料两大类,一手资料是指研究者本身为了其研究目的经过自身搜集整理或直接经验所得,一手资料是经过研究者实地考察、亲身走访搜集的实证研究资料;二手资料是指某些特定研究组织受企业、政府等机构委托,对于一手资料进行调查统计的资料。二手资料包括各地年鉴、企业统计报表、产业统计便览、地图等。   本文考虑二手资料的可得性以及年鉴的可靠性,选择《江西省统计年鉴》中的数据,选取2007—2009年(整理)江西省各地市旅游多种指标作为本文分析数据,经过多种变量组合聚类分析的结果比较,最终采用 国内游客数(人次), 外国游客数(人次), 香港游客数(人次), 澳门游客数(人次), 台湾游客数(人次), 旅游收汇(万美元), 星级饭店数目这7个指标进行聚类,得到11×7矩阵 :   该矩阵的行向量的分量分别表示江西省各地级市,具体为 南昌市, 景德镇市, 萍乡市, 九江市, 新余市, 鹰潭市, 赣州市, 吉安市, 宜春市, 抚州市, 上饶市。   2.系统聚类分析   在SPSS软件中实现聚类过程时,系统聚类共输入11个样本,有效样本为11个,且没有缺失值的存在,所得到聚类统计量用如下距离矩阵 表示:   与原始矩阵 的行向量相对应,元素 表示南昌与南昌的距离, 表示南昌与景德镇的距离, 表示南昌与萍乡的距离,以此类推。由距离矩阵,我们发

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档