- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数学建模练习小文1
中国省、自治区城市规模结构分类
一、省、自治区的规模结构综合评价分类:
(1)建立综合评价指标体系
省、自治区的综合城市规模结构是取决于多个相关因数综合评估的,综合因数特征主要体现在的相关方面.遵循可比性原则,从省、自治区的城市的多方面中选取5项评价指标,具体如图1.
图一、城市规模结构特征数据
(2)数据资料
指标的原始数据取自《中国统计年鉴,1999》到五项指标值见表1.其中: 为城市规模;为城市首位度; 为城市指数;为基尼系数;为城市规模中位值 .
(3)R型聚类分析
定性考察反映省、自治区城市规模结构五项评价指标,可以看出,某些指标之间可能存在较强的相关性.比如城市首位度与城市指数,城市规模和城市规模中位值.为了验证这种想法,运用MATLAB软件计算五个指标之间的相关系数,相关系数矩阵如表3所示.
计算的MATLAB程序如下:
load gi.txt %把原始数据保存在纯文本文件gi.txt中
r=corrcoef(gi)%计算相关系数矩阵
d=1-r; %进行数据变换,把相关系数转化为距离
d=tril(d); %取出矩阵d 的下三角元素
d=nonzeros(d); %取出非零元素
d=d; %化成行向量
z=linkage(d,average); %按类平均法聚类
dendrogram(z); %画聚类图
T=cluster(z,maxclust,4) %把变量划分成4类
for i=1:4
tm=find(T==i); %求第i 类的对象
tm=reshape(tm,1,length(tm)); %变成行向量
fprintf(第%d 类的有%s\n,i,int2str(tm)); %显示分类结果
end
图二 指标聚类树型图
图三 相关系数矩阵
1.0000 0.0239 0.3398 0.3654 0.4037 0.0329 0.7038 1.0000 0.2127 -0.2261 0.3398 0.7038 1.0000 0.2127 -0.0750 0.3654 0.4459 0.2127 1.0000 -0.3613 0.4037 -0.2261 -0.0750 -0.3613 1.0000
可以看出某些指标之间确实存在很强的相关性,因此可以考虑从这些指标中选取取几个有代表性的指标进行聚类分析.为此,把五个指标根据其相关性进行R型聚类,再从每个类中选取代表性的指标.首先对每个变量(指标)的数据分别进行标准化处理.变量间相近性度量采用相关系数,类间相近性度量的计算选用类平均法.聚类树型图见图2.
(4)Q 型聚类分析
根据这三个指标对27个省、自治区进行聚类分析.首先对每个变量的数据分别进行标准化处理,样本间相似性采用欧氏距离度量,类间距离的计算选用类平均法.聚类树型图见
图4.
图四 各省、自治区聚类树型图
计算的MATLAB程序如下:
clc,clear
load gi.txt %把原始数据保存在纯文本文件gi.txt中
gi(:,1:2)=[]; %删除数据矩阵的第1列和第2列,即使用变量3,4,5
gi=zscore(gi); %数据标准化
y=pdist(gi); %求对象间的欧氏距离,每行是一个对象
z=linkage(y,average); %按类平均法聚类
dendrogram(z); %画聚类图
for k=3:5
fprintf(划分成%d类的结果如下:\n,k)
T=cluster(z,maxclust,k); %把样本点划分成k类
for i=1:k
tm=find(T==i); %求第i类的对象
tm=reshape(tm,1,length(tm)); %变成行向量
fprintf(第%d类的有%s\n,i,int2str(tm)); %显示分类结果
end
if k==4
break
end
fprintf(**********************************\n);
end
案例研究结果
1)划分成3类的结果如下:
第1类的有7 14 20 23 24 27
第2类的有2 3 4 5 6 8 9 10 11 12 13 15 16 17 18 19 21 22
原创力文档


文档评论(0)