土地数据分析与建模分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
土地数据分析与建模分析

土地数据分析与建模实验报告汪帆 2011306200513 土规1202班(1)编程实现以下任务:将landprice中四类土地用途(变量yongtu_1)为C(商业)、CR(商住混合)、R(住宅)和P(工业)的出让样本点提取出来,并保存为一个新的数据集landprice1(即landprice的一个子集),然后分以上四种土地利用类型求取landprice1中的观测样本点的楼面价(变量名为loumianjia)的统计量(MEANS); (2)根据means过程步给出的结果对四种土地利用类型出让地块样本点的楼面价进行描述性统计分析,并进行对比(集中性、离散度、峰度、偏度)。注:在分析之前,可以进行极值检测,若存在极值,可在去除极值之后,再进行分析。要求给出程序、运行结果和描述性统计分析结果。实验步骤:(1)先导入数据菜单栏中:“文件/导入数据”,弹出如下对话框,图1.1。单击“next”,如图1.2。选择实验数据后,单击ok。弹出命名和选择逻辑库对话框,选择“work”,命名为“landprice”,最后在逻辑库中有如图1.3sas数据集。图1.1 文件类型选择 图1.2 文件选择 图1.3(2)四种类型样本点的抽选程序如下:程序1:data landprice1;setlandprice;where yongtu_1=C or yongtu_1=CR or yongtu_1=R or yongtu_1=P;run;运行的结果如图1.4,图1.5所示图1.4 筛选结果部分图 图1.5(3)对四种类型的样本画散点图,以判断是否有极值点或者异常值出现程序如下:程序2:procgplotdata=landprice1;plotloumianjia*id;by yongtu_1;run;运行结果如图1.6-1.9所示:图1.6 用途为C类的散点图分布图1.7 用途为CR类的散点图分布图1.8 用途为P类的散点图分布图1.9 用途为R类的散点图分布通过观察发现,四类用途的楼面价除P类难以观察外,其余三类均存在异常值,故而需要用univariate程序段进行极值判断。(4)极值求取程序如下:程序3:procunivariatedata=landprice1;by yongtu_1;run;结果如下:图1.10 用途为C的楼面价相关统计量计算上下截断点:下截断点:A=Q1-1.5*四分位极差=1627.937-1.5*2034=-1423.063上截断点:B=Q3+1.5*四分位极差=3662.392+1.5*2034=6713.392再将上面两种截断点与极值观测中的5个极小值和极大值进行比较发现:极小值点均在下截断点之上,故而无须删除;极大值点中的第25号(ID为161;13577.87)、14号(ID为95;9150.24)点均大于6713.392,故而删除。图1.11 用途为CR的楼面价相关统计量与用途为C的楼面价类似,求得用途为CR的楼面价的上下截断点的值分别为:-188.709,4054.843。故而要删除的点除上述极大值表中的5个值(ID分别为:93,、195、241、162、218),还要删除ID为263、56、190、152、128、179的点。图1.12 用途为P的楼面价统计量用途为P的楼面价上下截断点位置为:1208.923、-288.575。而通过比较,均无观测值超出该范围,故而该处无须删除点。图1.13 用途为R的楼面价相关统计量用途为R的上下截断点为:4416.999、-1675.205,故而总共要删除如下点。ID号为:188 217 185 213 216 96 139 180 199 101348133 340 194(5)对删除极值后的四种类型用地进行相关统计量的求取。按题目要求,程序如下:程序4:data landprice2;set landprice1;if ID not in(95161931952411622182635619015217918821718521321696139180199101348133340194);run;procsortdata=landprice2;by yongtu_1;run;procmeansdata=landprice2 nmeanstdmedianskewnesskurtosisq1q3range max min;varloumianjia;by yongtu_1;run;运行结果如下图1.14-1.17所示。图1.14 用途为C的相关统计量图1.15 用途为CR的相关统计量图1.16 用途为P的相关统计量图1.17 用途为R的相关统计量(6)描述性统计分析(集中性、离散

文档评论(0)

yaocen + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档