- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第l0卷第3期 辽宁师专学报 V01.10No.3
2008年 9月 JournalofLiaoningTeachersCollege Sep.2008
【学术研究】
数据挖掘在统计信息空间分析中的应用研究
王恒 昌 、
(1.大连交通大学,辽宁 大连 116028;2.朝 阳市工商行政管理局,辽宁 朝 阳 122000)
摘 要:提出数据挖掘与地理信息系统集成辅助空间分析的策略和实现途径.以自然疫源性疾病研究为
例 ,应用所提 出的策略把数据挖掘和GIS进行有机 的结合,用所 引入 的算法对数据进行详细的分析,验证策略
和算法的合理性与正确性.
关键词:数据挖掘与知识发现;空间分析;统计信息;动态层次聚类分析
中图分类号:TP301.4 文献标识码 :A 文章编号:1008一
地理信息系统(GIS)和数据挖掘 (DM)技术是当今信息技术 中的两颗璀璨 明珠 .前者侧重于信息的管
理 ,后者侧重于信息的分析 ,二者间存在着紧密的联系性和互补性.近年来随着两种技术 的发展 ,使数据挖掘
和地理信息系统相结合 ,从而使挖掘 GIS所管理的海量空间数据背后 的知识与规律成为可能.
1 空间数据挖掘
近年来对数据挖掘的研究 已从关系型和事务型数据库扩展到空间数据库 ,在空间数据库上所进行的数
据挖掘称为空间数据挖掘 ,它是数据挖掘在空间信息中的应用 .参照数据挖掘的定义 ,空间数据挖掘是指从
大量空间数据中发现知识或规律的过程 .空间数据挖掘主要 目的是从空间数据库中抽取隐含的知识 、空间关
系或非显式地存储在空间数据库中的其它模式 ,用于理解空间数据、发现空间数据和非空间数据问的关系、
构建空间知识库、查询优化 、空间数据库数据重组、以简单精确的方式描述通用特征等等.空间数据挖掘是一
个很有发展前景的领域 .从空间数据 中采掘信息具有很多挑战性的问题 |1].根据信息化发展 的要求 ,本文
尝试以具有空间特性的统计信息和空间要素信息联合进行空间数据挖掘 ,结合其他领域知识展开相关研究.
2 动态层次聚类法
一 般层次聚类分析中聚点选择的好坏对聚类结果影响极大,另外对样本分类的确定性要求高 ,导致算法
的适应性弱.动态层次聚类是一般层次聚类的优化 ,它利用了数值分析中的迭代思想逐步去修改初始聚类 ,
使样本的聚类趋于一致 ,获得 比较合理的分类结果 .
该法的基本思想是 :首先进行动态层次聚类的初始分类 中聚点选取 ;然后按一般层次聚类的原则作初始
分类;最后按一定的原则对初始分类进行修改,达到一定的限制条件为止 .根据研究任务 ,在聚类分析中对每
一 步骤有不同的要求和方法 ,下面进行逐一探讨.
2.1 初始分类的聚点选取
根据不 同选取理论和针对不 同的数据聚点选取有多种方法 ,主要有经验选点法、随机选点法、极小极大
原则、界值确定法和密度法等.本文所进行 的研究,在军事医学科学研究院的有关领域专家参与下,采用经验
选点法.
2.2 聚点选取后 的初始分类原则
将数据集中的所有数据逐个输入 ,计算每个数据到所有聚点距离 ,将该数据归入距离最小的聚点所在
类.
2.3 对初始分类的修改方法
这一步是相对于一般聚类的改进之处 ,改进方法也有多种,其 中按批修改是应用 比较成功 的一种方法,
这种方法的基本步骤为 :(1)选取一批聚点后 ,给出数据之间距离的定义 ;(2)按就近原则将所有数据归类 ;
(3)计算每一类重心,以重心作为新一批聚点,再按就近原则归类 ,当所有新 的重心形成的聚点与上一次聚点
重合时,过程终止 ,动态聚类结束 ,否则 回到步骤 (2).
收稿 日期 :2008—05—30
作者简介:王恒 昌 (1967一),男,辽宁朝阳市人 ,硕士研究生,主要从事计算机应用技术方面研究
王恒 昌 数据挖掘在统计信息空间分析 中的应用研究 23
3 自然疫源地的动态层次聚类分析
3.1 动态层次聚类算法的应用 目的
疾病与人 口、资源和环境关系密切 ,尤其是 自然疫源性疾病 ,这些早为医学地理学家所 了解 .但是在疫源
地确定 ,自然
文档评论(0)