- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 数据挖掘的应用领域 ——时间序列挖掘 时间序列挖掘的特点 由于时间序列的高维特征,因此在进行各种挖掘之前,一般都要进行违约简; 时间序列挖掘经常与各种数理统计模型和方法相结合,例如基于ARMA模型进行聚类分析、基于隐马尔可夫模型进行分类、基于主成分分析的聚类以及基于线性回归模型的分割等。 时间序列挖掘的领域性极强,由于不同领域的时间序列具有不同的特征,因此在某些领域适合的挖掘方法并不一定适合其他领域。 * 数据挖掘的应用领域 ——数据流挖掘 数据流挖掘 数据流挖掘算法的分类 从挖掘功能的角度考虑,目前数据流挖掘大致包括:数据流聚类和归约方法、数据流分类、关联分析及时序分析。 数据流挖掘的主要研究内容 鉴于数据流的独特性质,目前主要研究内容包括:(1)数据概要结构的设计;(2)增量算法的设计;(3)针对高速数据流的算法设计;(4)低内存高性能的算法设计。 * 数据挖掘的应用领域 ——空间数据挖掘 空间数据挖掘 什么是空间数据挖掘 空间数据挖掘是在空间数据库的基础上,综合利用统计学、模式识别、机器学习等相关技术,按照一定的度量值和临界值抽取空间知识的过程 空间数据的特点 海量数据 空间属性间非线性相关 空间数据具有尺度特征 空间数据高维性 * 数据挖掘的应用领域 ——空间数据挖掘 空间数据挖掘的主要内容 普遍的几何知识,如空间对象的数量、大小、形态特征等,也可计算这些特征的统计量; 空间分布规律,即对象在地理空间的分布规律,可分为垂直分布、水平分布以及垂直和水平方向的联合分布规律; 空间关联规则,包括空间对象间相邻、相连、共生、包含等关联规则,如村落与道路相连,道路与河流的交叉处是桥梁等。 空间特征规则,即多类空间对象的几何属性的共性特征,这在遥感影像解译中有重要意义。 * 数据挖掘的应用领域 ——空间数据挖掘 空间数据的分类与聚类; 空间序列规则,即根据空间对象随时间变化的趋势预测将来的值,为了发现序列规则,不仅需要知道空间事件是否发生,而且需要确定事件发生的时间; 空间演变规则,即空间对象依时间的变化规则,如果GIS 数据库是时空数据库或者GIS 数据库中存有同一地区多个时间数据的快照,则可以发现空间演变规则。 * 数据挖掘的应用领域 ——空间数据挖掘 空间数据挖掘的一些独特性 地理学法则说明,距离越近的事物之间相互关系越紧密,称为空间自相关性。因此传统数据挖掘中经常假设的数据独立同分,在空间数据中并不成立。 空间数据挖掘经常需要使用形心、散度等特征量来代替原始数据进行挖掘;此外空间数据挖掘除了使用常用的距离度量函数外,也经常使用Moran’I系数等空间距离度量。 人有了知识,就会具备各种分析能力, 明辨是非的能力。 所以我们要勤恳读书,广泛阅读, 古人说“书中自有黄金屋。 ”通过阅读科技书籍,我们能丰富知识, 培养逻辑思维能力; 通过阅读文学作品,我们能提高文学鉴赏水平, 培养文学情趣; 通过阅读报刊,我们能增长见识,扩大自己的知识面。 有许多书籍还能培养我们的道德情操, 给我们巨大的精神力量, 鼓舞我们前进。 * * * 数据挖掘技术——关联分析 关联分析的典型应用 市场营销 广告、推荐系统 医疗诊断、医疗保险 交通流量、交通事故分析 金融市场客户行为、股票涨跌 地质现象与地质规律 * 数据挖掘技术——序列分析 序列分析 与关联分析相似,序列分析的目的也是为了挖掘数据项之间的联系。但是关联分析关注于发现同一时间内呈现出的模式,而序列分析在于分析在不同时间的前后关系。 序列分析的模型、挖掘算法以及应用场合都与关联规则类似,不再赘述。 * 数据挖掘技术——分类分析 分类分析 什么是分类分析 分类分析是从已知分类信息的数据(称为训练集)中总结出一个预测模型,从而预测实际数据的类别信息(见下页图所示)。 分类分析的典型应用包括:预测哪些客户最可能对营销活动做出回应,判断银行的客户信用等级的高低,以及地质领域中对储层类型、油层类型进行判别等。 分类分析的典型模型包括决策树、人工神经网络以及支持向量机等。 * 数据挖掘技术——分类分析 训练集 分类算法 IF rank = ‘professor’ OR years 6 THEN tenured = ‘yes’ 分类器模型 * 数据挖掘技术——分类分析 Classifier Testing Data Unseen Data (Jeff, Professor, 4) Tenured? * 数据挖掘技术——分类分析 决策树模型 决策树是使用较多的一种分类模型,如下图所示。构建一棵决策树分为学习和剪枝两个步骤。 age? overcast student? credit rating? no yes
文档评论(0)