地理数据挖掘(导师制读书笔记)李楠.doc

地理数据挖掘(导师制读书笔记)李楠.doc

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
地理数据挖掘(导师制读书笔记)李楠

地理数据挖掘 李楠 数据挖掘含义 数据源的真实、大量、有噪音 用户兴趣 发现数据“三可一仅” 三个特性:先前未知、有效、可实用 数据挖掘流程 建立数据模型 ——以时间序列分析为例 组成成分:季节变动、长期趋势、循环变动、不规则变动 时间序列组合模型 插值分析 时间平稳 随机变量的基本特性必须能在包括未来阶段的一个长时期里维持不变 样本数据时间序列的本质特征仍能延续到未来 假定某个时间序列由某一随机过程(stochastic process)生成,即假定时间序列{Xt}(t=1, 2, …)的每一个数值都是从一个概率分布中随机得到的。如果经由该随机过程所生成的时间序列满足下列条件: 均值E(Xt)=m是与时间t 无关的常数; 方差Var(Xt)=s^2是与时间t 无关的常数; 协方差Cov(Xt,Xt+k)=gk 是只与时期间隔k有关,与时间t 无关的常数; 则称经由该随机过程而生成的时间序列是(弱)平稳的(stationary)。该随机过程便是一个平稳的随机过程(stationary stochastic process) 时间自相关 时间分析流程(百度百科) 第一步收集历史资料,加以整理,编成时间序列,并根据时间序列绘成统计图 第二步分析时间序列 第三步求时间序列的长期趋势(T)季节变动(s)和不规则变动(I)的值,并选定近似的数学模式来代表它们。对于数学模式中的诸未知参数,使用合适的技术方法求出其值。 第四步利用时间序列资料求出长期趋势、季节变动和不规则变动的数学模型后,就可以利用它来预测未来的长期趋势值T和季节变动值s,在可能的情况下预测不规则变动值I。然后用以下模式计算出未来的时间序列的预测值Y:加法模式T+S+I=Y、乘法模式 T×S×I=Y 以《基于时间序列建模的城市热岛的时间尺度成分分离方法与应用》为例(知网) 确定分析对象 获取数据 数据预处理(根据时间尺度转换原理) 量化研究对象 建立时间序列模型 结果的分析与评价 时间非平稳情况的处理方法 可以先去掉趋势(detrend); 如果变量间是协整的,可采用协整的方法进行回归或者预测。 时间预测的模型 AR(自相关模型) MA(滑动平均模型) ARMA(自相关滑动平均模型) AR(自相关模型) 要素与观测值之间存在依赖关系或自相关性 描述的是当前值与历史值之间的关系 MA(滑动平均模型) 滤去短期的不规则时间变化 算数平均法(简单,精度不高,只能反映变化情况) 趋势滑动平均(可能出现滞后偏差) ARMA自回归滑动平均 ARMA(p,q)模型中包含了p个自回归项和q个移动平均项,ARMA(p,q)模型可以表示为:

文档评论(0)

haihang2017 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档