基于增量式决策树的时间序列分类算法研究.pdfVIP

基于增量式决策树的时间序列分类算法研究.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于增量式决策树的时间序列分类算法研究.pdf

/ 序列 中的位置。从时间序列 中获取的所有长度为 Z 对于基于决策树的时间序列分类 问题 .主要考虑 的时间序列子序列定义为 ,其中 ={ ,l≤p≤m— 到时间序列数据维度高、自相关性 以及连续数据的特 点 .提出了一种基于增量式决策树的时间序列分类算 l+l}。 法 。 定义 4 时间序列之间的距离 :距离函数Dist(T, R)表示输入为两条具有相同长度的时间序列T和 2 基于决策树的时间序列分类 R,输出为非负值 d,即两条时间序列之间的距离翻。且 正如基本决策树理论所描述.它采用了一种分而 由函数我们知道,距离公式具有对称性,即Dist(T,R)= 治之的策略 ,而且算法本身具有可解释性。在此基础 Dist(R,T)。 上 .提出了一种发现 shapelet的过程 .即发现一条时间 定义 5 时间序列到子序列之间的距离 :函数 序列中最具代表性的时间序列3[1。事实上 ,这个过程需 SubsequenceDist(T,S)用于定义时间序列 与子序列Js 要很大的存储空间去存储候选集的相关信息 .能够在 之间的距离 。其中输入为时间序列 和子序列 .s.输出 判断最优 shape1et的同时 .生成候选集然后删除非最优 为非负值d,即两条时间序列之间的距离,如公式(1)所 的候选集.这样就能够节省大量的空间。从另一方面来 示 。 说,shapelet的方法会产生很大的时间复杂性嗍。假定时 SubsquenceDist(T,S)=min(Dist(S,S,)), 间序列 shapelet的长度为k.平均每一个时间序列的长 其中S∈.s:’ (1) 度为 .那么候选集的空间复杂度为 O(Vn~k)。其中搜 从公式 (1)可以看出.时间序列 与子序列S之间 索每一个候选集需要的时间复杂度为D(”,那么搜 的距离为两个序列之间的最小距离。另外,可能需要一 索整个候选集的时间复杂度为D( )。 些度量标准来分裂数据集 .传统的决策树中的信息增 基于上述描述的时间序列分类问题的时间复杂度 益即为典型的例子 和空间复杂度 .那么提出了两种加速策略: 定义 6熵:一个时间序列数据集 D共有两个类A (1)子序列早期放弃 (SDEA)策略 在发现 shapelet的过程中.需要全局搜索时间序列 和B,假定数据集 D中属于类A的对象比例为P(A), 属于类 B的对象 比例为P(B),则熵的定义如公式 (2) 数据集。在全局搜索的过程中.涉及到计算候选序列到 所示 。 一 条时间序列序列的距离。子序列到一条时间序列序 列的距离为子序列到时间序列中相同长度的子序列距 I(D)=一P(A)l0g(P(A))-P(B)log(P(B)) (2)

文档评论(0)

月光般思恋 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档