- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
面向数据挖掘的水文时间序列数据提取方法研究
许进
河海大学水文水资源与水利工程科学国家重点实验室,南京(210098 )
E-mail:xj_hydrology@163.com
摘 要:截止2004 年底,全国水文数据累积量已经超过 10TB。面对如此庞大的数据集,如
何更加有效合理的利用它们,从这些数据中间挖掘有用的信息,以促进水利行业发展,是摆
在每个水利工作者面前的重要问题。数据挖掘正是从大量的实际应用数据中,提取隐含在其
中的、人们事先不知道的、但潜在有用的信息和知识的过程。本文研究了数据挖掘技术在水
文时间序列分析应用中的一个重要技术方法——数据提取方法,针对基于特征点的数据提取
思想,提出了一种新的数据提取方法,并与已有的提取方法进行比较,得出结论:本文提出
的APLR_FP 方法具有更高的提取效率和更小的提取误差,并且参数稳定,较易选取。
关键词:水文时间序列;数据提取;特征点
1. 引言
数据挖掘是指从大量的实际应用数据中,提取隐含在其中的、人们事先不知道的、但
【】
潜在有用的信息和知识的过程 1 。水文数据挖掘(Hydrological Data Mining )是数据挖掘技
术在水文领域的应用,是从大量的、不完全的、有噪声的、模糊的、随机的水文及其相关数
【】
据中,提取隐含在其中的水文信息和知识的过程 2 。通常,水文时间序列的数据量大、维
数高且具有噪声的干扰。因此,直接针对水文时间序列进行数据挖掘往往需要花费高昂的计
算时间和存储空间的代价,并可能影响计算结果的可靠性。对此,常用的处理方法是对水文
时间序列先进行数据提取(也称模式表示),保留水文时间序列中的重要形态特征,消除噪
声干扰,降低数据量和数据维数,以便于后续的数据挖掘操作。
2. 常用数据提取方法
时间序列的常用数据提取方法主要包括频域表示法、奇异值分解表示法、符号表示法
以及分段线性表示法。
频域表示法的基本思想是构造转换函数将原始时间序列映射到频域空间中,通过选取转
换后频域空间中的较少特征数据表示原始时间序列,以达到消除噪声和降维的目的。常见的
【】
3
转换方法有离散傅立叶变换(Discrete Fourier Transform,DFT ) 和离散小波变换(Discrete
【】
4
Wavelet Transform,DWT ) 等。
【,
奇异值分解方法(Singular Value Decomposition,SVD)是对整个时间序列的整体表示 5
6】。它通过分析所有的时间序列,计算新的坐标体系,使得第一条坐标轴对应最大的方差,
第二条坐标轴对应次大的方差并与此之前的坐标轴正交,依次得到所有的坐标轴,根据这些
坐标轴将时间序列从原始空间转换到新的坐标空间,从而达到降维的目的。
符号化方法的基本思想是将时间序列离散化映射到包含少量字符的字符串,然后借用字
符串匹配和处理的相关研究成果进行数据挖掘的后续操作。
分段线性表示(Piecewise Linear Representation,PLR )的基本思想是对原始时间序列数
据进行分段的线段表示。该方法的关键技术问题在于如何选择更加合适的分段点。
3. 基于特征点的数据提取方法及其改进
Keogh[7] 等人的实验表明,时间序列的分段聚集近似(Piecewise Aggregate
-1-
您可能关注的文档
最近下载
- 古典文献学第一章 概论.ppt VIP
- 新《劳动法》知识学习考试题库50题(含答案).docx VIP
- 2025年秋季开学师德师风专题会上,校长讲话:守师德,立师魂,强师能!.docx
- 国内外药品技术指导原则体系对比研究(药学部分).pdf VIP
- 2025入党积极分子预备党员考试精选100题题库(含答案).docx VIP
- 中国国家标准 GB/T 19277.1-2025受控堆肥条件下材料最终需氧生物分解能力的测定 采用测定释放的二氧化碳的方法 第1部分:通用方法.pdf
- 《中小学校长校园食品安全管理应知应会20条》培训与解读课件.pptx VIP
- 汽车内饰件断面设计规范.pdf VIP
- 盐城市射阳县合德镇社区工作者招聘考试试题汇总2025.docx VIP
- 风湿性心脏病课件.pptx VIP
文档评论(0)