- 1、本文档共114页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复杂结构的时间序列数据挖掘与预测方法研究-计算机软件与理论专业论文
A Dissertation Submitted in Partial Fulfillment of the Requirements for the Degree of Philosophy of Engineering
Research on Data Mining and Forecasting Methods over Time Series Data with Complex Structure
Ph.D. Candidate :Qian Ailing
Major :Computer Software and Theory Supervisor :Prof. Lu Yansheng
Huazhong University of Science and Technology Wuhan, Hubei 430074, P. R. China
August, 2011
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名: 日期: 年 月 日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
本论文属于
保密□ ,在 年解密后适用本授权书。
不保密□。
(请在以上方框内打“√”)
学位论文作者签名: 指导教师签名:
日期: 年 月 日 日期: 年 月 日
华 中 科技
华 中 科
技 大
学 博
士
学 位 论
文
I
I
摘 要
近年来,在数据挖掘领域,时间序列数据的挖掘技术取得了很大的进展。随着 网络技术和无线传感器等数据感知搜集技术的不断强大,一方面,时间序列数据的 结构越来越复杂,数据量的海量性也在不断地增加,另一方面,人们越来越需要从 这些更为复杂的数据中发现更多的更为有用的信息和知识。与此同时,计算机的计 算能力的不断强大,也对研究这些更为复杂结构的数据的特征以及挖掘发现出其中 的信息和知识提供了可能。而对于诸如流式时间序列、不确定性时间序列、多时间 序列等复杂结构的时间序列的数据挖掘技术还研究的不多,以往的传统的时间序列 数据挖掘技术大多是对于相对简单结构的时间序列数据的挖掘。因此,对于复杂结 构的时间序列数据的挖掘成为时间序列数据挖掘的新的热点问题,而结构的复杂性 也使得对于复杂结构的时间序列数据挖掘技术面临着新的挑战性问题。
传感器网络中的数据是最为典型的数据流时间序列,每时每刻都在不断地产生 流式数据,在短时间内有大量的数据以非常快的速度连续到达,数据量往往可能是 无限大的,系统没有条件保存整个数据,这些数据随时间动态变化。针对无线传感 器网络中的数据流时间序列的的复杂结构特性,主要基于节省无线传感器网络中电 池能量消耗效率问题,提出了一种无线传感器网络中 Top-k 数据异常检测的方法 PECTMA。其中,提出了 4 个算法,自回归持续读检测算法 CRVMR,Top-k 排序算 法 Top-k-sort,空间冗余清除算法 ESR 和 Top-k 个异常的汇集算法 BRCR。总体的思 想是,减少传感器节点需要传输的数据的传输量,以节省电池能源。通过与知名的 可用于无线传感器网络中的异常检测的方法 TA 和 TAG 的对比实验,验证了 PECTMA 方法的有效性和效率。
在许多现实应用中, 例如受传感器等数据采集仪器设备的精度的制约、不同粗 细粒度的数据集合之间的数据转换、隐私保护等,数据的不确定性普遍存在。一方 面由于时间序列数据往往存在高纬度的特性,再一方面由于不确定性数据的概率不 确定性的特性,使得传统的数据管理中的数据表示、存储与索引、查询与挖掘等所 有的技术,不能直接应用于不确定性时间序列数据的相似性查找。研究了可用于不
II
II
确定性时间序列数据的降维表示、索引与剪枝、查找等理论与技术,针对不确定性
时间序列数据结构的复杂性,首次给出了不确定性时间序列上的概率最近邻的定义; 将不确定性时间序列进行 PLA 降维,转换到 PLA 空间,并提出了三个定理,用以加 速查找效率;基于该三个定理,提出了不确定性时间序列数据中的概率 K 最近邻查 找的方法 PKNNU,给出了相应的查找算法 PKNNS。通过实验,验证了 PKNNS 算 法的有效性和效率。
论坛网络是一种典型的虚拟社会网络,社
您可能关注的文档
- 复方阿胶浆对跆拳道运动员免疫机能及抗氧化能力的影响-运动人体科学专业论文.docx
- 复方阿胶浆对橄榄球运动员心脏功能的影响-运动人体科学专业论文.docx
- 复方阿胶浆对跆拳道运动员抗疲劳作用研究-运动人体科学专业论文.docx
- 复方阿胶浆对跆拳道运动员抗氧化能力的影响-运动人体科学专业论文.docx
- 复方阿胶浆对长距离速滑运动员耐缺氧能力影响的试验研究-运动人体科学专业论文.docx
- 复方雪莲胶囊治疗类风湿关节炎寒湿痹阻 证的临床观察-中医内科学专业论文.docx
- 复方降糖颗粒的制备及质量标准研究-中药学专业论文.docx
- 复方阿胶浆治疗肿瘤化疗相关性贫血临床研究-中西医结合临床(内科学)专业论文.docx
- 复方雪莲胶囊的药效学分析-药理学专业论文.docx
- 复方青秦液治疗痛风性肾病的临床研究-中医内科学专业论文.docx
- DB12 046.89-2011 产品单位产量综合电耗计算方法及限额 第89部分:手机 .docx
- DB12 046.88-2011 产品单位产量综合电耗计算方法及限额 第88部分:晶振 .docx
- DB12T 419-2010 无公害农产品 核桃栽培管理技术规范 .docx
- DB12T 417-2010 沙化和荒漠化监测技术规程.docx
- DB12T 449-2011 民用建筑四防门通用技术条件.docx
- DB12 046.100-2011 产品单位产量综合能耗计算方法及限额 第100部分: 果汁饮料 .docx
- DB12T 427-2010 葱姜蒜中205种农药多残留测定方法-GCMS法.docx
- DB12T 421-2010 有机农产品 甘薯有机栽培技术规范.docx
- DB12T 426-2010 蔬菜水果中205种农药多残留测定方法-GCMS法 .docx
- 《老年人身体康复》精品课件——项目6 中国传统康复技术.pptx
最近下载
- 《模拟电子技术基础》模电期末试题集及答案(8套).pdf
- 2023年太原师范学院数据科学与大数据技术专业《操作系统》科目期末试卷A(有答案).docx VIP
- 物联网工程专业生涯发展.pptx VIP
- 2024年04月自然资源部南海局所属事业单位2024年度公开招考61名工作人员笔试参考题库附带答案详解.docx VIP
- 中国移动湖北移动招聘笔试题库2023.pdf
- SENNHEISER森海塞尔话筒剧院EK 3241使用说明书Instruction manual EK 3241.pdf
- 七年级数学《平面直角坐标系》单元教学设计.doc VIP
- 移动公司笔试题目.docx VIP
- 2023-2024学年广东省深圳市龙华区部编版四年级上册期末考试语文试卷【含答案】.pdf
- 业务跟单年度工作总结.pptx VIP
文档评论(0)