- 1、本文档共112页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
复杂结构的时间序列数据挖掘与预测方法分析-计算机软件与理论专业论文
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研 究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或 集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在 文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名: 日期: 年 月 日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权 保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。 本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检 索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
本论文属于
保密□ ,在 年解密后适用本授权书。
不保密□。
(请在以上方框内打“√”)
学位论文作者签名: 指导教师签名:
日期: 年 月 日 日期: 年 月 日
华 中 科技
华 中 科
技 大
学 博
士
学 位 论
文
I
I
摘 要
近年来,在数据挖掘领域,时间序列数据的挖掘技术取得了很大的进展。随着 网络技术和无线传感器等数据感知搜集技术的不断强大,一方面,时间序列数据的 结构越来越复杂,数据量的海量性也在不断地增加,另一方面,人们越来越需要从 这些更为复杂的数据中发现更多的更为有用的信息和知识。与此同时,计算机的计 算能力的不断强大,也对研究这些更为复杂结构的数据的特征以及挖掘发现出其中 的信息和知识提供了可能。而对于诸如流式时间序列、不确定性时间序列、多时间 序列等复杂结构的时间序列的数据挖掘技术还研究的不多,以往的传统的时间序列 数据挖掘技术大多是对于相对简单结构的时间序列数据的挖掘。因此,对于复杂结 构的时间序列数据的挖掘成为时间序列数据挖掘的新的热点问题,而结构的复杂性 也使得对于复杂结构的时间序列数据挖掘技术面临着新的挑战性问题。
传感器网络中的数据是最为典型的数据流时间序列,每时每刻都在不断地产生 流式数据,在短时间内有大量的数据以非常快的速度连续到达,数据量往往可能是 无限大的,系统没有条件保存整个数据,这些数据随时间动态变化。针对无线传感 器网络中的数据流时间序列的的复杂结构特性,主要基于节省无线传感器网络中电 池能量消耗效率问题,提出了一种无线传感器网络中 Top-k 数据异常检测的方法 PECTMA。其中,提出了 4 个算法,自回归持续读检测算法 CRVMR,Top-k 排序算 法 Top-k-sort,空间冗余清除算法 ESR 和 Top-k 个异常的汇集算法 BRCR。总体的思 想是,减少传感器节点需要传输的数据的传输量,以节省电池能源。通过与知名的 可用于无线传感器网络中的异常检测的方法 TA 和 TAG 的对比实验,验证了 PECTMA 方法的有效性和效率。
在许多现实应用中, 例如受传感器等数据采集仪器设备的精度的制约、不同粗 细粒度的数据集合之间的数据转换、隐私保护等,数据的不确定性普遍存在。一方 面由于时间序列数据往往存在高纬度的特性,再一方面由于不确定性数据的概率不 确定性的特性,使得传统的数据管理中的数据表示、存储与索引、查询与挖掘等所 有的技术,不能直接应用于不确定性时间序列数据的相似性查找。研究了可用于不
II
II
确定性时间序列数据的降维表示、索引与剪枝、查找等理论与技术,针对不确定性
时间序列数据结构的复杂性,首次给出了不确定性时间序列上的概率最近邻的定义; 将不确定性时间序列进行 PLA 降维,转换到 PLA 空间,并提出了三个定理,用以加 速查找效率;基于该三个定理,提出了不确定性时间序列数据中的概率 K 最近邻查 找的方法 PKNNU,给出了相应的查找算法 PKNNS。通过实验,验证了 PKNNS 算 法的有效性和效率。
论坛网络是一种典型的虚拟社会网络,社会网络的一些特性,如网络规模大小、 存在小社会社区结构、社区关系强度、有影响力的节点、节点在社区中的稳定性等 一些重要的统计量,往往正是论坛社会网络不断动态演变的外在表现,反映着论坛 舆情的演进趋势情况,这些量也形成论坛网络中的多个变量的时间序列数据。结合社 区结构分析和多时间序列趋势之间的关联规则分析,提出了一种论坛舆情趋势预测 方法 FSTP。首次对多时间序列的趋势之间的关联规则给出了定义;建立了论坛舆情 预测的时间序列分析模式;FSTP 方法集合了社区结构分析、时间序列预测和多时间 序列的趋势之间的规则关联的挖掘,并给出了相应的 FSTPM 算法。在真实的和拟合 的数据集上进行了实验,测试了关联规则的置信度和支持度,并与知名的算法 Betweenness、External Optimization 和 Greedy 进行了对比实验,验证了 FSTPM 算法 的有效性和
您可能关注的文档
- 复方雪莲胶囊治疗类风湿关节炎寒湿痹阻 证的临床观察-中医内科学专业论文.docx
- 复方降糖颗粒的制备及质量标准研究-中药学专业论文.docx
- 复方阿胶浆治疗肿瘤化疗相关性贫血临床研究-中西医结合临床(内科学)专业论文.docx
- 复方雪莲胶囊的药效学分析-药理学专业论文.docx
- 复方青秦液治疗痛风性肾病的临床研究-中医内科学专业论文.docx
- 复方雪莲胶囊的药效学研究-药理学专业论文.docx
- 复方青蒿油软膏的质量控制研究-药剂学专业论文.docx
- 复方马勃冲剂治疗温病卫、气分发热的临床和实验研究-中医内科专业论文.docx
- 复方骆驼蓬子水凝胶贴剂的研制-药剂学专业论文.docx
- 复方鸦胆子油微乳的研制-中药学专业论文.docx
- DB12 046.89-2011 产品单位产量综合电耗计算方法及限额 第89部分:手机 .docx
- DB12 046.88-2011 产品单位产量综合电耗计算方法及限额 第88部分:晶振 .docx
- DB12T 419-2010 无公害农产品 核桃栽培管理技术规范 .docx
- DB12T 417-2010 沙化和荒漠化监测技术规程.docx
- DB12T 449-2011 民用建筑四防门通用技术条件.docx
- DB12 046.100-2011 产品单位产量综合能耗计算方法及限额 第100部分: 果汁饮料 .docx
- DB12T 427-2010 葱姜蒜中205种农药多残留测定方法-GCMS法.docx
- DB12T 421-2010 有机农产品 甘薯有机栽培技术规范.docx
- DB12T 426-2010 蔬菜水果中205种农药多残留测定方法-GCMS法 .docx
- 《老年人身体康复》精品课件——项目6 中国传统康复技术.pptx
文档评论(0)