- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
in
DiscoveryDatabases,KDD)是从大量数
数据库知识发现(Knowledge
据中发现潜在规律、提取有用知识的方法和技术。近年来,KDD受到了普
遍关注,已经成为信息系统和计算机科学领域研究中最活跃的部分。KDD
被认为是从数据中发现有用知识的整个过程,而数据挖掘(DataMining,
DM)被认为是KDD过程中的一个特定步骤,它用专门算法从数据中抽取
模式。
数据挖掘技术从一开始就是面向应用的。目前,在很多领域,数据挖
掘都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售等领
域。但数据挖掘技术应用于铁路轨道不平顺数据分析领域,目前研究较少。
铁路线路监测产生了大量的轨道不平顺数据,期待对其进行挖掘,找出其
中潜在的规律,以对未来的数据进行分析与预测。
本文以实现基于决策树的铁路轨道不平顺数据分类系统为目标。首先
在初步调研与分析知识发现与数据挖掘相关理论与应用的基础上,归纳了
该领域的主要研究内容和关键技术。然后介绍了目前轨道不平顺数据管理
的现状,以秦沈客运专线轨道不平顺数据为例,展现了现有系统的作用和
意义。并着重分析了其存在的弊端,并合理地提出了自己的改进方案。进
而结合数据挖掘的应用现状和理论基础,重点分析了分类算法的理论、方
法和实现技术。研究的主要内容有数据挖掘的过程模型、数据预处理、决
策树分类的常用算法等。最后设计和实现了一个基于决策树的轨道不平顺
数据分类KDD系统,并对所采集的秦沈客运专线轨道不平顺数据进行了
分类挖掘,分析了已有数据的规律,并对未知类别的数据进行了预测。试
验表明,本文所提出的算法是有效的,具有实际应用价值。本文所实现的
轨道不平顺数据分类系统对于实际的轨道不平顺数据分析及预测具有一定
的指导及帮助作用。
本文主要研究工作如下:
1、基于ID3及C4.5算法,分析了一般决策树的建树、剪枝算法;
2、 针对一般决策树缺乏伸缩性的缺陷,分析高速可伸缩分类算法:SLIQ
算法及SPRINT算法,深入研究了算法的实现策略:
3、 以秦沈客运专线的轨道不平顺数据为例,阐述轨道不平顺数据分析的
意义、现状及存在的不合理点,具体提出利用决策树分类挖掘算法对
庞大的轨道不平顺数据进行分析与预测的改进设想;
4、基于本文所阐述的KDD过程模型和关键技术,及所提出的研究设想,
设计实现一个切实可用的、完整流程的KDD系统:轨道不平顺数据
分类系统,著对实际数据进行分析与预测,验证了文中所提出的研究
设想的实际可行性及其所产生的效用。
本文针对上述研究内容,进行了火量的实验研究和论证。结果表明,
本文的理论、方法与技术基本正确有效,所实现的轨道不平顺数据分类系
统对实际的轨道不平顺管理可提供一定的指导作用,具有良好的实际应刚
前景。
关键词:KDD,数据挖掘,轨道不平顺,车辆动力响应,车体加速度,分
类,决策树,ID3,C4.5,SLIQ,SPRINT。
ll
Abstract
in methodand that
DiscoveryDatabases(KDD)istechnique
Knowledge
useful numbersdata
rule from of
discoverlatentanddistill knowledgelarge
it themostactive
Recent is becomes
attention,and
payedpervasive
years,KDD
文档评论(0)