数据挖掘与神经网络调研汇报详解.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
调研实践汇报 调研内容 题目:铁路研究中的数据挖掘技术及数值分析方法调研 数据挖掘技术(Data Mining) 神经网络(Neural Networks)及其在轮对寿命检测中的应用 查阅文献 数据挖掘(Data Mining) 定义:数据挖掘是一个从不完整的、不明确的、大量的并且包含噪声,具有随机性的实际应用数据中,提取出隐含其中潜在有用的知识或模式的过程。 研究背景与意义 随着信息技术的迅猛发展, 许多行业如商业、企业、科研机构和政府部门等都积累了海量的、不同形式存储的数据资料。这些海量数据中往往隐含着各种各样有用的信息, 仅仅依靠数据库的查询检索机制和统计学方法很难获得这些信息, 迫切需要能自动地、智能地将待处理的数据转化为有价值的信息, 从而达到为决策服务的目的。 学术研究应用领域 每年KDD、PAKDD和ECMLPKDD三大学术会议 南京大学机器学习与数据挖掘研究所 厦门大学数据挖掘研究中心 ①市场分析和预测:大型超市销售分析与预测、销售渠道与价格分析等; ②金融、银行; 如自动投资系统、可预测最佳投资时机; ③工业生产: 主要用于发现最佳生产过程; ④科学研究:天文定理的发现、用于分析地壳的构造活动等; ⑤Web数据挖掘; 站点访问模式分析、网页内容自动分类; 常用建模算法方法 决策树(Decision Tree) 定义:决策树是一个利用像树一样的图形或决策模型的决策支持工具,包括随机事件结果,资源代价和实用性 特点在于简单易于理解且应用广泛,是一种分类函数逼近手段 缺点在于每个分支的判定条件过于严格,实际应用中可能会带来麻烦 遗传算法(Genetic Algorithm) 关联规则 在大型的数据库中,快速找到各种事物之前潜在的有价值有意义的联系,并且用一定的规则表现出来,通过推理、积累形成知识之后,得出非常重要的相关联的结论。 关联规则挖掘技术已经被广泛应用在商业金融行业中,一些知名的电子商务站点也从强大的关联规则挖掘中的受益。 神经网络(Neural Networks) 模仿人脑结构及其功能的信息处理系统,由多个简单的处理单元彼此按某种方式相互连接而形成,通过不断修正其内部的大量节点间相互连接的关系达到处理信息的目的 已有近40种神经网络模型,包含反传网络、感知器、自组织映射、Hopfield网络、波耳兹曼机、适应谐振理论等等 BP (Back Propagation)神经网络 聚类算法 聚类就是把一组数据集按照相似性归成若干类别,使得属于同一类别的个体之间的“距离”尽可能越来越小,而不同类别上的个体的“距离”尽可能越来越大 涉及到统计学、机器学习、市场学、生物学、空间数据技术和数据挖掘技术 K-means算法 K-means算法 以数据点到所在类中心的某种距离(坐标中的欧氏距离)作为优化的目标函数,并利用求函数极值的方法得到迭代运算的调整规则 1)从N个数据对象中随机选取K个对象作为初始聚类的中心点(KN) 2)根据每个聚类对象的中心点,计算每个类中对象与各自中心点的距离;并根据最小距离重新对相应对象进行划分; 3)重新计算已经得到的各个类的中心 4)迭代循环2~3步直至每个聚类中心不再发生明显变化为止 算法平台 第一代:仅支持一个或少数几个数据挖掘算法 第二代:与DBMS相集成,具有高性能接口,能挖掘更复杂的数据集和高维数据 第三代:由数据挖掘软件产生的模型的变化能够及时反映到语言模型系统中 第四代:能够挖掘嵌入式系统、移动系统和普遍存在的计算设备产生的各种类型的数据 国内平台 国外算法平台 SAS Enterprise Miner (美国) 为用户提供了用于建模的一个图形化流程处理环境, 并且有一组常用的数据挖掘算法, 包括决策树、神经网络、回归、关联等 IBM Intelligent Miner(美国) 允许企业从文本信息中获取有价值的客户信息 SPSS Clementine (英国) 它允许用户在同一个工作流环境中清理数据、转换数据和构建模型 Insightful Miner(美国) 集数据获取、分析、操纵、清洗、机器学习、模型评估和预测发布等功能于一身的新一代数据挖掘工具。在金融、生物、政府机构等应用非常广泛 数据挖掘平台软件份额 2007 未来发展趋势 数据挖掘语言的标准化 寻求数据挖掘过程中的可视化方法 与特定的数据存储类型间的兼容问题 网络与分布式环境下的数据挖掘问题 数据挖掘与数据库系统和Web 数据库系统的集成 神经网络的发展 1943-1960年,起步阶段,提出了 MP 模型,给出了神经元的最基本模型及相应的工作方式,提出了感知器网络、线性网络等模型。 1985年之前,低潮阶段,

文档评论(0)

创业文库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档