- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
预测型知识挖掘中的典型方法 趋势预测模式:主要是针对那些具有时序(Time Series)属性的数据,如股票价格等,或者是序列项目(Sequence Items)的数据,如年龄和薪水对照等,发现长期的趋势变化等。 周期分析模式:主要是针对那些数据分布和时间的依赖性很强的数据进行周期模式的挖掘。例如,服装在某季节或所有季节的销售周期。 序列模式:主要是针对历史事件发生次序的分析形成预测模式来对未来行为进行预测。例如,预测“三年前购买计算机的客户有很大概率会买数字相机”。 神经网络:在预测型知识挖掘中,神经网络也是很有用的模式结构。 特异型知识挖掘 特异型知识(Exception)是源数据中所蕴涵的极端特例或明显区别于其他数据的知识描述,它揭示了事物偏离常规的异常规律。 特异知识挖掘的价值: 例如,在Web站点发现那些区别于正常登录行为的用户特点以防止入侵。 金融、电信欺诈等 分类中的反常实例、不满足普通规则的特例、观测结果与模型预测值的偏差、数据聚类外的离群值等 许多技术可以扩展到特异型知识挖掘中,如: 孤立点(Outlier)分析:孤立点是指不符合数据一般模型的数据。在类知识挖掘中,孤立点分析是不能归入正常类知识中的零散数据再分析。 异常序列分析:在一系列行为或事件对应的序列中发现明显不符合一般规律的特异型知识。 特异规则发现:产生并评价虽然具有低支持度但可能很有价值的规则。 第一章 绪论 内容提要 数据挖掘技术的产生与发展 数据挖掘研究的发展趋势 数据挖掘概念 数据挖掘技术的分类问题 数据挖掘常用的知识表示模式与方法 不同数据存储形式下的数据挖掘问题 粗糙集方法及其在数据挖掘中的应用 数据挖掘的应用分析 数据挖掘方法与数据存储类型 数据挖掘技术应该应用到任何数据存储方式的知识挖掘中,但是因为源数据的存储类型的不同,挖掘的挑战性和技术会不同。 近年来的研究表明数据挖掘所涉及的数据存储类型越来越丰富,除了一些有通用价值的模型、构架等研究外,也开展了一些针对复杂或新型数据存储方式下的挖掘技术或算法的研究。 主要的数据类型: 事务数据库(Transactional Database ) 关系型数据库 (Related Database ) 数据仓库(Data Warehouse ) 在关系模型基础上发展的新型数据库 面向应用的新型数据源 Web数据 事务数据库中的数据挖掘 一个事务数据库是对事务型数据的收集。1993年,当Agrawal等开始讨论数据挖掘问题时,是以购物篮分析(Market Basket Analysis)作为商业应用背景的。 从事务数据库中发现知识是数据挖掘中研究较早但至今仍然很活跃的问题。通过特定的技术对事务数据库进行挖掘,可以获得动态行为所蕴藏的关联规则、分类、聚类以及预测等知识模式。 第三章将详细讲解 关系型数据库中的数据挖掘 关系型数据库是由一系列数据表组成的,相当成熟: 成熟的语义模型(像实体-关系模型);成熟的DBMS(像Oracle) 成熟的查询语言(像SQL语言;可视化的辅助工具和优化软件。 一些更深入和亟待解决的问题: 多维知识挖掘: 传统的事务数据库挖掘所研究的知识一般是单维的,但是,在关系型数据库中,多维的知识更普遍和有应用价值。 单维: “购买计算机的人也购买打印机”。 多维: “什么样购买计算机的人也购买打印机的可能性更大?” 。 多表挖掘:关系型数据库是一系列表集合。因此,多表挖掘是必然的。 数量数据挖掘: 关系型数据库经常包含非离散数量属性(如工资)。 多层知识挖掘:数据及其关联总是可在多个不同的概念层上来理解它。 知识评价问题:是关系型数据库中数据挖掘在应用必须要解决的问题。 约束数据挖掘问题:在约束指导下进行,提高效率和准确度。 数据仓库中的数据挖掘 数据仓库中的数据是按着主题来组织的。存储的数据可以从历史的观点提供信息。虽然一些数据仓库辅助工具可以帮助完成数据分析,但是发现蕴藏在数据内部的知识模式及其按知识工程方法来完成高层次的工作仍需要数据挖掘技术支持。 数据挖掘不仅伴随数据仓库而产生,而且随着应用深入产生了许多新的课题。 如果我们把数据挖掘作为高级数据分析手段来看,那么它是伴随数据仓库技术提出并发展起来的。 OLAP尽管在许多方面和数据挖掘是有区别的,但是它们在应用目标上有很大的重合度。 数据挖掘更看中数据分析后所形成的知识表示模式,而OLAP更注重利用多维等高级数据模型实现数据的聚合。某种意义上,可以把数据挖掘看作是OLAP的高级形式,OLAM(联机分析挖掘)。 新型数据库中的数据挖掘 对象—关系型数据库(Object-Ralational Database)挖掘; 面向对象数据库
您可能关注的文档
最近下载
- 光伏电站的运行与维护规范.pdf
- 危化企业加油加气站双重预防机制手册.doc VIP
- 《首批重点监管的危险化学品名录》.pdf VIP
- 设计的创造性思维和工程思维 课件 高中通用技术粤科版 必修 技术与设计 .ppt VIP
- 兄弟 HL-4150CDN 4570CDW 4150 4570 彩色激光打印机中文维修手册.pdf VIP
- 医护人员职业安全与防护.pptx VIP
- 常用量具、检具测量基础知识试题(附答案).docx VIP
- 建设工程造价鉴定规范.pdf VIP
- 2025年中国石化校园招聘确认笔试参考题库附带答案详解.docx
- 现代家政学概论-ppt6.1第一节服装搭配.pptx VIP
文档评论(0)