华中科技大学谭毅华_数据挖掘引言.ppt

华中科技大学谭毅华_数据挖掘引言.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
华中科技大学谭毅华_数据挖掘引言.ppt

数据挖掘:引言 谭 毅 华 内 容 课程介绍 数据挖掘的必要性(Why) 数据挖掘的内涵(What) 处理的数据(Data) 实现的功能(Functionality) 主要问题(Issues) 系统现状(Systems) 教材 范明,孟小峰等译.数据挖掘:概念与技术.北京:机械工业出版社.2001. 邵峰晶,于忠清.数据挖掘-原理与算法.北京:中国水利水电出版社.2003 Ian H. Witten, Eibe Frank. 数据挖掘:实用机器学习技术及Java实现(英文版). 北京:机械工业出版社,2003 相关网址 Jiawei Han :/~hanj 时间安排 W5: Tue, 引言 Fri, 国庆假 W6: Tue,数据及其加工处理 Fri,关联规则分析 W7: Tue,分类分析 Fri,聚类分析 W8: Tue:文本和多媒体挖掘 Fri:交作业,考试 学习评价及联系方式 评价结果 作业 30% 考试 70% 联系方式 E-Mail: yihua.tan@263.net Tel: 027 Cel: 内 容 课程介绍 数据挖掘的必要性(Why) 数据挖掘的内涵(What) 处理的数据(Data) 实现的功能(Functionality) 主要问题(Issues) 系统现状(Systems) Motivation:数据挖掘的产生 Why:数据挖掘的作用 知识爆炸的苦恼:何处是真谛?如何痛下决断? 数据库技术的发展 1960s: 数据搜集, 数据库建立, IMS 和网络 DBMS 1970s: 关系数据模型, 关系DBMS实现 1980s: 关系DBMS, 先进数据模型 (扩展关系模型, 面向对象, 推理, etc.) ,面向应用DBMS (空间, 科学, 工程, etc.) 1990s: 数据挖掘,数据仓库, 多媒体数据库, Web 数据库 2000s 流数据管理和挖掘 数据挖掘及应用 网络技术 (XML, 数据集成) ,全球信息系统 内 容 课程介绍 数据挖掘的必要性(Why) 数据挖掘的内涵(What) 处理的数据(Data) 实现的功能(Functionality) 主要问题(Issues) 系统现状(Systems) 内 容 课程介绍 数据挖掘的必要性(Why) 数据挖掘的内涵(What) 处理的数据(Data) 实现的功能(Functionality) 主要问题(Issues) 系统现状(Systems) What:什么是数据挖掘 定义 从大量数据中寻找其规律的技术,是统计学、数据库技术和人工智能技术的综合。 从数据中抽取未知的隐含的有用知识。 应用自动或半自动的方法,对大规模的数据进行调查和分析发现有意义的模式。 别名 知识发现 商业智能 data dredging information harvesting data archeology 什么是(或不是)数据挖掘 数据挖掘的过程 数据挖掘步骤 问题定义(和领域知识专家一道) 挖掘何种知识?明确要求 确定可用算法 数据搜集 确定需要用到的数据库和数据集 数据预处理 去噪、缺失值处理、数据类型转换、数据简化等 数据挖掘算法(分类、聚类和序列模式发现等) 数据特点 结果表示:描述性或预测性知识 结果解释和评估 去除冗余 可视化 数据挖掘:多学科的交叉 数据挖掘的多面性 数据面 关系型,流式, 数据仓库,事务, 面向对象,空间数据, 时间序列, 文本,多媒体, 异构数据库, WWW 知识面 特征, 识别, 关联,分类,聚类,趋势等. 集成功能,多级挖掘 技术面 数据库技术,数据仓库 (OLAP), 机器学习, 统计学, 可视化,模式识别等 应用面 零售业, 电信, 银行保险, 诈骗分析, 生物数据挖掘, 股票市场分析, 文本挖掘, web挖掘, 上网行为分析等. 内 容 课程介绍 数据挖掘的必要性(Why) 数据挖掘的内涵(What) 处理的数据(Data) 实现的功能(Functionality) 主要问题(Issues) 系统现状(Systems) 数据挖掘处理的数据类型 Relational Database Data warehouses Transactional databases Advanced DB and information repositories Object-oriented and object-relational databases Spatial databases Time-series data and temporal data Text databases and

文档评论(0)

000 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档