LectureIntro数据挖掘讲述.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
LectureIntro数据挖掘讲述

数据挖掘系统实例 SGI公司的 MineSet 多重数据挖掘算法和高级统计 高级可视化工具 SPSS 公司的Clementine 为终端用户和开发者提供集成的数据挖掘开发环境 多种数据挖掘算法可视化工具 DBMiner Technology公司的DBMiner 多种数据挖掘模型:发现驱动的OLAP分析,关联,分类、聚类 有效的关联和序列模式挖掘功能和可视化分类工具 适用于关系数据库和数据仓库 相关资料 Data Mining Groups: Prof. Han UIUC (/~hanj/) Prof. Leskovec (/) Prof. Faloutsos (/~christos/) Prof. Karypis (/gkhome/) LMU DBS (http://www.dbs.ifi.lmu.de/cms/Research) Prof. Pei (http://www.cs.sfu.ca/~jpei/) Big data in Biomedicine: / Data sets: SNAP Stanford (/data/) UCI (/ml/) Softwares and Codes: WEKA : http://www.cs.waikato.ac.nz/ml/weka/ ELKI: http://elki.dbs.ifi.lmu.de/ Scikit: /stable/index.html LibSVM: .tw/~cjlin/libsvm/ 相关资料 数据挖掘主要会议 ACM SIGKDD (A+), Feb. IEEE ICDM (A), Jun. SIAM SDM (A), Oct. ECML/PKDD (A-), Apr. PAKDD (B+), Oct. 数据挖掘主要期刊 IEEE Transactions on Knowledge and Data Engineering (TKDE) SIGKDD Explorations ACM Transactions on Knowledge Discovery From Data (TKDD) Data Mining and Knowledge Discovery Knowledge and Information Systems (KAIS) 相关会议 ACM SIGMOD(A+) VLDB (A) IEEE ICDE(A) CIKM WWW ICML/AAAI/NIPS CVPR/ICCV Take Home Message (小结) 数据挖掘: 从大量数据中发现有趣的模式 KDD过程包括数据清理, 数据集成, 数据选择, 变换, 数据挖掘, 模式评估, 和知识表示 挖掘可以在各种数据存储上进行 数据挖掘功能: 关联, 聚类, 分类/回归, 孤立点 和演化分析等. 数据挖掘系统的分类 数据挖掘的相关知识(如主要会议和期刊) Homework 谈谈自己对数据挖掘的认识 [字数:200-1000] 谢谢 !!! 数据改变我们的思维和工作方式 什么比让数据说话更令人信服呢? 设计1 设计2 Does underlining increase or decrease clickthrough-rate?? OEC: Clickthrough-Rate on 1st search engine results page (SERP) per query A B A B 想想数据挖掘能为你带来什么呢? - 信息推荐:书籍/衣服/? 找到一个合适的工作? 男/女朋友 : ) 1.2 什么是数据挖掘? 什么是数据挖掘? 数据挖掘定义 从大量的数据中挖掘那些令人感兴趣的、有用的、隐含的、先前未知的和可能有用的模式或知识 。 注意:并非所有数据分析都是“数据挖掘” 查询处理 专家系统或是小型的数学计算/统计程序 Data mining consists of applying data analysis and discovery algorithms that, under acceptable computational efficiency limitations, produce a particular enumeration of patterns over the data [Fayyad et al.,1996]. 知识发现过程 数据挖掘—知识发现的核心 数据清理 数据集成 数据库 数据仓库 任务相关数据 选择 数据挖掘 模式评估 可视化 数据清理:消除噪声和删除不一致数据 数据集成:多种数据源可以组合在一起 数据选择:从数据库中提取与分析任务相关的数据 数据变换:把数据变换和统一成适合挖掘的形式 数据挖掘:核心步

文档评论(0)

麻将 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档