网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘-DM1序论.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘-DM1序论

一些流行的算法与软件 DBMiner(/Insight/AX/SX/DX): Decision Tree Classification Clustering (Segmentation) 一些流行的算法与软件 MineSet:SGI公司 EPIINFOEPIMAP (Epidemiology Information): 美国CDC(疾病控制中心)和WHO联合发布,/epiinfo/epiinfo.htm DMOS(Data Mining Optimization System): 国内的思华数据技术有限公司与上海大学,mainly for industry optimization CHISS统计软件 :中华高智统计软件。 MSMiner:中科院计算技术研究所 ………………………… 提供了一些DM系统和工具的性能测试报告 References: BOOK: Jiawei Han, Micheline Kamber; Data Mining: Concepts and Techniques, 2007,Morgan Kaufmann Publishers。 杨杰,姚莉秀,数据挖掘技术及其应用,上海交通大学出版社,2011 JOURNAL: Knowledge and Data Engineering PAMI(Pattern Analysis and Machine Learning) Pattern Recognition PR Letter others UCI database:/~mlearn/MLSummary.html 课程安排 Transfer Learning Deep Learning Increment Learning 第一次课: “绪论”、布置任务 第二次课: 学生查阅文献,结合研究方向或研究兴趣定下自己的讨论方向,5月5日24点前发到我的信箱。(课下完成) 第三次课: “预处理”、安排分组情况 第四次课: “分类与回归” 第五次课: “面向属性的归纳”、第一次学术讨论 第六次课: “关联分析”、第二次学术讨论 第七次课: “聚类”、第三次学术讨论 第八次课: ???????????? * * DM最成功的应用——零售数据的关联分析 * * 数据挖掘的定义 数据挖掘的历史虽然较短,但从20世纪90年代以来,它的发展速度很快,加之它是多学科综合的产物,目前还没有一个完整的定义,人们提出了多种数据挖掘的定义,例如: SAS研究所(1997):“在大量相关数据基础之上进行数据探索和建立相关模型的先进方法”。 Bhavani(1999):“使用模式识别技术、统计和数学技术,在大量的数据中发现有意义的新关系、模式和趋势的过程”。 关键词:大量 数据挖掘的定义——韩家炜 简单的说,DM就是从大量数据(Large amount data) 里挖掘或提取有用的知识。 广义的说,DM是一个从存储在Data base/data warehouse或其它介质里的大量数据中识别有效的、新颖的、有潜在价值的以及最终可理解的模式的非常规的过程。 技术上的定义,DM就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 Big data 数据: Static numeric data:1,2,3… (Time) Series Data (the data related to time change) Stock analysis, Bank account, Sensor data etc. Bioinformatics Spatial Data (the data related to spatial or geographical information, GIS) Remote Sensing, Census Text Data (word, sentence, journal etc.) Web log mining , Machine translate Multimedia Data (figure, image, hyper-text, sound etc.) Content-based Image Retrieval 一、数据挖掘的概念 二、数据挖掘技术的发展 三、功能与应用 四、DM的处理流程 五、一些流行的数据挖掘软件 1、1989年,USA Detroit,召开的11th国际人工智能联合会议的专题讨论会上,首次提出KDD的概念 2、1995年在Canada蒙特利

文档评论(0)

骨干 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档