- 1、本文档共31页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘原理与SPSS Clementine应用宝典 元昌安 主编 邓 松 李文敬 刘海涛 编著 电子工业出版社 1.1数据挖掘的社会需求 1.1数据挖掘的社会需求 著名的“啤酒尿布”案例:美国加州某个超级卖场通过数据挖掘发现,下班后前来购买婴儿尿布的男顾客大都购买啤酒。于是经理当机立断,重新布置货架,把啤酒类商品布置在婴儿尿布货架附近,并在二者之间放置佐酒食品,同时还把男士日常用品就近布置。这样,上述几种商品的销量大增。 1.2 数据挖掘的定义—技术定义 数据挖掘(Data Mining)就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 1.2 数据挖掘的定义—技术定义 数据挖掘和信息检索: 信息检索和数据挖掘的相同点是从档案文件或数据库中抽取感兴趣的数据和信息。区别在于数据检索对信息的抽取规则是事先定义好的,抽取的是外在信息。据挖掘于挖掘寻找现象之间事先未知的关系和关联 。 1.2数据挖掘的定义—商业定义 按企业既定业务目标,对大量的企业数据进行探索和分析,揭示隐藏的、未知的或验证已知的规律性,并进一步将其模型化的先进有效的方法。数据挖掘是从海量数据中提取隐含在其中的有用信息和知识的过程。它可以帮助企业对数据进行微观、中观乃至宏观的统计、分析、综合和推理,从而利用已有数据预测未来,帮助企业赢得竞争优势。 1.2数据挖掘的定义—商业定义 应用实例:某经营公司对多年来的客户资料进行挖掘后发现,大多数购买电脑的客户具有下面的特点:1、年轻(20—45岁之间);2、收入高;3、居住地:城市;4、学历高;基于此,此经营公司可以根据这些客户的特点有目的的做一些广告或者促销。 1.3数据挖掘的发展历史—历史发展 1989 IJCAI会议: 数据库中的知识发现讨论专题 Knowledge Discovery in Databases (G. Piatetsky-Shapiro and W. Frawley, 1991) 1991-1994 KDD讨论专题 Advances in Knowledge Discovery and Data Mining (U. Fayyad, G. Piatetsky-Shapiro, P. Smyth, and R. Uthurusamy, 1996) 1995-1998 KDD国际会议 (KDD’95-98) Journal of Data Mining and Knowledge Discovery (1997) 1998 ACM SIGKDD, SIGKDD’1999-2002 会议,以及SIGKDD Explorations 数据挖掘方面更多的国际会议 PAKDD, PKDD, SIAM-Data Mining, (IEEE) ICDM, DaWaK, SPIE-DM, etc. 1.3数据挖掘的发展历史—国内现状 大部分处于科研阶段 各大学和科研机构从事数据挖掘算法的研究 国内著作的数据挖掘方面的书较少(翻译的有) 数据挖掘讨论组() 有一些公司在国外产品基础上开发的特定的应用 IBM Intelligent Miner SAS Enterprise Miner 自主知识产权的数据挖掘软件 复旦德门()等 1.3数据挖掘的发展历史—未来发展 数据库 人工智能 统计学 上述学科的发展决定着数据挖掘的发展未来和方向 1.4数据挖掘的系统分类 数据挖掘是一个交叉学科领域,受多个学科影响,包括数据库系统、统计学、机器学习、可视化和信息科学 。 1.4数据挖掘的系统分类 技术分类 预言(Predication):用历史预测未来 描述(Description):了解数据中潜在的规律 数据挖掘技术 关联分析 序列发现 分类(预言) 聚集 异常检测 汇总 回归 时间序列分析 1.5数据挖掘的应用领域 金融领域 营销领域 电子政务 电信领域 工业生产 生物和医学 1.5数据挖掘的应用领域—应用调查 1.5数据挖掘的应用领域—金融 信用卡分析业务模型 客户信用等级评估 客户透支分析 客户利润分析 客户消费行为分析 客户消费异常行为分析 1.5数据挖掘的应用领域—金融 1.5数据挖掘的应用领域—营销 关联分析--市场篮子分析,用于了解顾客的购买习惯和偏好,有助于决定市场商品的摆放和产品的捆绑销售策略; 序列模式与市场篮子分析相似,不过是用某时间点发现的产品购买或其他行为模式来预测将来购买产品或服务类别的概率; 聚类用于市场细分,将顾客按其行为或特征模式的相似性划分为若干细分市场
您可能关注的文档
- 易错题辅导(4)电化学突破2013.3.doc
- 7第七章地下水的化学组分及其演变.doc
- 饮食养生:柚子皮的饮食应用与制作.doc
- 8可再生资源的持续利用81648.ppt
- 8世界地图引出的发现26133.ppt
- 8世界地图引出的发现37936.ppt
- 10.01.11高三生物《必修3第4章第3节群落的结构+第4节群落的演替》.doc
- 用密立根油滴仪测量电子电量.doc
- 10湿地干涸及其恢复第32课.doc
- 013-2014学年七年级生物下册第4单元第2章第1节食物中的营养物质(第1课时)导学案(新版)新人教版.doc
- 新人教版生物七年级下册《专题复习1.被子植物的一生》教学课件.pptx
- 新人教版四年级数学下册《第四单元三角形内角和》教学课件.pptx
- 新人教版小学六年级数学下册总复习《平面图形的周长和面积》教学课件.pptx
- 新人教版小学数学一年级上册《9加几》教学课件.pptx
- 新人教版小学六年级数学下册《用字母表示数》教学课件.pptx
- 新人教版初中七年级地理下册《世界地理分区复习(人文部分)》教学课件.pptx
- 新人教版小学六年级数学下册第二单元《成数问题》教学课件.pptx
- 新人教版小学六年级数学下册《成数》教学课件.pptx
- 新人教版小学六年级数学下册第二单元《利率问题》教学课件.pptx
- 新人教版小学六年级数学下册《圆柱的体积》教学课件.pptx
文档评论(0)