数据挖掘——第一章引导.pptVIP

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

数据挖掘:概念与技术

原书第三版;教师信息;课程信息;JiaweiHan,MichelineKamber,数据挖掘概念与技术,机械工业出版社。2012;学习的内容与要求;第一章引论;一、关于数据挖掘的经典故事和案例;1、正在影响中国管理的10大技术;2010年麻省理工学院的《科技评论》杂志提出未来5年对人类产生重大影响的10大新兴技术,“数据挖掘”位居第三。

一份最近的Gartner报告中列举了在今后3~5年内对工业将产生重要影响的五项关键技术,KDD〔知识发现〔KDD:KnowledgeDiscoveryinDatabases〕和人工智能排名第一。同时,这份报告将并行计算机体系结构研究和KDD列入今后5年内公司应该投资的10个新技术领域。

由此可以看出,数据挖掘的研究和应用受到了学术界和实业界越来越多的重视,因而成为信息产业最有前途的交叉学科。;2、从数字中能够得到什么?;WhatAreTheseNumbersTryingtoTellUs?;3、一个网络流传的笑话(转述);(1.客户数据库)

顾客:“我家,为什么你知道我所有的号码?”

客服:“陈先生,因为我们有连线“AIC?CRM系统”。”;顾客:“我想要一个海鲜披萨……”

客服:“陈先生,?海鲜披萨不适合您。”

顾客:“为什么?”

客服:“根据您的医疗纪录,您有高血压和胆固醇偏高。”

(2.医疗数据库);顾客:“那……你们有什么可以推荐的?”

客服:“您可以试试我们的低脂健康披萨。”

顾客:“你怎么知道我会喜欢吃这种的?”

客服:“喔!?您上星期一在中央图书馆借了一本《低脂健康食谱》。”

(3.图书借阅数据库〕;顾客:“哎呀!好……,我要一个家庭号特大披萨,要多少钱?”

客服:“嗯,这个足够您一家十口吃,六百九十九元。”

顾客:“可以刷卡吗?”

客服:“陈先生,对不起,请您付现,因为您的信用卡已经刷爆了,

您现在还欠银行十万四千八百零七元,而且还不包括房贷利息。”

(4.金融数据库-信用卡);顾客:“喔!那我先去附近的提款机领钱。”

客服:“陈先生,根据您的记录,您已经超过今日提款机提款限额。”

(5.金融数据库-现金卡);顾客:“算了!你们直接把披萨送来吧,我这里有现金。你们多久会送到?”

客???:“大约三十分钟,如果您不想等,可以自己骑车来。”

顾客:“什么?!”

客服:“根据“AIC?CRM系统”记录,您有一辆摩托车,车号是GY-7878。”

(1.客户数据库);顾客:

客服:“陈先生,请您说话小心一点。您在2000年四月一日用脏话侮辱警察,被判了十日拘役。”

顾客:“……”

(6.刑事刑案数据库);客服:“请问还需要什么吗?”

顾客:“没有了,是不是有送三罐可乐?”

客服:“是的!不过根据“AIC?CRM系统”您有糖尿病……”;*;4、啤酒与尿布;原来,美国的妇女们经常会嘱咐她们的丈夫下班以后要为孩子买尿布。而丈夫在买完尿布之后又要顺手买回自己爱喝的啤酒,因此啤酒和尿布在一起购置的时机还是很多的。

是什么让沃尔玛发现了尿布和啤酒之间的关系呢?

正是商家通过对超市一年多原始交易数字进行详细的分析,通过数据挖掘中的关联规那么发现了这样的组合。;5、网上书店关联销售的案例;解决上述问题的步骤:

首先,确定数据源,也就是销售记录。

这里要用到两张表,一张表是该书店的会员,用会员ID号来代替;另一张表是会员买了什么书。然后,应用DataMining技术,建立数据挖掘模型。;对上述问题进行挖掘的结果:;数据挖掘所能解决的典型商业问题包括:

银行:反欺诈行为、关联销售、市场竞争分析。客户分类、客户价值分析与预测、客户偏好分析、客户信用分析以及欺诈检测等。

电信:流失预警、客户分群、关联销售。

网上销售点:购物车交叉销售、网上商品布局。;?DM在信用卡欺诈交易中的应用;?DM在大型零售企业中的应用;例如,一个超市营销的例子,经由记录客户的消费记录与采购路线,超级市场的厨房用品是按照女性的视线高度来摆放的。

根据研究得出:美国妇女的视线高度是150公分左右,男性是163公分左右,而最舒适的视线角度是视线高度以下15度左右,所以最好的货品陈列位置是在130-135公分之间。在商业上,有很多特征是很难理解的,但假设了解到这些信息就会增加企业的竞争能力。

;2、利用数据挖掘技术帮助企业准确制定营销策略,主要表现在:

〔1〕通过对市场同类产品和销售情况、顾客情况的资料收集和分类分析,明确细分市场,确定本企业差异化的产品和效劳定位、目标顾客和市场营销策略。〔业绩分析〕

〔2〕正确安排商品进货与库存,降低

文档评论(0)

寒傲似冰 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8071104010000026

1亿VIP精品文档

相关文档