演讲内容.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
演讲内容

内容提要 数据挖掘概念 数据挖掘方法论 航空公司数据挖掘应用 电子商务与数据挖掘 航空电子商务数据挖掘应用案例分享 1.数据挖掘概念-定义 知识发现(KDD) knowledge discovery in database 从数据中发现有用知识的整个过程 从大量数据中提取出可信的、新颖的、有用的并能被人理解的模式的高级处理过程。 数据挖掘(DM) KDD过程中的一个特定步骤,它用专门算法从数据中抽取模式(patterns)。 “模式”可以看成是“知识”的雏形,经过验证、完善后形成知识。 1.数据挖掘概念- KDD过程 1.数据挖掘概念-方法和技术 归纳学习方法 决策树方法 集合论方法 仿生物技术 神经网络方法 遗传算法 公式发现 物理定律发现系统BACON 经验公式发现系统FDD 统计分析方法 利用统计学原理通过对总体中的样本数据进行分析得出描述和推断该总体信息和知识的方法。 模糊数学方法 利用模糊集合理论进行数据挖掘,如模糊聚类、模糊分类等。 可视化技术 利用可视化技术分析数据库,找到潜在的有用信息。 1.数据挖掘概念-几种模式 分类 分类问题属于预测性的问题,它跟普通预测问题的区别在于其预测的结果是类别 。 典型三种算法:Logistic回归 ;决策树;神经网络 应用场所:判定类别等 聚类 指把一组个体按照相似性归成若干类别 。 典型算法:基于欧氏距离;K-means算法 应用场所:市场细分 关联 挖掘发现大量数据中项集之间有趣的关联或相关联系 典型算法:Apriori算法; FP-Growth算法; 应用场所:交叉销售(购物篮-啤酒与尿布) 偏差检测(异常点分析) 在数据库中找出异常数据。 应用场所:欺诈检测 预测 利用历史数据找出变化规律的模型,并用此模型预测未来。 时序模式 通过时间序列搜索出重复发生概率较高的模式。这里强调时间序列的影响。 2.数据挖掘方法论 由厂商提出的 SPSS的5‘A(Assess, Access, Analysis, Act, Automat) SAS的SEMMA(Sample, Explore, Modify, Model, Assess) MICROSOFE的OLEDB for DM 由行业组织提出的 CRISP-DM(Cross Industry Standard Process for DM) CRISP-DM起源于1998年,当时NCR、Clementine(1998年为SPSS收购)、OHRA和Daimler-Benz(现为Daimler-Chrysler)的联合项目组提出 CRISP-DM的六个阶段 方法论各有优劣,都有成功案例 2.企业数据挖掘的主要任务 2.数据挖掘的典型行业应用 3.数据挖掘在航空公司的应用 电子商务领域 传统客户关系管理 呼叫中心 常客俱乐部 代理人管理 航线分析 航线分类与聚类 渠道管理 定座控制 BIDT/MIDT稽查 财务 资金监控 经营考核指标 机务 零部件库存 工单 航务 正常率 飞行品质 …… 4.电子商务与数据挖掘 互联网开放技术使数据更详尽、更容易获得,快速数据挖掘成为可能 交易订单 访客行为 搜索引擎 WEB2.0 蓝海、长尾 电子商务面向个人 个性化服务要求针对客户群体细分的市场反应 个性化市场反应需要快速的数据分析与知识发现 提升网站黏度 5.数据挖掘案例分享 客户流失 (分类模型、Logistic回归算法) 用户流失预测 (分类模型、神经网络、Logistic回归算法) 购买倾向预测 (分类模型、Logistic回归算法) 增量销售预测 (分类模型、Logistic回归算法) 客户价值增长预测 (分类模型、Logistic回归算法) 竞争对手流失预测 (分类模型、Logistic回归算法) 客户级别打分 (分类模型、Logistic回归算法) 点击率分析(聚类模型、偏差检测、Logistic回归算法) 网站访问行为分析(聚类模型) 客户分群 (聚类模型、K-Means算法) 购物篮分析 (关联规则) …… 5.数据挖掘案例-网站客户分群 目的 物以类聚 针对不同群体做不同动作 方法 聚类分析:根据用户的关键属性将其分成不同的组别,要求做到:组间差异化最大,组内相似性最大 应用 用户访问行为聚类分析,从而优化网站技术架构,例如针对搜索引擎 用户购买行为聚类分析,做不同的促销活动,细分市场,精确营销,提高网站粘度 页面点击率聚类分析,发现页面流质量 5.数据挖掘案例-网站客户流失 目的:预测某一段时间之后客户流失的概率。 方法:分类模型 确定时间窗口 确定目标变量:定义在Data Window中正常而在Forecast Window中流失的客户为0,没有流失

文档评论(0)

daoqqzhuan2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档