- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据仓库和数据挖掘技术课件.ppt
数据仓库与数据挖掘技术 数据仓库和数据挖掘技术 什么是数据挖掘? 几种主要数据挖掘模型和算法 复杂类型数据的挖掘 数据挖掘都干了些什么? 英国电信需要发布一种新的产品,需要通过直邮的方式向客户推荐这种产品…… 通过数据挖掘的方法使直邮的回应率提高了100% GUS日用品零售商店需要准确的预测未来的商品销售量,降低库存成本…… 通过数据挖掘的方法使库存成本比原来减少了3.8% 数据挖掘都干了些什么? 美国国防财务部需要从每年上百万比的军火交易中发现可能存在的欺诈现象…… 发现可能存在欺诈的交易,进行深入调查,节约了大量的调查成本 汇丰银行需要对不断增长的客户群进行分类,对每种产品找出最有价值的客户。。。。。。 营销费用减少了30% 什么是数据挖掘? 通过采用自动或半自动的手段,在海量数据中发现有意义的行为和规则的探测和分析活动。 数据挖掘能够帮助你选择正确,瞄准潜在目标,向现有的客户提供额外的产品,识别那些准备离开的好客户。 数据挖掘是从数据中自动地抽取模式、关联、变化、异常和有意义的结构 数据挖掘大部分的价值在于利用数据挖掘技术改善预言模型 数据挖掘应用领域 电信 :流失 银行:聚类(细分), 交叉销售 百货公司/超市:购物篮分析 (关联规则) 保险:细分,交叉销售,流失(原因分析) 信用卡: 欺诈探测,细分 电子商务: 网站日志分析 税务部门:偷漏税行为探测 警察机关:犯罪行为分析 医学: 医疗保健 Data Mining: A KDD Process Data mining: the core of knowledge discovery process. Data Mining: Confluence of Multiple Disciplines 数据仓库和数据挖掘技术 什么是数据仓库( What is a data warehouse)? 多维数据模型(A multi-dimensional data model) 数据仓库体系结构(Data warehouse architecture) 什么是数据挖掘(What is a Data Mining)? 几种主要数据挖掘模型和算法 复杂类型数据的挖掘 Data Mining Functionalities (1) Concept description: Characterization and discrimination Generalize, summarize, and contrast data characteristics, e.g., dry vs. wet regions Association (correlation and causality) Multi-dimensional vs. single-dimensional association age(X, “20..29”) ^ income(X, “20..29K”) à buys(X, “PC”) [support = 2%, confidence = 60%] contains(T, “computer”) à contains(x, “software”) [1%, 75%] Data Mining Functionalities (2) Classification and Prediction Finding models (functions) that describe and distinguish classes or concepts for future prediction Presentation: decision-tree, classification rule, neural network Prediction: Predict some unknown or missing numerical values Cluster analysis Class label is unknown: Group data to form new classes, e.g., cluster houses to find distribution patterns Clustering based on the principle: maximizing the intra-class similarity and minimizing the interclass similarity Data Mining Functionalities (3) Outlier analysis Outlier: a data object that does not comply with the general behavior of the data
您可能关注的文档
最近下载
- 深度学习与计算机视觉实战-图像几何变换.pptx VIP
- 日立LCA15 LCA-O无机房电梯电气原理图纸K3500603(2019-1).pdf
- 2025年高中历史选择性必修一(全册)国家制度与社会治理复习提纲.pdf VIP
- 地质学课件-断裂构造.ppt VIP
- 四年级数学口算练习题乘法及答案(四年级乘法计算题100道).pdf VIP
- 3.1列代数式表示数量关系(第一课时)课件+2024-—2025学年人教版数学七年级上册+.pptx VIP
- 南宋建筑史pdf电子版下载.pdf VIP
- 史铁生的课件.pptx VIP
- 2024-2025学年初中音乐八年级上册(2024)人音版(2024 主编:赵季平,杜永寿)教学设计合集.docx
- 人教版七年级上册数学第一第二单元测试题精华.docx VIP
文档评论(0)