- 1、本文档共125页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库与数据挖掘要点
教学方式与考核方式 教学方式 本课程以课堂教学为主,以电子教案的内容为主线 课外阅读指定的参考文献并利用网上资源,加深对教学内容的理解。 考核方式及要求 1、平时: 点名+一篇报告(以数据挖掘为关键字查询论文,至少选读8篇,写读书报告或文献综述) 2、上机实验报告 3、期末课堂考试(开卷) 企业面临的问题 经过多年的计算机应用和市场积累,许多企业保存了大量原始数据和各种业务数据, 它是企业生产经营活动的真实记录 由于缺乏集中存储和管理,这些数据不能为本企业加以利用, 不能进行有效的统计、分析及评估,无法将这些数据转换成企业有用的信息 数据爆炸问题 自动的数据收集工具和成熟的数据库技术导致巨大的数据存储在文件系统、数据库和其它的信息库中 。 我们会淹死在数据中, 但却为信息、知识所饿! 面临的挑战 如何在堆积如山的企业交易数据中发现具有商业价值的闪光点? 如何使您的企业或组织在激烈的市场竞争中保持对客户的吸引力? 如何预先发现和避免企业运作过程中不易察觉的商业风险? * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 数据挖掘逐渐演变的过程 最近人们却逐渐开始使用数据挖掘中有许多工作可以由统计方法来完成,并认为最好的策略是将统计方法与数据挖掘有机的结合起来。 数据仓库技术的发展与数据挖掘有着密切的关系。数据仓库的发展是促进数据挖掘越来越热的原因之一。但是,数据仓库并不是数据挖掘的先决条件,因为有很多数据挖掘可直接从操作数据源中挖掘信息。 数据挖掘应用前景看好 - 电信(客户流失、欺诈甄别) - 零售(销售预测;成本控制) - 农业(行业数据预测) - 电子商务(商品推荐;个性化网页等) - 银行(建立利润评测模型;客户关系优化;风险控制等) - 生物制药(DNA序列查询与匹配;识别基因序列的共发性) - 保险…… 数据挖掘解决的典型问题 数据库营销(Database Marketing) 客户群体划分(Customer Segmentation Classification) 背景分析(Profile Analysis) 交叉销售(Cross-selling) 客户流失性分析(Churn Analysis) 客户信用记分(Credit Scoring) 欺诈发现(Fraud Detection) …… 国内应用存在的问题 数据积累不充分、不全面 业务模型构建困难 缺少有经验的实施者 数据挖掘未来发展 与数据仓库系统集成 与预言模型系统集成 挖掘各种复杂类型的数据 与应用相结合 研制和开发数据挖掘标准 支持移动环境 6、数据挖掘简介 数据挖掘的概念 数据挖掘是从大量数据中提取或挖掘知识。 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 什么是数据挖掘 例子 “买尿布的客户中,80%买了啤酒!!” 发生在美国大型超市WalMart的实例。 周四,消费者通常同时购买尿布和啤酒 出乎意料的信息,但对商店有用 原因? 数据挖掘的潜在应用 数据库查询与数据挖掘间的工具比较 查询工具 - 查询所要访问对象是否在某一特定位置。 -“照亮”感兴趣的数据 - 主动的、不生成严格的结果和不同层次的挖掘 挖掘工具 - 缩小范围、提高敏感度、针对动态变化。 - 趋势、模式。 - 被动的、只对字段进行严格的查询。 数据挖掘的特点 从实际海量数据源中发现知识。完整性、一致性、正确性难以保证。 -处理数据规模十分庞大 -适于寻找感兴趣的内容 -对数据的变化能快速响应 -发现潜在规则、不断更新规则 -基于一定的阈值,使用相应的规则 数据挖掘与传统分析方法的区别 数据挖掘与传统的数据分析(如查询、报表、联机应用分析)的本质区别是 - 数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先知、有效和可实用三个特征。 - 先前未知的信息是指该信息是预先未曾预料到的,既数据挖掘是要发现那些不能靠直觉发现的信息或知识,甚至是违背直觉的信息或知识,挖掘出的信息越是出乎意料,就可能越有价值。 数据挖掘研究的内容 随着DMKD研究逐步走向深入,数据挖掘和知识发现的研究已经形成了三根强大的技术支柱:数据库、
您可能关注的文档
- 珠算乘法课件1.ppt
- 班主任为幸福坚守.ppt
- 班主任培训内容.doc
- 班主任论坛家校沟通.ppt
- 数字脉冲(中文).ppt
- 数字逻辑电路第一章习题纠错.ppt
- 数字逻辑课程设计--电缆通断检测.doc
- 班会珍惜生命_重视交通安全——交通安全主题班会PPT课件.ppt
- 数字电路与逻辑设计实验报告.doc
- 数据、信息、知识、 情报及关系.pptx
- 专题06 经济体制(我国的社会主义市场经济体制)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题11 世界多极化与经济全球化-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 专题03 经济发展与社会进步-5年(2020-2024)高考1年模拟政治真题分类汇编(浙江专用)(解析版).docx
- 专题09 文化传承与文化创新-5年(2020-2024)高考1年模拟政治真题分类汇编(北京专用)(原卷版).docx
- 5年(2020-2024)高考政治真题分类汇编专题08 社会进步(我国的个人收入分配与社会保障)(原卷版).docx
- 专题07 探索世界与把握规律-5年(2020-2024)高考1年模拟政治真题分类汇编(解析版).docx
- 5年(2020-2024)高考政治真题分类汇编专题06 经济体制(我国的社会主义市场经济体制)(原卷版).docx
- 专题11 全面依法治国(治国理政的基本方式、法治中国建设、全面推进依法治国的基本要求)-五年(2020-2024)高考政治真题分类汇编(解析版).docx
- 专题17 区域联系与区域协调发展-【好题汇编】十年(2015-2024)高考地理真题分类汇编(解析版).docx
- 专题01 中国特色社会主义-5年(2020-2024)高考1年模拟政治真题分类汇编(原卷版).docx
最近下载
- 13套题,必过,阿坝州拟任科级领导干部任职资格政治理论考试题汇总.pdf
- 2023年关于医药领域腐败问题全面集中整治自查自纠报告与医院开展医疗领域群众身边腐败作风问题专项整治工作总结【两篇】.docx VIP
- 高中语文必修二课件--念奴娇·赤壁怀古.ppt VIP
- 高中化学选修三全套.pptx VIP
- 中国特色社会主义理论体系的形成的历史条件.ppt VIP
- 领导讲话稿写作方法和技巧.ppt
- 高中:原创语文《反对党八股》(定稿).pptx VIP
- 液压升降机油路图液压升降机毕业设计.doc VIP
- 《管理学原理》全套课后习题答案(大学期末复习资料).docx
- 高中课件:原创语文《反对党八股》公开课课件.pptx VIP
文档评论(0)