- 1、本文档共51页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘综述的
数据挖掘综述;1 数据挖掘技术的由来;1.2 数据爆炸但知识贫乏;1.3 支持数据挖掘技术的技术基础;1.4 从商业数据到商业信息的进化;2 数据挖掘的定义 ;2.1数据挖掘在技术上的定义;;2.2 商业角度定义;2.3 数据挖掘与传统分析方法的区别;3 数据挖掘的研究历史和现状;3.1 研究历史;3.2 国内现状;3.3 业内现状;3.4 出版物及工具;4. 数据挖掘研究的内容;数据挖掘所发现的知识最常见的有以下几类:;4.1 广义知识(Generalization); 广义知识的发现方法和实现技术有很多,如数据立方体、面向属性的归约等。
数据立方体 : 基本思想是实现某些常用的代价较高的聚集函数的计算,诸如计数、求和、平均、最大值等,并将这些实现视图储存在多维数据库中。
面向属性的归约方法: 基本思想是收集数据库中的相关数据集,然后在相关数据集上应用一系列数据推广技术进行数据推广,包括属性删除、概念树提升、属性阈值控制、计数及其他聚集函数传播等。;4.2 关联知识(Association);关联规则的发现可分为两步:
第一步是迭代识别所有的频繁项目集,要求频繁项目集的支持率不低于用户设定的最低值;
第二步是从频繁项目集中构造可信度不低于用户设定的最低值的规则。;分类知识(Classification&Clustering);数据分类还有统计、粗糙集(Rough Set)等方法。线性回归和线性辨别分析是典型的统计模型。
为降低决策树生成代价,人们还提出了一种区间分类器。最近也有人研究使用神经网络方法在数据库中进行分类和规则提取。;4.4 预测型知识(Prediction);4.5偏差型知识(Deviation);5 数据挖掘的功能; 5.1 自动预测趋势和行为 ;5.2 关联分析;5.3 聚类;5.4概念描述;5.5偏差检测;6 数据挖掘常用技术 ;6.1 人工神经网络;;在使用神经网络时的几点注意;在使用神经网络时的几点注意; 6.2 决策树;决策树的基本组成部分:根节点、分支和叶节点。;决策树很擅长处理非数值型数据,这与神经网络只能处理数值型数据比起来,就免去了很多数据预处理工作。
甚至有些决策树算法专为处理非数值型数据而设计。;6.3遗传算法;7 数据挖掘的主要流程(四个阶段);数据挖掘各阶段的工作量;8 数据挖掘未来研究方向及热点;8.1 数据挖掘未来研究方向;加强对各种非结构化数据的开采 ,如对文本数据、图形数据、视频图像数据、声音数据乃至综合多媒体数据的开采。
知识的维护更新。;9 数据挖掘的应用; 数据挖掘在市场营销的应用
数据挖掘技术在企业市场营销中得到了比较普遍的应用,它是以市场营销学的市场细分原理为基础,其基本假定是“消费者过去的行为是其今后消费倾向的最好说明”。 通过收集、加工和处理涉及消费者消费行为的大量信息,确定特定消费群体或个体的兴趣、消费习惯、消费倾向和消费需求,进而推断出相应消费群体或个体下一步的消费行为,然后以此为基础,对所识别出来的消费群体进行特定内容的定向营销,这与传统的不区分消费者对象特征的大规模营销手段相比,大大节省了营销成本,提高了营销效果,从而为企业带来更多的利润。;电话收费和管理办法
加拿大BC省电话公司要求加拿大Simon Fraser大学KDD研究组根据其拥有的十多年的客户数据,总结、分析并提出新的电话收费和管理办法,制定既有利于公司又有利于客户的优惠政策。 ;竞技运动中的数据挖掘
大约20个NBA球队使用???IBM公司开发的数据挖掘应用软件Advanced Scout系统来优化他们的战术组合。
例如Scout就因为研究了魔术队队员不同的布阵安排,在与迈阿密热队的比赛中找到了获胜的机会。 ----系统分析显示魔术队先发阵容中的两个后卫安佛尼.哈德卫(Anfernee Hardaway)和伯兰.绍(Brian Shaw)在前两场中被评为-17分,这意味着他俩在场上,本队输掉的分数比得到的分数多17分。然而,当哈德卫与替补后卫达利尔.阿姆斯创(Darrell Armstrong)组合时,魔术队得分为正14分。;数据挖掘技术在商业银行中的应用
数据挖掘技术在美国银行金融领域应用广泛。金融事务需要搜集和处理大量数据,对这些数据进行分析,发现其数据模式及特征,然后可能发现某个客户、消费群体或组织的金融和商业兴趣,并可观察金融市场的变化趋势。
Mellon银行使用Intelligent Agent数据挖掘软件提高销售和定价金融产品的精确度,如家庭普通贷款。 ;
您可能关注的文档
- 扬州大学2010年博士的研究生招生专业目录.doc
- 技术创新的理论与方的法——最全的答案.doc
- 技术创新的理论与方的法考试题库.doc
- 扫描1920-1080项目返慕案及注意事项.doc
- 把南京大学建设成为的我国 核天体物理学 研究.ppt
- 抑郁性精神障碍1103的16法医系.ppt
- 抑郁障碍的诊治及特的殊情况的处理.ppt
- 抑制细菌蛋白质合成的的抗菌药.ppt
- 投资学第六章的.ppt
- 抗生素-微生物在药训魔中的应用.ppt
- 2025榆林定边县国有企业财务会计人员招聘(10人)笔试参考题库附带答案详解.pdf
- 2024中安密码测评中心总经理助理招聘笔试参考题库附带答案详解.pdf
- 2025年四川艺术职业学院单招职业技能测试近5年真题考点含答案解析.docx
- 2024湖北某国有企业招聘劳务派遣工作人员笔试参考题库附带答案详解.pdf
- 2024北京国家金融科技风险监控中心有限公司招聘出纳笔试参考题库附带答案详解.pdf
- 2024北京国新投资有限公司相关岗位招聘笔试参考题库附带答案详解.pdf
- 2024中煤天津设计工程有限责任公司公开招聘笔试参考题库附带答案详解.pdf
- 2025河北石家庄建筑行业大型国有企业招聘43人笔试参考题库附带答案详解.pdf
- 2023包钢(集团)公司招聘941人笔试参考题库附带答案详解.pdf
- 2024中国电信陕西公司政企信息服务事业群社会招聘42人笔试参考题库附带答案详解.pdf
文档评论(0)