- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
;课程目标;1.数据挖掘的产生与发展;数据?;数据挖掘技术的由来;《纽约时报》由60年代的10~20版扩张至现在的100~200版,最高曾达1572版;《北京青年报》也已是16~48版;
国家图书馆有1000万册图书,一个公司就可能拥有这些数据;
统计流程控制通过成千上万个传感器不断读取和记录数据;
电话系统,网络系统一个月的记录可能需要1012条记录超过1000gigabyte 。 ;产生的问题;;数据挖掘的演变过程;数据可以产生商业价值;数据挖掘的定义;远古至今即存在数据挖掘; 数据挖掘--从大量数据中寻找规律技术,是统计学、数据库技术和人工智能技术等的综合。;数据挖掘的功能 ;需要数据挖掘的5条理由;数据挖掘的重要性;数据挖掘与数据查询;电信公司的长话业务数据分布;;2.数据挖掘的应用;;科学研究;商业领域的数据挖掘;;Web 挖掘;市场营销;;3.数据挖掘的流程(6步法);如何定义有兴趣的模式;数据挖掘流程与美食制作;六步之一:商业理解;六步之二:数据理解;六步之三:数据准备;六步之四:建立模型与模式;有监督的数据挖掘(学习);有监督的数据挖掘模型例;Diagonosis=咽炎;无监督的数据挖掘;35.00 = Age = 43.00
and Life Ins Promo = Yes
:rule accuracy 100.00%
:rule coverage 100.00%
35.00 = Age = 43.00
and Magazine Promo = Yes
:rule accuracy 85.71%
:rule coverage 85.71% ;六步之五:模型评价;错误不对称;六步之六:结果发布;4. 一个目录直销的例子;目录直销业常见的几个目标;案例背景;RFM分析;;第二步:客户行为模式分布
;SAM客户的购买习惯分析;;;最后一步:
制订决策:目标市场定位于年龄在35-44岁的客户。
;5.数据挖掘的基本算法;;1)决策树模型;例:垃圾邮件的识别问题;2) 关联规则(Association Rule);关???规则的可信度(Confidence);关联规则的支持度 (Support);3)序列模式;序列模式例;4).聚类;5).类神经网络;6.数据挖掘软件发展现状;二、数据挖掘软件的发展;第二代数据挖掘软件;数据挖掘软件的发展;独立的数据挖掘软件(95年以前);通用数据挖掘软件的盛行(95年开始);通用数据挖掘工具集(95年开始);第二代数据挖掘软件DBMiner;第二代软件SAS Enterprise Miner;第三代软件 SPSS Clementine;发展原因
随着横向的数据挖掘工具的使用日渐广泛,人们也发现这类工具只有精通数数据挖掘算法的专家才能熟练使用,如果对算法不了解,难以得出好的模型
从1999年开始,大量的数据挖掘工具研制者开始提供纵向的数据挖掘解决方案(Vertical Solution),即针对特定的应用提供完整的数据挖掘方案
对于纵向的解决方案,数据挖掘技术的应用多数还是为了解决某些特定的难题,而嵌入在应用系统中;行业数据挖掘解决方案(99年开始);行业数据挖掘解决方案(99年开始);第四代数据挖掘软件;综合的数据挖掘解决方案;三、数据挖掘软件的现状;调查报告(2002.6.3-6.16);大部分处于科研阶段
各大学和科研机构从事数据挖掘算法的研究
国内著作的数据挖掘方面的书较少(翻译的有)
有一些公司在国外产品基础上开发的
文档评论(0)