- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘最常见的十种方法
下面介绍十种数据挖掘( Data Mining )的分析方法,以便于大家对模型的初步了解,这些都是日常挖掘中经常遇到的算法,希望对大家有用! (甚至有数据挖掘公司,用其中的一种算法就能独步天下)
1、基于历史的 MBR分析( Memory-Based Reasoning;MBR)
基于历史的 MBR分析方法最主要的概念是用已知的案例 ( case)来预测未来案例
的一些属性( attribute ),通常找寻最相似的案例来做比较。
记忆基础推理法中有两个主要的要素,分别为距离函数( distance function )
与结合函数( combination function )。距离函数的用意在找出最相似的案例;结合函数则将相似案例的属性结合起来, 以供预测之用。 记忆基础推理法的优点是它容许各种型态的数 据,这些数据不需服从某些假设。另一个优点是其具备学习能力,它能藉由旧案例的学习来获取关于新案例的知识。 较令人诟病的是它需要大量的历史数据,有足够 的历史数据方能做良好的预测。此外记忆基础推
理法在处理上亦较为费时, 不易发现最佳的距离函数与结合函数。 其可应用的范围包括欺骗行为的侦测、客户反应预 测、医学诊疗、反应的归类等方面。
2、购物篮分析( Market Basket Analysis )
购物篮分析最主要的目的在于找出什么样的东西应该放在一起商业上的应用在
藉由顾客的购买行为来了解是什么样的顾客以及这些顾客为什么买这些产品, 找出相 关的联想(association )规则,企业藉由这些规则的挖掘获得利益与建立
竞争优势。举例来说,零售店可藉由此分析改变置物架上的商品排列或是设计 吸引客户的商业套餐等等。
购物篮分析基本运作过程包含下列三点:
1)选择正确的品项:这里所指的正确乃是针对企业体而言,必须要在数以百计、千计品项中选择出真正有用的品项出来。
( 2)经由对共同发生矩阵( co-occurrence matrix )的探讨挖掘出联想规则。
3)克服实际上的限制: 所选择的品项愈多, 计算所耗费的资源与时间愈久 (呈现指数递增),此时必须运用一些技术以降低资源与时间的损耗。
购物篮分析技术可以应用在下列问题上:
1)针对信用卡购物,能够预测未来顾客可能购买什么。
2)对于电信与金融服务业而言,经由购物篮分析能够设计不同的服务组合以扩大利润。
3)保险业能藉由购物篮分析侦测出可能不寻常的投保组合并作预防。
4)对病人而言,在疗程的组合上,购物篮分析能作为是否这些疗程组合会导致并发症的判断依据。
3、决策树( Decision Trees )
决策树在解决归类与预测上有着极强的能力, 它以法则的方式表达, 而这些法则则以一连串的问题表示出来, 经由不断询问问题最终能导出所需的结果。 典型的决策 树顶端是一个树根,底部有许多的树叶,它将纪录分解成不同的子集,每
个子集中的字段可能都包含一个简单的法则。 此外,决策树可能有着不同的外型,例如二元 树、三元树或混和的决策树型态。
4、遗传算法( Genetic Algorithm )
遗传算法学习细胞演化的过程,细胞间可经由不断的选择、复制、交配、突变产生更佳的新细胞。基因算法的运作方式也很类似,它必须预先建立好一个模式,
再经 由一连串类似产生新细胞过程的运作,利用适合函数( fitness function )决定所产生的后代是否与这个模式吻合, 最后仅有最吻合的结果能够存活, 这个程序一直运作直到此函数收敛到最佳解。 基因算法在群集 ( cluster )问题上有不错的表现,一般可用来辅助记忆基础推理法与类神经网络的应用。
5、聚类分析( Cluster Detection )
这个技术涵盖范围相当广泛, 包含基因算法、 类神经网络、 统计学中的群集分析都有这个功能。 它的目标为找出数据中以前未知的相似群体, 在许许多多的分析中,刚开始都运用到群集侦测技术,以作为研究的开端。
6、连接分析( Link Analysis )
连接分析是以数学中之图形理论( graph theory )为基础,藉由记录之间的关系发展出一个模式, 它是以关系为主体, 由人与人、 物与物或是人与物的关系发展出相当多的应用。例如电信服务业可藉 连结分析收集到顾客使用电话的时间与频率,进而推断顾客使用偏好为何,提出有利于公司的方案。除了电信业之外,
愈来愈多的营销业者亦利用连结分析做有利于 企业的研究。
7、OLAP分析( On-Line Analytic Processing ;OLAP)
严格说起来, OLAP分析并不算特别的一个数据挖掘技术,但是透过在线分析处
理工具,使用者能更清楚的了解数据所隐藏的潜在意涵。 如同一些视觉处理技术一般,透过图表或图形等
您可能关注的文档
最近下载
- 吉林省2025年初中学业水平考试暨第四次统一模拟联考 数学试卷(含答题卡、答案).pdf VIP
- 【精选】《专家与通人》《专家与通人》.ppt VIP
- 卫星通信基础题库及答案.doc
- GB51101-2016 太阳能发电站支架基础技术规范.docx VIP
- 部编版小学六年级语文上册第17课《盼》精美课件.pptx
- 工厂火灾应急处置流程.pptx VIP
- 2025年高考语文模拟试卷03(新高考Ⅱ卷)及答案.docx VIP
- 《电气控制技术应用与实训》 课件 4.1工作台自动往返控制电路安装与调试.pptx
- GB 4706.1标准解读_从模块上分析标准结构 - 材料系统.xlsx
- 《赵威后问齐使》.ppt VIP
原创力文档


文档评论(0)