网站大量收购独家精品文档,联系QQ:2885784924

ID3算法在客户分类中的应用研讨.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ID3 IIDD33算法在客户分类中的应用研究 冯德振 张在美 苏东宁 (济南大学 机械学院,山东 济南,250022) 摘要:随着数据管理技术的发展和客户数据的爆炸性增长,决策树技术和客户分类的结合与应用成为现代 管理中一种重要的方法。本文首先简要介绍了客户分类和决策树技术,重点分析了决策树技术中的ID3 算 法及其在客户分类中的实际应用,根据案例分析结果整理了客户分类的规则,并针对不同的客户群提出了 不同的销售策略,探讨了决策树技术在客户分类中的意义和价值,以期为企业更好地掌握市场动态和挖掘 潜在客户提供有益的支持。 关键词:决策树分析;ID3 算法;客户分类 1 引言 客户关系管理(Customer Relationship Management, CRM)是一种以客户为中心的企业经营策略。它利 用现代通信技术,通过业务过程重构(Business Process Reengineering, BPR),增强企业的客户保持能力和 认知能力,最终达到客户效用最大化的目的。随着经济的发展和企业竞争环境的加剧,越来越多的企业意 识到为争取客户,仅靠优质的产品和分布广阔的销售网络是不够的,只有时刻关注客户需求、提高响应速 度、提供面向客户的“一对一”服务才能使企业获得客户信赖,才能在激烈的市场竞争中保持优势。 企业的增长和发展壮大需要不断获得新客户并维持老客户。不论企业希望得到的是哪类客户,数据挖 掘都能帮助识别出这些潜在的客户群,并提高市场活动的回应率,做到有的放矢。现在各个行业的竞争都 越来越激烈,企业获得新客户的成本正在不断上升,调查发现,开发一个新客户的成本是留住老客户的5 倍,而流失一个老客户的损失,只有争取10 个新客户才能弥补,而且往往失去的客户比新得到的客户要 贡献更多的利润。因此保持原有客户对企业来说是非常重要的。 调查发现,大部分企业每年有20%—50%的客户是变动的。通过数据挖掘技术,对历史数据库中流失 的客户建模,分析其行为特征与属性,然后利用分类技术对现有客户进行预测,找出具有类似特征的客户, 并根据这些客户所属类别,在这些客户还没有流失之前采取相应的措施,吸引客户继续与企业保持良好的 关系。决策树分析方法和贝叶斯分析方法可以应用于此问题。 总之,利用数据挖掘技术对数据进行分析,从中发现相关的知识和规律,可以使整个系统形成一个闭 环,充分发挥CRM 系统的作用。 2决策树分析方法 决策树分析方法是一种从无次序、无规则的训练样本集中推理出决策树表示形式的分类规则的方法。 它采用自顶向下的递归方式,在决策树的内部结点中进行属性值的比较并根据不同的属性值判断从该结点 向下的分支,在决策树的叶结点得到结论,所以从根到叶结点的一条路径就对应着一条合取规则,整棵决 策树就对应着一组析取表达式规则。决策树有多种算法,本文采用ID3 算法进行实例研究。 2.1 ID3算法 在各种决策树分析方法中,最有影响的是Quinlan 于1979 年提出的以熵的下降速度作为选取测试属性 的标准ID3 算法。该方法利用已知类别的样本给出顺序测试属性,直到全部样本被正确归类为止。在形成 决策树的过程中,利用了信息论的一个方法,该方法是在任何时候,都寻找能提供最大信息增益,即提供 最大熵降低的属性。 对于N个样本,它们分成属于类别C(i=1,2,…,C)的样本集合,类别C 中的样本个数为N , i i i 每个样本有K个属性,每个属性有J 个值。决策树的构造过程为: k C (1)计算初始熵。熵(I)= (N / N) log (N / N)  p log p i 2 i i 2 i i1 对于训练集而言,所有样本的类别是已知的,因此有N个样本构成了系统的初始熵。 (2)选择一个属性作为决策树的根结点: ①对每个属性A (k=1,2,…,k)按照属性A 的J个a

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档