网站大量收购独家精品文档,联系QQ:2885784924

《数据挖掘在物流企业客户分析中的研究与应用》.doc

《数据挖掘在物流企业客户分析中的研究与应用》.doc

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘 要 近几年来,随着物流业的迅猛发展,第三方物流企业越来越多,企业之间的竞争也越来越激烈。各个企业要想在激烈的竞争中处于优势地位,就必须把握好自己的客户资源,而维系客户资源的前提就是要充分了解客户的需求和客户的行为。针对企业数据库中存储的大量客户信息,将数据挖掘技术应用到企业的客户分析中,从中找出有价值的数据,从而维持老客户,吸引新客户,提高客户的满意度,进而增加客户的忠诚度以提高客户的价值和利润就成了一件竞争的利器,对加强物流企业的竞争力会起到十分重要的作用。 本文主要做了两方面的工作:一是对数据挖掘决策树分类算法进行了研究,并针对ID3算法的缺陷,提出了改进的RID3-1算法。二是将决策树分类算法应用到了物流企业的客户理赔分析中,建立了数据仓库,并进行了挖掘。通过对结果的分析,给企业提出了一些改善客户关系的建议。下面对这两方面进行一下详细说明。 (1)决策树分类算法中最为经典的是Quinlan在1986年提出的ID3算法。该算法有三大主要缺点:1)算法偏向于选择取值较多的属性,而取值较多的属性往往并不是最优属性;2)它只能处理离散值属性,对于连续值属性,需要预先进行离散化;3)该算法在预测时必须知道从叶子节点到根节点的路径上所有内节点对应属性的属性值。 针对缺点1),本文用粗糙集理论中的属性依赖度对ID3算法进行改进,提出了RID3算法,RID3算法是依据决策属性对条件属性的依赖度k的大小,作为建立决策树的属性选择标准。针对缺点3),本文提出在用ID3算法构造决策树的同时,记录下从每个分类节点到根节点的路径上的分类数目,也就是说记录下每个分类节点处所包含的记录数。这样,即使测试集中的记录中存在缺失属性,我们也可以根据决策树来预测该事件发生的概率,从而提高了决策树的预测能力。在以上两点思想的基础上,本文提出了RID3-1算法,并用具体实例证明了该算法的有效性,以及相对于ID3算法的优越性。 (2)本文通过对某综合型物流企业的客户数据和业务情况进行了分析,确立了分析的主题,在Oracle11g数据库中建立了用于数据挖掘的数据仓库,对数据进行了预处理。在此基础上,用SPSS Clementine11.1数据挖掘工具对企业2008年的客户理赔数据进行了数据挖掘,对结果进行了分析,为企业改善客户关系提出了一些建议,具有一些实用性。 本文从理论上和实验上证明了本文所改进算法的有效性,并将决策树分类技术应用到了物流企业的客户分析中,拓宽了数据挖掘的应用领域。 关键词:物流企业,客户分析,ID3算法,粗糙集,属性依赖度 ABSTRACT In recent years,accompanied with the development of logistics Industry, more and more third-party logistics enterprises arise and the competition among them become increasingly fierce. Enterprise who wants to have a dominant position in this competition must hold its customers, the premise of which is to fully apprehend the customer’s needs and behaviors. We should apply the data mining technology to analyze the customer’s information which stores in the company’s database. We may find valuable information from these data so as to maintain existing customers and attract new customers, to improve customer’s satisfaction, thus increasing their loyalty and enhance their value and profit. This will become a competitive weapon and play a very important role in strengthening the third logistics enterprises’ competitiveness. In this paper, we mainly do two works. First, the data mining decision tree

文档评论(0)

lipinting + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档