利用粗集和概率统计进行客户关系管理研究.pdfVIP

利用粗集和概率统计进行客户关系管理研究.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用粗集和概率统计进行客户关系管理 李钝梁吉业 (山西大学计算机科学系,太原030006) (山西大学计算中心,太原030006) 摘要 企业要想在电子商务中获得更多的客户和利润,就必须能够对客户关系管理进行深 入分析获取客户的最有用信息,然后有针对性的对他们提供服务。本文利用粗集和 概率统计相结合的方法对客户信息进行分析,用Shannon的熵理论对各条件属性的 重要性进行度量,依算法推理数据间的关系,找到包含最重要信息的那个约简,有 效的促进了优化规则的快速提取。 关键词粗集属性约简熵客户关系管理(CRM) 随着Intemet逐渐覆盖全球,各个国家越来越多的公司蜂拥到Intemet上开展电子商务, 随着我国顺利加入WTO的发展也将迫使我们加快电子商务的推进步伐,不管我们愿不愿意承 不承认电子商务都在向我们走来,将逐渐改变我们的生活习惯、生活方式,改变企业与企业、 企业与客户之间的关系,商业活动也由推销企业的产品转变为满足客户需求提供满意服务, 将客户摆到主导地位。根据专家分析,商业活动中普遍存在着“80/20原则”,即80%的利润 来自于20%的客户,企业要想获得更多的客户和利润,就必须提供满意服务,维系客户忠诚、 留住客户,比你的竞争对手更了解你的客户。因此,如何从商家掌握的浩如烟海的客户数据 中提取出潜在有价值的知识,成为日益关注的问题。 1粗集理论及其概念 数据挖掘是基于假定“消费者过去的行为是其今后消费倾向的最好说明”,对CRM(客户 关系管理)中已获取的数据信息进行分析处理发现趋势或模式的一种工具。在CRM中,电子 商务的数据都是以数据库的形式组织管理的,数据挖掘就是从这些数据库中提取出大量人们 感兴趣的知识和规则,这些知识和规则是隐含的、先前未知的、对决策有潜在价值的有用信 息。本文利用数据挖掘中的粗集理论和概率统计相结合的方法,对通过各种途径收集到的客 户数据进行分析、近似分类、推理数据间的关系,从中获取规则发现隐含的知识,使商家更 好的了解客户,有针对性的提供特惠服务,发现并留住客户,获取更大的收益。 (1)信息系统 粗集把客观对象世界抽象为一个信息系统S=(U,R,V,厂),其中U是一组对象(或事例) R=C 的有限集合,称为论域; UD是属性集合,集合CT和D分别称为条件属性集和结果属 973 性集:V是属性的值域集合,厂:U×R哼V是一个信息函数,它指定U中每一个对象x的 属性值。一个信息系统常用一张二维表格来表示,在本文中,行对应论域中的具体实例,即 一个个具体的客户,列对应于实例属性,即客户的诸如收入状况、上网时间等相关属性,行 和列的交叉点是这个客户在这个属性上的值。 (2)上近似和下近似 设尸sR,x∈U,b】P表示x在P(x)上的等价类。 I 下近似:只(X)={xx∈U:[_)c】。sX) 上近似:户一(X)={xI X≠≯) x∈U:[x】。N 域,bn,(彳)称为J的P边界。 (3)约简和核 在信息系统中,各个条件属性之间往往存在着某些程度上的依赖或关联。去掉条件属性 中不会影响决策的那些属性的过程就是约简,约简之后形成的集合是不含多余属性并能保证 分类正确的最小属性集。具体说,就是 对于一个给定的信息系统S,R的约简是R的一个非空子集尺’,并且满足 · IND(R,D)=IND(R,D) ·对任意R”c R’,IND(R。,D)≠IND(R,D) IND表示不可分辨关系,R的约简记为RED(R)。 R中所有不可分辨关系的集合称为R的核,记作CORE(R)。 核与约简的关系:CORE(R)=NRED(R)。 (4)属性重要度 属性的重要度就是该属性会对于决策属性或数据分类问题的影响程度。利用粗糙集的方 法进行属性或属性值的约简经常会产生多种结果,但在实际应用中一般没有必要求出所有的 约简,本文采用Shannon提出的熵的概念作为属性重要度的统计测度,

您可能关注的文档

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档