- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
利用粗集和概率统计进行客户关系管理
李钝梁吉业
(山西大学计算机科学系,太原030006)
(山西大学计算中心,太原030006)
摘要 企业要想在电子商务中获得更多的客户和利润,就必须能够对客户关系管理进行深
入分析获取客户的最有用信息,然后有针对性的对他们提供服务。本文利用粗集和
概率统计相结合的方法对客户信息进行分析,用Shannon的熵理论对各条件属性的
重要性进行度量,依算法推理数据间的关系,找到包含最重要信息的那个约简,有
效的促进了优化规则的快速提取。
关键词粗集属性约简熵客户关系管理(CRM)
随着Intemet逐渐覆盖全球,各个国家越来越多的公司蜂拥到Intemet上开展电子商务,
随着我国顺利加入WTO的发展也将迫使我们加快电子商务的推进步伐,不管我们愿不愿意承
不承认电子商务都在向我们走来,将逐渐改变我们的生活习惯、生活方式,改变企业与企业、
企业与客户之间的关系,商业活动也由推销企业的产品转变为满足客户需求提供满意服务,
将客户摆到主导地位。根据专家分析,商业活动中普遍存在着“80/20原则”,即80%的利润
来自于20%的客户,企业要想获得更多的客户和利润,就必须提供满意服务,维系客户忠诚、
留住客户,比你的竞争对手更了解你的客户。因此,如何从商家掌握的浩如烟海的客户数据
中提取出潜在有价值的知识,成为日益关注的问题。
1粗集理论及其概念
数据挖掘是基于假定“消费者过去的行为是其今后消费倾向的最好说明”,对CRM(客户
关系管理)中已获取的数据信息进行分析处理发现趋势或模式的一种工具。在CRM中,电子
商务的数据都是以数据库的形式组织管理的,数据挖掘就是从这些数据库中提取出大量人们
感兴趣的知识和规则,这些知识和规则是隐含的、先前未知的、对决策有潜在价值的有用信
息。本文利用数据挖掘中的粗集理论和概率统计相结合的方法,对通过各种途径收集到的客
户数据进行分析、近似分类、推理数据间的关系,从中获取规则发现隐含的知识,使商家更
好的了解客户,有针对性的提供特惠服务,发现并留住客户,获取更大的收益。
(1)信息系统
粗集把客观对象世界抽象为一个信息系统S=(U,R,V,厂),其中U是一组对象(或事例)
R=C
的有限集合,称为论域; UD是属性集合,集合CT和D分别称为条件属性集和结果属
973
性集:V是属性的值域集合,厂:U×R哼V是一个信息函数,它指定U中每一个对象x的
属性值。一个信息系统常用一张二维表格来表示,在本文中,行对应论域中的具体实例,即
一个个具体的客户,列对应于实例属性,即客户的诸如收入状况、上网时间等相关属性,行
和列的交叉点是这个客户在这个属性上的值。
(2)上近似和下近似
设尸sR,x∈U,b】P表示x在P(x)上的等价类。
I
下近似:只(X)={xx∈U:[_)c】。sX)
上近似:户一(X)={xI X≠≯)
x∈U:[x】。N
域,bn,(彳)称为J的P边界。
(3)约简和核
在信息系统中,各个条件属性之间往往存在着某些程度上的依赖或关联。去掉条件属性
中不会影响决策的那些属性的过程就是约简,约简之后形成的集合是不含多余属性并能保证
分类正确的最小属性集。具体说,就是
对于一个给定的信息系统S,R的约简是R的一个非空子集尺’,并且满足
· IND(R,D)=IND(R,D)
·对任意R”c
R’,IND(R。,D)≠IND(R,D)
IND表示不可分辨关系,R的约简记为RED(R)。
R中所有不可分辨关系的集合称为R的核,记作CORE(R)。
核与约简的关系:CORE(R)=NRED(R)。
(4)属性重要度
属性的重要度就是该属性会对于决策属性或数据分类问题的影响程度。利用粗糙集的方
法进行属性或属性值的约简经常会产生多种结果,但在实际应用中一般没有必要求出所有的
约简,本文采用Shannon提出的熵的概念作为属性重要度的统计测度,
您可能关注的文档
- 电网调度操作票生成及安全校验系统的开发与应用研究.pdf
- 利用ANSYS计算复杂薄壁杆件的截面特性研究.pdf
- 利用AutoCAD自制温度湿度tx图研究.pdf
- 电网调度防误技术在集控站系统中的应用研究.pdf
- 电网调度管理系统防误技术探讨与应用研究.pdf
- 利用CASS50软件提高成图效率研究.pdf
- 电网调度运行管理系统的开发与应用研究.pdf
- 电网调度中的人员失误及其预防研究.pdf
- 利用CINRADSA基本产品监测强对流天气的一般方法研究.pdf
- 利用CINRAD资料分析南方夏季对流性降水云的基本特征研究.pdf
- 2025年烟台市正大城市建设发展有限公司招聘工作人员12名笔试参考题库附带答案详解.doc
- 2025年衢州市属国企公开招聘工作人员笔试参考题库附带答案详解.doc
- 2025中铁四局集团有限公司法律合规部公开招聘1人笔试参考题库附带答案详解.docx
- 2025中国建筑股份有限公司岗位招聘【人力资源部(干部人事部)】笔试参考题库附带答案详解.docx
- 2025年滁州定远县中盐东兴盐化股份有限公司招聘2人笔试参考题库附带答案详解.doc
- DB1331T109-2025雄安新区建设工程抗震设防标准(963.84KB)(1).pdf
- 2025辽宁省能源控股集团所属抚矿集团招聘76人笔试参考题库附带答案详解.pdf
- 2024陕西延长石油集团华特新材料股份有限公司社会招聘8人笔试参考题库附带答案详解.pdf
- 2023内蒙古大唐国际锡林浩特矿业有限公司采煤自营专项社会招聘32人笔试参考题库附带答案详解.pdf
- 2024年12月云南大学国际合作与交流处公开招聘(1人)笔试历年典型考题(历年真题考点)解题思路附带答案详解.doc
最近下载
- 注册安全工程师中级其他安全生产专业实务(其他安全类案例)模拟试卷5.pdf VIP
- 2025低压分布式光伏入网技术规范.docx VIP
- GB生产设备安全卫生设计总则.doc VIP
- 产教融合、校企合作——黄淮学院的探索与实践.ppt VIP
- 注册安全工程师中级其他安全生产专业实务(其他安全类案例)模拟试卷9.pdf VIP
- 《呼吸防护用品 自吸过滤式防颗粒物呼吸器》GB 2626-2019-2020.7.1.docx VIP
- 危险货物包装标志.docx VIP
- 地下水质量标准GB148482017.docx VIP
- 《心理学史教学大纲.doc VIP
- GBT-用于校准表面污染监测仪的参考源 α、β和光子发射体及编制说明.pdf VIP
文档评论(0)