数据挖掘论文关联规则论文.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘论文关联规则论文

数据挖掘论文关联规则论文 摘要:电信行业是最早采用数据挖掘技术的行业之一。数据挖掘中,关联规则的挖掘是最为典型的工作之一,利用相关算法可以进行电信新业务消费群体分析等,帮助运营企业提高市场占有率。 关键词:数据挖掘;关联规则;话单分析 algorithm and application of association rule mining in billing market analysis gan lili (xingtai university,xingtai054000,china) abstract:telecom is one of the industry that uses data mining technolgy firstly.in data mining field,associaton rule mining is the most representative one,and with correlation algorithm we can analyse customer groups of telecom new service,which helps telecom operators increase market share. keywords:data mining;association rule;apriori algorithm;billing analysis 一、关联规则挖掘算法概述 关联规则的形式定义为{x1,x2,….声明….,xn}-y,这意味着如果x1,x2,….,xn全部在事务集合内,那么y也可能在事务中。注意这里用“可能”意味着仅仅是可能,而不是确定。同样注意存在的可能是一个项目集,而不是单个的项目。在全部x1到xn的事务中发现y的可能性叫做置信度。规则在所有的事务中 在关联规则系统中,规则本身是“如果条件怎么样,那么结果或情况就如何”的简单形式,可以表示为“a=b”关联规则,它包括两个部分:左部a称为前件,右部b称为后件。前件可以包括一个或多个条件,在某个给定的正确率限制情况下,要使后件为真,前件中的所有条件必须同时为真。后件一般只包含一种情况,而不是多种情况。 ,显然只有支持度较大的规则才是较有价值的规则;置信度的计算方法: ,显然只有置信度比较高的规则才是比较可靠的规则。 二、关联规则挖掘算法在话单的市场分析中的应用 电信运营商在日常的市场营销过程中,经常会遇到这样一些问题:如何能更好的理解客户,挽留有价值的用户,如何设定合理的资费政策吸引不同行业的人、不同年龄段的人、使用习惯大相迥异的客户群体套餐该如何制定。这些问题都是影响公司经济运营的重要因素。为了更好的掌握客户的特点及合理的制定套餐资费政策,可以利用关联规则挖掘来发现用户与通信行为间的关系,分析哪些特定的群体具有哪些共同的通信习惯。 电信运营商通常都不是提供单一产品或服务供客户消费,而是综合的产品或服务组合供用户选择,这就是我们常见的套餐消费。通过对产品或服务的关联分析可以发现产品或服务之间关联规则,发现什么产品或服务的集合会使客户一起消费,由此可以向客户推荐或者把相关产品或服务组合成一个套餐,从而在促进产品销售的同时也为客户提供了更好的服务。 电信行业在增值业务领域发展迅猛,各种增值平台为用户提供丰富多彩的娱乐和信息服务。当一个新的平台上线后,首先面临的一个问题是如何定位其消费群体,以便制定有针对性的宣传策略和销售政策。通常系统在运行一段时间后,用户不断地加入和使用,系统中用户使用情况的原始数据逐渐积累下来。通过对原始数据使用关联规则挖掘算法,我们可以准确的定位出系统的消费群体。 为更好的进行关联数据挖掘,我们对话单数据表中的基础信息进行基于概化的数据预处理,具体的概化方法如下所示。 a)用aa1漫游,a2非漫游。 b)用b表示通话时间信息,把通话时间段概化为b1 (9:00-17:00) b2 (17:00-22:00) b3 (22:00-9:00) c)用c表示通话时长信息,把通话时长段概化为c1 60秒 c2 60秒-600秒 c3 600秒以上 d)用d表示短消息次数统计,把短消息月发送量概化为d1 (10条以下)d2(10条到50条)d3(50条以上) e)用e表示长途通话量统计,把长途月通话量概化为e1 20分钟以下,e2 20分钟到100分钟;e3 100分钟以上 f)用f表示是否使用过此项新业务,概化为f1 使用过,f2未使用过。 group方法可以将用户以上的信息统计出来,其中b项通话时间为用户在三个时间段内次数最高值,即如某用户b1为5、b2为7、b3为20,则此项值取b3。 {a1,a2,b1,b2,b3,c1,c2,c3,d1,d2,d3,e1,e2,e3,f1,f2},我

文档评论(0)

yurixiang1314 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档