- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘在移动通信业中应用研究综述
摘要:数据挖掘是人工智能、机器学习与数据库技术等多学科相结合的产物,移动通信业是数据挖掘技术当前重要的应用领域之一。本文重点介绍了数据挖掘技术在移动通信业中应用的客户描述、客户分群、与客户流失分析的最新研究方法与进展。
关键词:数据挖掘;移动通信;客户流失
中图分类号:TP393文献标识码:A 文章编号:1009-3044(2008)23-867-02
Survey of Application Based on Data Mining in the Mobile Communication
LI Xin
(School of Statistics and Applied Mathematics, AUFE, Bengbu 233030, China)
Abstract: Data mining is the production of artificial intelligence and machine study and database and so on. The industry of the Mobile telecommunications is one of the most significant applied fields in which data mining is used.This treatise mainly introduces the newly method and process in which data mining is uesd in the customer descriptions,customer segmentation and customer churn in the Mobile Telecommunication.
Key words: data mining; mobile telecommunication; customer churn
1 引言
21世纪,人类迈入了“信息爆炸时代”。人们利用信息技术生产和搜集数据的能力大幅度提高,数以万计的数据库在政府办公、科学研究、工程开发、商业管理中得到应用,并且这种趋势仍将持续并进一步发展下去。因此一个新的问题出现了:在这个信息爆炸的时代,人们每天要面对无数的信息量。数据挖掘(Data Mining)就应运而生了。数据挖掘就是从大量的、模糊的、部分的、有噪声的、随机的数据中,提取隐藏在其中的、事先不了解而又有用的信息和知识的过程。发现的知识可以用于信息管理、决策选择、查询优化、过程控制等。因此数据挖掘是一门广义交叉学科,它汇聚了不同领域的研究者,尤其是数据库、数理统计、可视化、人工智能等过方面。移动通信业是数据挖掘技术当前重要的应用领域之一,例如通过决策树的分类预测技术,可以在销售活动中根据商品或服务的描述特性,帮助企业理解给定销售活动的影响,并帮助企业设计出在未来更有效果的销售活动。同时还可以利用决策树分析模型的诱导分析,通过客户相关信息对比发现客户流失的一些特征,从而筛选出与流失相关的显著指标,对于企业发展和保留客户都有很大的意义。
2 数据挖掘概述
2.1 数据挖掘的任务
数据挖掘的任务是从数据集中发现有价值的模式。模式按功能分主要有两大类:描述型模式和预测型模式。针对不同的实际问题,数据挖掘的任务主要有关联分析、分类、聚类分析、概念描述、孤立点分析、时间序列等。
关联分析:关联分析的目的是为了挖掘出隐藏在数据之间的满足一定条件的依赖性关系。关联分析的主要对象是事务数据库,典型的应用是购物篮分析。
分类:分类是从历史数据中选出类标记已知的训练数据集,通过数据表现出来的特性,为每一类数据找到一个类别的准确描述,并用这种描述来构造模型,以便用模型预测类标记未知的数据。
聚类分析:聚类是根据数据对象的不同特征,将其分组成为多个不同数据类的过程,使得同一类中的数据彼此相似,不同类中的数据差别较大。聚类通常作为数据挖掘的第一步。
概念描述:概念描述是描述性数据挖掘中最基本类型,通过数据的特征化和区分描述来提供一类数据的概况,或与对比类相区别。特征描述是对目标类数据一般特征的简洁汇总,描述了该类所有记录的共性。区分是将目标类与一个或多个对比对象的一般特征进行比较,来描述类之间的差异。
孤立点分析:孤立点是数据集合中,远远偏离其他数据对象、与数据的一般模型不一致的比例较小的数据对象。在大部分数据挖掘算法中为使孤立点的影响最小化,通常将孤立点作为噪声或异常数据而舍弃。但在某些场合,检查孤立点的存在有非常重要的意义,使我们能发现一些真实而又出乎意料的知
文档评论(0)