网站大量收购独家精品文档,联系QQ:2885784924

数据挖掘在移动通信中的应用.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘在移动通信中的应用

数据挖掘在移动通信中的应用 摘要:本文简单介绍了何为数据挖掘技术,数据挖掘所需要的条件、数据仓库的建立,以及为什么要应用在移动通信中和在移动通信中经常用的两种算法-决策树算法和K最近邻算法,并且较为详尽地阐述了它们的工作原理。 关键词:数据挖掘 移动通信 决策树 KNN Data Mining in Mobile Communication Abstract:This paper briefly describes what is data mining technology, The conditions required for data mining, Data Warehouse.and why to be applied in mobile communication and mobile communication is often used in the two algorithms- Decision tree algorithm and K nearest neighbor algorithm, and a more detailed illustration of their works. Keywords: Data mining, mobile communications, decision tree, KNN 引言 截止2010年,我国手机用户达到7.38亿,全球手机用户数量超过50亿。伴随着手机用户数量的快速增加和移动通信技术的技术革新,从2G到3G的进步,移动通信市场竞争惨烈。如何才能更好地把握客户心理及行为习惯,提供更加人性化和具有针对性的服务,从而在激烈的市场竞争中立于不败之地?数据挖掘技术将是一种解决方案。 何为数据挖掘 何为数据挖掘?数据挖掘包含了一系列以从数据集中发现有用而且尚未发现的模式为目的的技术。同时数据挖掘也是一个知识发现的过程。它是从海量的不完整、有噪声的、模糊的和随机的数据中,分析隐含在其中的,人们不能明显看出,但是又合理并且有利用价值的信息的过程。简单的说就是从海量数据中挖掘隐含在其中的有价值的信息。一个很著名的实例是沃尔玛发现的啤酒和尿布的联系。 数据挖掘是计算机和数据库技术的一个研究热点,目前比较有影响力的系统大多是国外的系统,我国国内的研究相对落后,这与我国经济发展以及市场需求是比较矛盾的。 数据挖掘在移动通信中应用的条件 目前移动通信运营商大都具有客户服务呼叫中心、业务受理网站、业务运营系统等。分散的各个信息系统都各自比较完整地管理者客户某一部分的信息,海量的客户数据、账务数据、市场营销数据以不同的数据结构和访问方式分散地存放在物理上或者逻辑上隔离的数据库中,形成数个彼此独立缺乏联系的信息数据库,这些数据库中有大量冗余和不一致存在,对于数据挖掘过程中数据必须具有单一试图的要求不能满足。从图1可以比较形象地看出分散的数据库的弊端。 图1 这些系统都是事物型的联机处理系统,实时处理在线事物,即处于不断的变化当中。不能形成一个稳定的分析环境。之所以要这样,是因为数据挖掘需要在数据仓库的基础上进行大数量级的频繁操作,具体包括查询、分析、取样等等。这样把之前各个独立的数据库系统联合在一块便形成了可供数据挖掘用的数据仓库1。 数据仓库有很多新的特征,一般来说,数据仓库是面向特定主题的,有特定的挖掘目标,在一定的时期之内要保持相对稳定。数据仓库的数据来源于各个联机事务处理系统,这些系统以固定格式把原系统中的信息提交给数据仓库,具体包括客户基本资料,客户消费记录,客户呼叫对象记录等信息。数据仓库在接受到这些信息之后,按照特定组织规则进行分类、存储,然后进行特定目的的分析和数据挖掘。数据仓库和传统的联机处理系统关系如图2所示。 图2 数据挖掘算法在移动通信中的实际应用 在移动通信行业的数据仓库中,运用较多的数据挖掘算法是决策树算法和邻近算法(k 最近邻算法)。 决策树算法 在数据挖掘的过程中,决策树是一个预测模型:它代表的是对象属性值与对象值之间的一种映射关系。树中的每个节点代表着数据仓库中的一个对象,每个分叉路径则代表某个可能的属性值,而每个叶节点对于具有上述属性值的子对象。一般来说,决策树输出结果单一,如果需要多个输出,建立多个独立的决策树是很必要的。 决策树学习也是数据挖掘中的一个普通的方法。在这里,每个决策树都描述了一种树形结构,它由它的分支来对该类型的对象依靠属性进行分类。每个决策树可以依靠源数据库的分类进行数据测试。这个过程可以以递归方式对树进行修剪。当不能再进行分割或一个单独的类可以被应用于某一分支时,递归结束。另外,随机森林分类器是许多决策树的结合,可以用来提升分类的正确率2 决策树同时也

文档评论(0)

xy88118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档