- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据挖掘技术在移动通信中的应用
1 引言 数据挖掘汇集了统计学、人工智能、数据库等学科的内容,是一门新兴的交叉学科。这门学科旨在帮助人们从海量数据中发现有价值的信息,目前在商业中的应用刚刚起步。国内日趋激烈的移动通信市场竞争促使各移动通信运营商去降低运营成本、提供差异化的客户服务,而数据挖掘技术的应用可以帮助运营商分析客户消费行为,识别客户特征,辅助运营商进行有效的市场营销和客户服务。2 数据挖掘技术概述 “数据挖掘包含了一系列旨在从数据集中发现有用而尚未发现的模式(Pattern)的技术。”[1]。确切地说,数据挖掘是一种知识发现的过程,它主要基于统计学、人工智能、机器学习等技术,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,并对未来情况进行预测,以辅助决策者评估风险、做出正确的决策。数据挖掘与联机分析处理(On-Line Analytical Processing, OLAP)都是分析型工具。联机分析处理作为验证型分析工具,“更多地依赖用户输入的问题和假设”[2], 使得用户能够快速地检索到所需要的数据,而数据挖掘能够自动地发现隐藏在数据中的模式(Pattern)。 在实际应用中,数据挖掘主要采用以下几种方法进行模式的发现: (1)相关分析和回归分析:相关分析主要分析变量之间联系的密切程度;而回归分析主要基于观测数据建立变量之间适当的依赖关系。相关分析是回归分析的基础。 (2)时间序列分析:与相关分析类似,目的也是为了挖掘出数据之间的联系,但时间序列分析更加侧重于数据在时间先后上的因果关系。 (3)分类分析:分类分析首先为每一个观测赋予一个标记,然后检查这些被标记的观测,描述出这些观测的特征。这种描述可以是一个数学公式或者模型,利用它可以分类新的观测。常用的几种典型的分类模型有线性回归模型、决策树模型、基于规则模型和神经网络模型等。 聚类分析:与分类分析不同,聚类分析的输入是一组未标定的记录,目的是根据一定的规则,合理地划分记录集合。聚类分析和分类分析是一组互逆的过程,因此在很多分类分析中适用的算法也同样适用于聚类分析。3 数据挖掘在移动通信中的应用 目前移动通信运营商都具有业务营运系统、客户服务呼叫中心、业务受理网站等客户信息系统,这些系统具有如下特点: (1)各个信息系统都各自比较完整地管理着客户某一部分的信息,众多的客户数据、市场营销数据、帐务数据以不同的数据格式和访问方式分散在不同的系统中,形成众多的信息孤岛,在各个信息孤岛中存在着冗余和不一致,不能满足数据挖掘过程中数据必须具有单一视图(Single View)的要求。 (2)这些系统都是联机事务处理(On-Line Transaction Processing, OLTP)系统,实时处理在线事务,不能适应数据挖掘应用大规模、频繁的检索和查询操作。因此,数据挖掘的前提是必须建立企业级的客户信息数据仓库,能够把不同联机事务处理系统的客户数据聚集在一起,提供一个正确、完整和单一的客户数据环境。3.1 数据仓库的建立 数据仓库作为数据挖掘的基础,不同于传统的联机事务处理系统,它具有面向主题的、集成的、不可更新以及随时间变化的特性。各个联机事务处理系统作为数据仓库的原始数据源,以文件方式提供客户基本资料、客户呼叫清单、客户帐单、客户联系历史记录等数据。数据仓库通过ETL过程(抽取、转换和加载)处理这些接口文件,并且按不同的主题域组织、存储和管理这些客户数据。通过数据仓库接口,对数据仓库中的客户数据进行联机分析和数据挖掘。整个数据仓库的体系结构见图1,主要由数据源、企业级数据仓库和决策支持三个部分组成。3.2 数据挖掘的主题定义 在建立完成企业级的客户信息数据仓库之后,可以基于这个数据仓库平台进行数据挖掘工作。但在数据挖掘工作开展之前,必须明确数据挖掘所需要解决的问题和所需要达到的预定目标。也只有在目标明确定义的前提下,数据挖掘的工作才有方向和意义。本文针对移动通信运营商市场运营的特点,定义了以下主题作为数据挖掘的目标。3.2.1 客户行为分析 利用分类分析法和聚类分析法对客户通话行为进行分析,从而得出客户在消费习惯、生活方式、社会联系等方面的特征。对客户行为分析的根本目的是为了按不同特征划分客户群,针对不同客户群的特征,运营商可以进行不同的市场营销活动和客户服务。在客户群划分中典型的应用就是针对某一客户群的消费特征进行某种移动业务的营销。3.2.2 优惠策略仿真预测 优惠是市场营销中十分重要的一部分,优惠策略的不恰当,常常会得到适得其反的市场效果。优惠策略仿真预测就是通过已建立的客户行为模型仿真客户对优惠策略的反应,从而
您可能关注的文档
- 教育无小事,事事是教育;教育无小节,节节是楷模。.doc
- 教育机构教师考勤制度参考.doc
- 教育的智慧与智慧的教育.doc
- 教育督导工作实施方案.doc
- 教育类毕业论文毕业论文5000字数.doc
- 教育系统食品安全事故应急处置预案.doc
- 教育综合333研究生大纲.doc
- 教育随笔记录--学生文明礼仪取样调查.doc
- 教育艺术新理念的三大境界.doc
- 散客大部分是通过协议单位介绍来住的.doc
- 湖南省衡阳市第八中学2026届高三上学期第一次月考物理(原卷版).doc
- 浙江省普通高中尖峰联盟2026届高三上学期10月联考英语(原卷版).doc
- 四川省绵阳市南山中学实验学校2026届高三上学期10月月考英语(原卷版).doc
- 湖南省衡阳市第八中学2026届高三上学期第二次月考历史 Word版含解析.doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题09 功和机械能(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题10 内能及其利用(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题07 压强(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题01 机械运动(原卷版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题02 声现象(解析版).doc
- 福建中考物理5年(2021-2025)真题分类汇编:专题02 声现象(原卷版).doc
原创力文档


文档评论(0)