山西移动建立干净数据王国.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
山西移动建立干净数据王国

山西移动建立干净数据王国   在2008年 Teradata 数据仓库用户及合作伙伴大会(PARTNERS 2008)上,Teradata提出了“Beyond Intelligence”(超越智能)的创新理念。Teradata公司总裁兼首席执行官迈克尔?科勒(Mike Koehler)认为,“超越智能”即动态企业智能(Active Enterprise Intelligence,AEI),它是帮助客户赢得竞争优势的核心所在。   当记者采访参加此次用户大会的中国移动通信集团山西有限公司IT规划建设中心总经理陈钢时,他说:“其实,我们早就Beyond BI,Beyond Intelligence了。”      业务部门提业务需求   在探索中提升建设方法      早在2000年,山西移动就打定主意要实施应用数据仓库系统。怎么就琢磨到要用数据仓库了呢?“当时,山西移动的想法就是希望能做一些大客户关系管理的工作。用什么手段呢?单用一个所谓的大客户关系管理模块显然是不行的。因为所谓的大客户管理,就是要针对大量的数据进行分析,不但要分析出竞争优势,更要分析出我们应该有怎样的管理方式以及应该如何根据不同的客户提供个性化的服务。基于这样的考虑,我们确定了应用数据仓库系统。”   陈钢回忆着当时选择Teradata数据仓库产品的过程:“山西移动在项目启动初期,曾经接洽过数家国际著名的公司。经过一系列的测试和评比,2003年的时候,我们最后选定了Teradata 企业级数据仓库解决方案。这主要得益于 Teradata 数据仓库的超级分析能力、海量并行处理和高可扩展性, 以及丰富的电信业实施经验。”   陈钢告诉记者:“在当前电信领域日趋激烈的竞争环境下,我们希望Teradata 数据仓库技术能够真正发挥其领先全球的技术优势,帮助山西移动提高决策质量,提升竞争优势。但如何去部署呢?回想起来,我们的数据仓库建设也经历了很多曲折。”    “在部署数据仓库的过程中,我们走了一个很大的曲线,但值得庆幸的是,这条曲线是慢慢往上走的。在部署初期,我们只是简单地模仿别人的做法,并没有了解到部署数据仓库要达到怎样的业务目标。解决方案很好,但不知道如何去用,所以部署起来不是很理想。到最后,数据仓库的作用就只限于出报表和KPI(绩效管理)了。其实,数据仓库的作用绝不仅限于此,出报表和KPI是辅助的,进行数据挖掘和支持分析决策才是最主要的。Business做不出来,就更别说Beyond的功能,这也是国内很多企业部署数据仓库不成功的原因所在。”陈钢分析道,“部署数据仓库的步骤应该是这样的:业务部门提出业务需求,梳理业务流程,然后再放到数据模型中去。这个步骤一定是从底层往上走的。但我们现在是倒着走,业务部门提出技术需求,其实业务目标并不明确,技术根本跟不上。”      金字塔倒着走   缺乏底层数据支撑      据陈钢介绍,数据仓库的建设是一个很漫长的过程,不像换一个手机,替换成本不是很大,使用习惯的差别也不是很大。而数据仓库的建设,无论在金融还是电信企业,都要经历长期的建设过程。长期的建设过程体现在三个方面:一是Data,就是数据;二是Information,即信息;三是Knowledge,也就是知识。Data、Information和Knowledge是宝塔式的关系:Data在底层,中间是Information,顶层是Knowledge。不同层对应的用户群是不一样的,底层对应的是操作人员,中间一层指的是有意义的数据,是针对中间管理层的,顶层是针对老板的。如果底层做不好,顶层一定做不好。底层的数据要求高效的处理、高速的数据输入输出,还需要有一个非常优秀的数据结构,还有数据质量。这些工作不可能在一夜之间做好。底层数据的搜集和清洗就是一个非常漫长和复杂的过程,必须把底层的数据建设好,才能进行顶层的建设。   “我们在数据仓库的建设初期,走的弯路还包括我们是从顶层Knowledge开始做的,而缺乏底层数据的支撑。”   当记者问到BI和数据仓库的区别时,陈钢认为,BI是从人工智能发展来的,而数据仓库是做人工智能或者商务智能的基础,无论做什么,都需要有数据做基础,你必须要在无规律的数据、非结构化的数据、各种数据孤岛并存的情况下,能够快速整合出有价值的数据。数据仓库是基础,人工智能是在它上一层面的东西。而数据仓库的建设需要巨大的投入,其中包括人的投入、组织体系流程的改动,以及数据体系的建立。开始的时候你可能根本看不到它的效果,一旦建立起来,人工智能就体现出来了。      数据不能重来   如何优化是关键      数据仓库不只是满足报表和KPI功能,而主要是满足挖掘和支持分析决策用的。为此,陈钢建立了一套用于挖掘和分析的业

文档评论(0)

189****7685 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档