- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据专题分析.PDF
数据专题分析
华院分析技术(上海)有限公司 咨询顾问 单晖
随着华院项目经验的不断积累,以及通信行业客户对数据挖掘认识的不断深入。
无论是我们的项目工作方法还是客户对我们的期望都在不断发生变化。
和以往的工作和项目相比,当前客户对我们的要求逐渐彰显出以下几个特点:
1. 有不少即时的突发的小问题、小任务希望项目组能够解决,并且问题解决周
期短
2. 需求无法归类到我们项目中,也无法归类到几大类模型中
3. 期望我们提交的工作成果能够对应解决实际问题,或者可以直接归纳出解决
方案.
这一类的客户需求,可以称作为数据专题分析。数据分析要解决实际问题,就必
须脱离纯粹的技术手段回到实际问题上来。
下面我列举一个在某公司遇到的实际例子对这类工作作一个说明:
• 数据分析的角色
当一个决策或者结论需要用事实来说话时,这个课题多半会落到数据分析的头
上。
移动公司有很强大的数据库系统和规范的数据源,这使移动公司的管理层和市
场部已经习惯于借助数据来进行决策支持和研究问题,所以移动公司的相关人
员经常会接到基于数据的统计报表或者任务。
这一次,某公司领导收到一个报表(如图),2003年某省的高价值用户(月平
均消费120元以上)在2004年的10月份发生严重流失,有61%的人变成了低
价值用户(月平均消费120元以下),流失用户中的一半用户的ARPU甚至低
于50元。这种情况的出现,极大影响了某公司的收入,必须调查清楚,产生
这种情况的原因是什么。显然,这是需要用事实来说话的,问题的答案需要从
数据中来,很自然的,这个问题落到华院头上。
• 数据分析是我们的特长
如果我们在数据分析方面的特长得到了客户的认可,客户遇到此类棘手问题的
第一反映就是找华院的同志们来解决问题。
某公司领导把问题丢给了我们。这个问题和我们的项目工作有一定的关系,同
时解决这个问题对我们的项目后期进展也非常有帮助,而且替客户解决棘手问
题也有助于我们的客户关系。因此,我们接下了客户的问题需求。
• 分解问题、获取数据资源、做好工作准备
接受了客户的请求,客户会授权我们提取需要的数据。
这个时候需要注意两点:一是这个问题突发性很强,需要我们短时间内整理完
数据需求、明确所需数据来源,确定数据的沟通对象;二是问题解决周期很短,
几个工作日内客户就希望得到有用的工作结果。
所以,分析人员对客户的数据资源(包括人员,数据源,数据结构等)应当非
常熟悉,并且具备获取所需数据的能力。并且,应当提供适当的数据需求,这
样可以有效控制客户数据工作人员的工作时间,和我们自己的数据理解、校验
和处理时间。
这一步工作中,通过短时间的调研,我们迅速形成数据专题分析的工作思路,
进而形成计划。
• 获取可以得到的数据和技术支持
在这一步,我们将获取所有需要的数据;但是,由于各种原因(服务器满负荷、
数据人员满负荷、数据保密等)我们无法获得部分需要的数据,这时候应当及
时寻找其他可以替代的数据,并且适当修正我们的工作计划。同时要保证数据
方面客户可以提供足够的技术支持,例如,数据的技术说明文档,或者和客户
数据人员保持密切的合作联系。
由于这个问题提出的时候正好是12月初,计费中心的服务器正在月初出账阶
段,无法支持我们的工作。于是使用另一个独立于BOSS系统的内部查询系统
来提取数据,同时,由于系统的规模和数据滞后的原因,原定全省的数据只提
取了西安市的用户,原定11月的数据改为10月的数据。
因为涉及一个全新的系统,我们和客户的一个技术人员保持了密切的联系,他
在以后的分析工作中提供了重要的技术支持。
• 校验数据,验证问题
取得了所有数据以后,我们必须校验数据,保证数据的正确性。除了我们通常
文档评论(0)