- 1、本文档共75页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析与图表展现——Excel2010高级应用技巧培训
数据分析与图表展现Excel 2010高级应用技巧培训
学习大纲
统计分析基础
获得分析需求的方法
了解并掌握基本的分析模型
了解Excel数据分析工作流程及关键操作技能
如何提高数据收集质量
数据的规格化处理
使用数据透视表进行统计分析
学会图表制作方法
打好基础
突破Excel传统局限,提高图表表现力
了解并学会制作专业图表
2
需具备的基本知识
从事过数据采集、整理和分析工作。
用Excel至少成功的做出过1种统计图。
了解Excel公式的基本书写规则。
用过至少2-3个函数,并且能够理解这些函数。
基本熟悉Excel 2010版本的界面。
3
数据分析的目标和分析模型
数据分析前的准备工作
4
确定分析需求
要分析什么?
希望得到什么结果?
分析结果是用来干什么的?
5
分析是为了发现问题和解决问题,
而不是为了Excel功能展现!
需求的来源
分析是为管理工作服务的——数据说话。
分析需求首先来自管理者
工作中的关注焦点
验证工作成效
发现变化
业务数据的进一步挖掘和提炼也是数据分析的主要动力。
发现变化规律
异常捕获
挖掘数据间的潜在关系
6
获取需求的方法
数据分析相关人员
管理者
数据收集和分析人员
数据产生和提供人员
如何获取需求
管理者提出要求
数据分析人员与管理者交流
数据分析人员尝试各种统计分析模型,发现值得关注的异常现象。
7
选择恰当的分析模型
常用的分析方法——统计图表
比较、联系、构成、分布
动态、静态
常用的数据汇总统计方法——数据透视表
汇总、计数、平均、最大最小
分类、切片、挖掘、旋转
不常用的专业分析模型——加载项
线性回归、傅里叶分析、移动平均、直方图分析、规划求解。
专业模型侧重预测,结果具有不确定性,并且涉及较多的数理统计知识。对算法理解不透彻,或者应用场景不匹配,其结果容易引起误导。
8
除非特别必要,并且已经与管理者达成一致,强烈建议不要把这些专业分析模型引入日常工作报告中。
数据分析过程及关键操作技能
开始进行数据分析
9
Excel数据分析基本工作流程
10
管理工作
验证、指引
原始数据的关键特征
原始数据是数据分析的基础。
原始数据来源于日常工作,是日常工作执行过程中留下来的痕迹——工作记录。
原始数据必须是随着工作的执行同步采集,很难事后补充。
原始数据的记录质量很大程度上决定了数据分析工作的可操作性,以及结果的可用性。
客观性
完整性
一致性
二义性
11
数据采集过程中存在的普遍性问题
采集不足或过度采集;
文字描述过多而数据不足,无法做统计分析,只能当做工作记录用——是文档不是数据表。
总想记录尽可能多的信息,已备不时之需——无人过问的数据没有价值,只能增加工作量。
数据结构经常变动,缺乏持续性;
数据结构的设计过于关注管理者的需求,忽视了作业规范。
缺乏数据填写标准的定义,或虽然定义了但标准难以把握;
满意度定义:很不满意、不满意、比较满意、满意、非常满意,比较满意和满意如何区分?
原始记录填写随意,描述方式或格式不一致;
甘肃电信、甘肃省电信、中国电信甘肃分公司、省公司,几种叫法实际上指的都是同一个公司,但Excel会把它当成四个不同的公司,张三、张 三 Excel也会当做两个人。
3月10日、10/3、3.10、3月份,都是日期吗?Excel可不会这么想。
合同金额:78、10360,计量单位是万元还是元?
必填项缺乏强制性,存在空白;
对于空白,人为的理解可以是:没有、同上、不知道、忘添了,Excel的理解是:什么也不是(Null)。
某些数据可以很轻易的后补,缺乏客观性。
上周三我工作了几个小时?上周四晚上9点机房温度是多少?
12
如何提高原始记录的质量
做好基础工作
定义数据结构。
定义分类标准和解释口径。
培训、宣贯,使以上成果成为员工工作标准。
使用高效高质的采集手段
业务系统信息化。
手工记录模板化。
数据稽核常态化
保持恰当的检查频率,并且首先查数据,培养数据说话的习惯——领导不关注的数据一定是不会认真填报的。
主观数据主抓填报及时性和逻辑合理性,但对准确性不要太较真,尽量不要用于考核,如工作量申报。
13
数据结构定义——需要哪些数据
对管理需求进行分解
算法的需要——依据采用什么分析模型,以及这些模型需要什么输入。
潜在的管理需求——问题发现、原因分析、验证效果、绩效管理。
对工作流程/方法进行分析了解可获得的信息。
从数据生命周期的角度评估数据采集需求——避免无用数据。
从哪来—干什么用—放多长时间—什么时候可以销毁
充分考虑数据的可获得性以及采集成本。
数据结构一旦定下来,尽量不要有太大变动。
14
一手的原始数据在成本允许的情况下尽可能多的采集;
可通过计算获得数据尽量不要在采集阶段采集。
尽量避免重复采集。
数据结构定义示
文档评论(0)