企业中如何开展探索性数据分析.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
企业中如何开展探索性数据分析

企业里都有哪些需求?一般调研业务部门都会听到如下需求,以销售部为例:需要看到总体销售情况;?需要看到各个销售渠道、销售组织、产品、客户等的销售额,能够进行任意销售所需维度的销售情况;?需要看到以上内容和去年的同比、与销售计划的比值等,用于进行销售完成情况的监控;?需要关注核心产品销售状况、客户区域的销售情况等;?销售数据要严格保密,因此一定要设置权限;?......我们来梳理下需求,将其转换为数据。以上需求基本可以看到数据字段需要有:销售额、计划额、销售额同比、计划完成率、销售渠道、销售区域、销售组织、产品名称、产品分类、客户名称、日期等。按照维度和度量(我们用粗体和斜体区分)可以分为销售渠道、销售组织、产品名称、客户名称、日期等和销售额、计划额、销售额同比、计划完成率等不了解业务能否进行数据分析?根据需求获取到数据并建立完成指标体系后,可能会遇到一些问题,例如:不了解销售部的销售体系如何确定字段间的相关性??不了解市场营销的资源投入内容如何确定字段的权重??字段无法识别,如何进行相关预测??除了可以制作KPI指标外,还可以做什么?统计学历史上的故事,统计与传染病的故事,待补...引用观点: 首先还必须要弄明白,数据统计和数据的解释是两个概念,两个阶段,不能等同。数据的用处,通常会有描述、解释、预测、控制四个层次。我们通常使用的统计方 法,也分为描述统计(相关分析、差异检验等)及推断统计(回归分析等)。所以,我认为在读与数据有关的文章时,也必须先做到剥离“数据本身”和“数据解 释”两个层面的内容,以便对数据做出客观独立的思考。如何开展数据分析工作?我们可以先从观察数据本身着手,将已有数据现状进行客观的展现。首先恶补下统计学原理,描述性统计是统计分析的重要组成部分,是推断性统计的基础,它是指用统计表和统计图或利用统计指标来描述资料的特征。描述性统计包含两部分内容:?数值变量描述,是对观察对象的某个指标采用度(衡)量的方法进行检测?分类变量描述,是先对观察测量得到的变量值(即观察值)进行分类汇总(即“计数”)得到分类资料频数表(属于绝对数指标),再在此基础上计算相对数指标(即两个指标之比)才能对分类变量资料进行正确的描述数值变量的统计学描述频数表。包括频数又称频率,是指某一变量观察结果在某一特定数值(或数值范围内)出现的次数。将事物分类之后统计出来的各类频数排列成表格,即为频数表。利用频数分析,可从一大堆变量观测值中直观地了解变量的分布特征?集中趋势的描述。描述一组观察值分布集中位置或平均水平的指标称为平均数。它能使人对资料有个简明概括的印象,并能进行资料问的比较。常用的平均数有算术平均数、几何均数和中位数?离 散程度的描述。集中趋势是数据分布的一个重要特征,但单有集中趋势指标还不能很好地描述数据的分布规律。为了比较全面地描述数据分布的规律,除了需要有描 述集中趋势的指标外,还需引入描述数据分布离散程度的指标。描述离散趋势的指标有多种,最常用的有极差、四分位数间距、方差、标准差和变异系数?相关分析。探讨数据之间是否具有统计学上的关联性,这种关系既包括两个数据之间的单一相关关系——如年龄与个人领域空间之间的关系,也包括多个数据之间的多重相关关系——如年龄、抑郁症发生率、个人领域空间之间的关系分类变量的统计学描述比:任意两个变量之比构成比:部分占总体的比例率:某现象发生的频率和强度动态数列:一系列按时间序列排列起来的统计指标(包括绝对数、相对数、平均数),用以说明事物在时间上的变化和发展趋势率的标准化:用统一的“标准”消除资料由于内部构成不同而对所比较的总率产生的影响,使资料间具有可比性。标化率只是表明对比资料的相对水平,并不反映当时当地的实际水平知识恶补完毕后,我们再重新回到我们刚才需求中,将数据提炼为统计学语言,见下图根据各企业的运营状况通过调研的方式定制维度数据、标准指标和KPI,通过描述性统计可以对数据资料的数值变量和分类变量进行描述,检验各维度的销售状况用于确认异常点。FAQQ:如何从企业常规的KPI指标中获取更多有价值的信息?A:方法有两种:1.通过描述性统计进一步观察数据状态;2.通过添加描述性字段来解释数据。下面详述第2种:如果将各维度的计划完成率展现出来,可以获取到的信息是各指标的现状。看完指标后,脑子里会出现更多问题:指标的现状是好还是差?好在哪?差在哪?什么地方是需要重点关注的?我们可以更深一步,KPI中加入状态指标和走向指标来解决这个问题。状态指标:一个表示指定时间点 KPI 状态,例如:返回介于 -1 到 1 之间的标准化值。等于或小于 -1 的值将作为“差值”或“低值”;零值 (0) 被理解为“可接受值”或“中间值”;等于或大于 1 的值将作为“优值”或“高值”走向指标:一个用于评估一段时间内 KPI 的值

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档