- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
“五度”数据分析(之二)“五度”数据分析(之二)
“五度”数据分析(之二)
欲善其事,必先利其器。数据分析要成为企业利器需要满足“五度”:深度、效度、信度、难度、通度。在前面的博文中,我们谈了“深度”和“效度”。这里,我们再来聊聊“信度”、“难度”和“通度”。
????第三度:信度
??? 信度是指分析结果的可靠程度。信度是判断分析方法好坏的第三个标准。要加强分析的信度,需要做到以下几点:
??
1、对比要可比
在我们身边,充斥着大量的不具有可比性的对比分析。而这个问题严重影响了分析结果的可信度。
@数据化管理曾经举过这样一个例子。
在美国和西班牙交战期间,美国海军的死亡率是千分之九,而同时期纽约居民的死亡率是千分之十六。后来海军征兵人员就用这些数据来证明参军更安全。你认为这个结论正确吗?
当然不正确,这两个数字的对比是不具有可比性的,当兵的都是身强力壮的年轻人,而居民的死亡率是包括老弱病残的数据,这些人相对来说,死亡率是高的(需要说明的是16‰估计是不含自然死亡)。所以正常应该是用同年龄段的海军数据和纽约居民来对比。
?
2、差异要显著
在做精细化营销时,往往需要借助数据来理解不同用户的偏好差异。那么,数据相差多大才显示不同用户的偏好存在差异呢?
例如, 在左下图中,不同收入的用户对A卖场品类的态度有差异吗?别急,需要先做显著性检验。因为
满意度得分上的差异来自两个方面:组间差异和组内差异。
组间差异(控制变量)是由于收入水平的不同,三组用户间的满意度差异
组内差异(随机变量)是由于随机因素,同样收入水平下的用户的满意度差异
只有当满意度得分上的差异主要来自于收入水平(即组间差异),而不是其他(如随机抽样),才可以说:不同收入的用户具有不同的偏好。
???? 基于以上思考,我们做方差分析。从方差分析的结果看(见右下图)
???? 首先:方差齐性检验中的相伴概率值0.435显著性水平0.05,可认为各水平下总体方差相等,通过了检验,所以可以使用方差分析。
???? 其次,方差分析的结果显示组内平方和(即组内差异为90.396)远远大于组间平方和(即组间差异为8.379),F值的相伴概率值0.05,未通过检验。也就是说对A卖场品类态度上的差异主要来自于同样收入水平下的用户,不同收入者对A卖场的品类的态度不存在显著差异。
?
???? 如何理解这个检验结果呢?从满意度得分来看,似乎不同收入者在品类方面的差异蛮大咧(见左下图)。我们看不同收入者的满意度分布就比较好理解了(见右下图)。
??? 从右下图可以看到三类收入者内部波动很强烈,组内的差异水平甚至高出组间差异。这说明收入并不是区隔用户品类满意度的显著因素,即不同收入者的满意度水平不存在显著差异。??? 3、描述要全面
为什么当统计局把在岗职工的平均工资公布后,很多网友嗤之以鼻,讥之为“真实的谎言”者有之,认为“工资不涨反降”者有之,质疑“是不是又在放卫星”者亦有之呢?
因为平均工资的描述不能全面刻画工资的分布特点。它只能反映工资的集中趋势(一般水平),却没有考虑工资水平之间的离散趋势(波动程度)。
??? 第四度:难度
??? 是否用复杂的方法,取决于的问题的难度。问题难度升级,则方法的复杂程度也要升级。
??? 以市场细分为例。
若单一维度细分效果不佳,则需要增加分类维度。
例如,我之前做过一个彩电项目,用收入作维度进行细分市场。发现高收入者和低收入者买高档彩电的比例相差无几。仔细想想,高收入并不是买高档彩电的充要条件:高收入不一定就买高档彩电;低收入也不一定买低档彩电。高强度的工作可能会是使一个月薪过万的白领不买电视,因为根本没时间看;严重的攀比心理可能会使入不敷出的人家借钱买最贵的彩电。
因此,买什么价位的彩电,不仅和收入有关,还可能会和消费者的价值观、生活形态、对彩电的需求程度、年龄、职业等多种因素有关。到底和哪些因素有关,需要不断假设、探索,验证、比较、推翻,然后再重新开始,直到找到最合适的细分方案。
1、分类维度多——聚类分析+因子分析
既然要增加分类维度,此时拖透视表不管用了,就要考虑更复杂些的分类方法了,比如聚类分析。下图用的是系统聚类分析法,用人均GDP、人口数、价格增长指数等5个维度来对省份进行分析。
用于分类的维度较少,并且相互独立是最好的。但大多数的情况是,我们想出了一大堆维度,其中很多维度之间由存在一定的相关关系,也就是存在多重共线性的问题。此时,直接做聚类分析显然不合适,需要在聚类之前作因子分析。
例如,对网民进行细分,以17个生活形态语句做细分的维度,会发现维度又多又共线,比如“喜欢热闹和聚会”、“经常户外度假”、“下班后尽快回家”、“即使有钱也要工作”反映了生活的态度和状态。
通过因子分析,我们最终将这17个生活形态的语
您可能关注的文档
- XRD物相分析原理及应用.ppt
- XP系统注册表组策略禁用解除方法.doc
- X千伏玉龙输变电工程创优质工程总体规划XXX千伏玉龙输变电工程创优质工程总体规划.doc
- X县人民医院聘用护理人员的资质岗位技术-04-24XXX县人民医院聘用护理人员的资质岗位技术-04-24.doc
- XXXX有限公司XXXX有限公司.doc
- x社区健康计生志愿服务活动计划xxx社区健康计生志愿服务活动计划.doc
- X区积极推进工作室三级网络建设案例XXX区积极推进工作室三级网络建设案例.doc
- X省三级综合医院评审申请书.2X.doc
- X社区党员教育管理工作的难点及对策X.doc
- X射线复习和思考题.docx
- 小学科学:ESP8266智能插座电路原理与动手实践研究教学研究课题报告.docx
- 《金融开放浪潮下我国多层次监管体系构建与创新研究》教学研究课题报告.docx
- 区域教育质量监测中人工智能应用的数据质量分析与优化策略教学研究课题报告.docx
- 《金融科技监管中的数据治理与合规性要求》教学研究课题报告.docx
- 《3D打印技术在航空航天领域中的多材料制造与复合材料应用》教学研究课题报告.docx
- 《绿色金融发展中的政府职能与市场机制研究》教学研究课题报告.docx
- 《植物工厂多层立体栽培光环境调控技术对植物生长发育节律的调控机制探讨》教学研究课题报告.docx
- 销售团队年度业绩总结.docx
- 银行风险管理与金融危机防范.docx
- 银行网络攻击预警与快速响应机制.docx
最近下载
- 2025年江西管理职业学院教师招聘考试笔试备考题库.docx VIP
- 2024中国中信金融资产管理股份有限公司人力资源部(党委组织部)社会招聘笔试模拟试题及答案解析.docx VIP
- 高考英语完型填空汇总.doc VIP
- 合作经营合同(2020).docx VIP
- 关节活动度测定ppt课件.pptx VIP
- 体育教师专业发展计划.doc VIP
- 影视产业概论 教学大纲.docx VIP
- 明星志愿3群星合辑(星光圆舞曲+银色幻想曲)攻略-详细整理版精要.docx
- Q-CR 570-2017 电气化铁路接触网用力矩控制式胶粘型锚栓.docx VIP
- 煤矿机电事故专项应急预案及现场处置方案.pdf VIP
文档评论(0)