- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据分析-分类分析
前⾔
我们做分析时经常要多⼈群分类,特别是做⽤户画像时经常⽤到,将对象划分为不同部分或者类别,在进⼀步分析,就能够挖掘事物的本质
⼀、分类分析
根据指标的性质,分类分析法分为属性指标分组和数量指标分组
1.属性指标分组分析法
按属性指标分组⼀般较简单,分组指标⼀旦确定,组数、组名、组与组之间的界限也就确定。例如,⼈⼝按性别分为男、⼥两组,具体到每
⼀个⼈应该分在哪⼀组是⼀⽬了然的
2.数量指标分组分析法
数量指标分组分析法是指选择数量指标作为分组依据,将数据总体划分为若⼲个性质不同的部分,分析数据的分布特征和内部联系。根据数
据的性质(离散数据或者连续数据),它分为单项式分组和组距式分组。
2.1单项式分组
单项式分组⼀般适⽤于离散型数据*,⽽且数据值不多、变动范围较⼩的情况。每个指标值就是⼀个组,有多少个指标值就分成多少个组。
如按产品产量、技术级别、员⼯⼯龄等指标分组。例如按照技术级别来分,有A、B、C三个组
2.2组距式分组
组距式分组,这是个是适⽤在连续数据上,指数据的变化幅度较⼤的条件下,将数据总体划分为若⼲个区间,每个区间作为⼀组,组内数据性
质相同,组与组之间的性质相异。这⾥的组距式分组,也会分为两种的,⼀个是等距分组,这种⽅法适⽤在连续数据分布相对均匀的;另⼀个
是不等距分组,适⽤在连续数据分布不均匀的状态。具体使⽤见下⽂:
a.等距分组:
第⼀步:确定维度、组数;
第⼆步:确定各组的组距;组距=(最⼤值-最⼩值)/组数;
第三步:根据组距,将数据划归⾄对应组内
b.不等距分组
第⼀步:确定维度、组数;
第⼆步:根据需求确定各⼩组的上限与下限
第三步:依据⼩组上下限进⾏分组
第四步:评估分组后数据结构是否满⾜需求
第五步:若满⾜,则停⽌;若不满⾜,则调整,从第⼀步循环
⼆、分组分析的应⽤
1.⼀维分类
定义⼀个维度(标准)将数据分析,常⽤⼀维分类
性别:男、⼥
年龄分段:青年、中年、⽼年
客户价值:低价值、中价值、⾼价值
⽤户状态:沉默⽤户、活跃⽤户
⼀维分类常⽤柱形图来做统计,⽐如下⾯的某⼩学各年级向灾区的捐款情况
2.⼆维分类
数据按两个维度分类时所列出的表,是由两个的变量进⾏交叉分类的分布表,也称为交叉分析。这⾥是常⽤表格来做展⽰,如下图某产品12
⽉⽤户年龄与价值分布,从图中能够清楚看出青少年并且⾼价值的⽤户分布最多,所以在后⾯做营销策略的时候,可以做重点关注
3.多维分类
但是有时⼀维和⼆维并不能满⾜我们的需求,需要多维分类(和⼆维分类⼀样都是称为交叉分析)满⾜需要。如下图(Excel中的透视表):
原创力文档


文档评论(0)