- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
盘点数据分析师笔试题你会做⼏道?
上次,我们给⼤家讲述了⼀些数据分析师⾯试的必备技巧,本期我们主要给⼤家盘点数据分析师笔试题(当然,即便是笔试⽤不到,⾯试也
可以⽤得到哈),希望当遇到这类典型题⽬时,⼤家可以轻松应对。
盘点数据分析师笔试题 你会做⼏道?
1、不⽤任何公开参考资料,估算今年新⽣⼉出⽣数量。
关于类题⽬,在作答前,我们应该去分解思考会涉及到哪些内容,并通过总结性思维,将你联想到的内容加以描述。
⾸先,我们应该知道这是在考查费⽶估计问题,所以我们可以采⽤两层模型(⼈群画像x⼈群转化) :新⽣⼉出⽣数= Σ各年龄层育龄⼥性数
量*各年龄层⽣育⽐率。来作为回答的主线。
然后,先从数字到数字:如果有前⼏年新⽣⼉出⽣数量数据,建⽴时间序列模型进⾏预测 (PS:这⾥还需要考虑到⼆胎放开的突变事
件)。
接着,找出先兆指标。如:婴⼉类⽤品的新增活跃⽤户数量X表⽰新⽣⼉家庭⽤户。Xn/新⽣⼉n为该年新⽣⼉家庭⽤户的转化率,如
X2007/新⽣⼉2007为2007年新⽣⼉家庭⽤户的转化率。当然,该转化率会随平台发展⽽发展,我们可以根据往年数量,推出今年的⼤
致转化率。
最后,我们可以通过今年⼤致的转化率,并根据今年新增新⽣⼉家庭⽤户数量,推出今年估计的新⽣⼉数量。
2、什么是PCA?PCA为什么要中⼼化?它的主成分是什么?
在统计学中,主成分分析(PCA)是⼀种简化数据集的技术。它是⼀个线性变换。这个变换把数据变换到⼀个新的坐标系统中,使得任何数
据投影的第⼀⼤⽅差在第⼀个坐标(称为第⼀主成分)上,第⼆⼤⽅差在第⼆个坐标(第⼆主成分)上,依次类推。
主成分分析的原理,是设法将原来变量重新组合成⼀组新的相互⽆关的⼏个综合变量,同时根据实际需要,从中可以取出⼏个较少的综合变
量,尽可能多地反映原来变量信息。这种统计⽅法叫做主成分分析,或称主分量分析。它也是数学上处理降维的⼀种⽅法。
主成分分析是设法将原来众多具有⼀定相关性(⽐如P个指标),重新组合成⼀组新的、互相⽆关的、综合的指标,来代替原来的指标。通
常数学上的处理就是将原来P个指标作线性组合,作为新的综合指标。
最经典的做法就是⽤F1(选取的第⼀个线性组合,即第⼀个综合指标)的⽅差来表达,即Va(rF1)越⼤,表⽰F1包含的信息越多。因此
在所有的线性组合中选取的F1应该是⽅差最⼤的,故称F1为第⼀主成分。如果第⼀主成分不⾜以代表原来P个指标的信息,再考虑选取F2
即选第⼆个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,⽤数学语⾔表达就是要求Cov(F1,F2)=0,则
称F2为第⼆主成分,依此类推可以构造出第三、第四,……,第P个主成分。
另外,主成分分析经常⽤减少数据集的维数,同时保持数据集的对⽅差贡献最⼤的特征。这是通过保留低阶主成分,忽略⾼阶主成分做到
的。这样低阶成分往往能够保留住数据的最重要⽅⾯。但是,这也不是⼀定的,要视具体应⽤⽽定。
3、如何计算出头条⼴告的⼴告收益?(⽆需计算,给出作答思路即可。)
⾸先,我们要知道 :收益 = 出价x流量x点击率x有效转化率。
那么,显⽽易见,⼴告投放的数量,会在⼀定程度上拉升流量,同时也会造成匹配程度的降低,从⽽影响因点击率。
由此观之,最⼤收益是找到这个乘积的最⼤值,同时,还需考虑有约束条件下的最优化问题。另外,我们还可以参考价格歧视⽅案,对不同
的⽤户,投放不同数量的⼴告。
4、关于次 ⽇⽤户留存率降低,我们应该怎么分析?
⾸先,我们要采⽤ “两层模型”分析法来作答。通过对⽤户进⾏新⽼、渠道、活动、画像等多个维度的细分,然后分别计算出每个维度下不
同⽤户的次⽇留存率。通过数据,定位到导致留存率下降的,是哪个群体。
当然,对于⽤户留存率下降问题,我们还应具体情况具体分析。你还可以通过 “内部-外部”因素,来分析这个问题。
1)内部因素:包括获客 (渠道质量低、活动获取⾮ ⽬标⽤户)、满⾜需求 (新功能改动引发某类⽤户不满)、提活⼿段 (签到等提活⼿段
没达成 ⽬标、产品⾃然使⽤周期低导致上次获得的⼤量⽤户短期内不需要再使⽤等) ;
2)外部因素:包括宏观经济环境 (可采⽤PEST分析法)、政治 (政策影响)、经济 (短期内主要是竞争环境,如对竞争对⼿的活动)、
社会(舆论压⼒、⽤户⽣活⽅式变化、消费⼼理变化、价值观变化等偏好变化)、技术 (创新解决⽅案的出现、分销渠道变化等)。
5、在销售⼤⾖时,如何做可以提升收益?价格提升⾄什么⽔平,收益最⼤?
我们都知道,收益 = 单价*销售量。因此,在回答这道题⽬时,我们应该从提⾼单位溢价,或者提⾼销售规模这两个⽅向
您可能关注的文档
最近下载
- 律师制度与实务课件:律师收费.pptx
- xx集团粮食仓储及加工基地可行性研究报告.docx
- (正式版)-B 5768.2-2022 道路交通标志和标线 第2部分:道路交通标志.docx VIP
- 青少年法制教育讲稿-甘肃省副省长罗笑虎为中小学生作毒品预防教育报告全文.docx VIP
- 2025年水平定向钻市场调查报告.docx
- 辅导员大一新生入学教育主题班会.pptx VIP
- 天津布兰德新摩尔企业策划咨询有限公司公司简介.ppt VIP
- intouch hmi与archestra集成本机成功安装.pdf VIP
- 中国染料化工项目经营分析报告.docx
- 2025-2026学年浙美版(2024)小学美术二年级上册教学计划及进度表.docx
文档评论(0)