- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据分析师认证(ACP级)考试样题
单选题
MySQL数据库中有“product”的数据表。“product”数据表存储的是产品的基本信息,它包含如下字段:产品编号“id”,价格“price”以及产品描述“description”,其中产品编号“id”是主键。如果分析师希望通过SQL语句从“product”表中选取三件价格最贵的产品的编号以及产品描述,可以通过_____命令实现。
select id,description from product order by price asc limit 3;
select id,description from product where max(price)3;
select id,description from product order by price desc limit 3;
select id,description,max(price) from product order by price;
某高校的教授在第一天上课时发现,他授课的班级中女性学生的出勤比例明显大于男性学生,但是点名册却显示该班级的男女比例实际上为1比1。该教授推测,可能是因为男性学生比女性学生更容易翘课。为了检验他的假设,该教授记录了这个班级在一个学期的16次课程中的男女学生出勤情况,并使用双样本T-test的假设检验方法来检查男女学生的出勤率有无明显差异。男性学生与女性学生的平均出勤率分别用P(M)与P(F)表示。以下假设条件中,_____符合该教授的分析要求。
原假设应该设为,H0:P(M)= P(F),并使用双侧检验
原假设应该设为,H0:P(M)= P(F),并使用左侧检验
原假设应该设为,H0:P(M) P(F),并使用左侧检验
原假设应该设为,H0:P(M) P(F),并使用双侧检验
与RDBMS相比,Apache Hadoop的一个不同之处在于_____。
RDBMS只能将数据存储在同一磁盘上统一管理,而Hadoop可以在不同磁盘上存储数据块,因此Hadoop可实现分布读写数据
RDBMS只能将数据存储在同一磁盘上统一管理,而Hadoop可以在不同磁盘上存储数据块,因此Hadoop的可扩展性较强
RDBMS和Hadoop都可以在多个磁盘上存储数据,但Hadoop不需要遵循ACID特性,因此Hadoop可存储非结构化数据
RDBMS和Hadoop都可以在多个磁盘上存储数据,但Hadoop可以利用低端硬件设备横向扩展,因此Hadoop的扩展成本较低
2017年,“新一线城市研究所”发布了最新的中国城市等级划分。在进行划分时,使用了城市的经济实力、城市枢纽性与城市生活多样性等5项指标作为评判标准,利用算法对全国各主要城市进行了重新划分。划分结果完全由各个城市在几个指标上的差异决定,这打破了传统的一、二、三线城市的划分规则,出现了一类“新一线”城市。这种划分算法属于_____。
聚类,可根据各城市之间的差异自动确定城市类别
聚类,使用部分已划分好的城市作为训练集有监督学习
分类,需要过往的城市等级划分作为标签无监督学习
分类,可以使用K-means法进行划分
ABC电商公司非常关心用户从浏览到下单到支付的转化率,他们想分析不同性别的人在该流程中的转化率的差异,以下图表中______更适合该场景。
旋风漏斗图
漏斗图
矩阵树图
瀑布图
多选题
数据管理技术在其发展过程中,经历了人工管理阶段、文件系统阶段和数据库系统阶段。与文件系统阶段相比,数据库系统阶段对数据的管理方式有了许多方面的改进。这种改进体现在_____。(正确答案个数:2个)
数据库系统提供了结构化查询语言,降低了数据管理、查询等操作的难度
数据库系统在某种程度上保证了数据的一致性
文件系统管理的数据量较少,而数据库系统可以管理庞大的数据量
数据库系统比较复杂,而文件系统比较简单
文件系统可以更好的保存非格式化的数据,比如音频、视频等
业务部门需要关闭一些销售情况不佳的门店,数据分析师小张按KPI设计要求计算了各个门店上一季度的相关KPI,建议将KPI指标最差的门店关闭。但业务部门认为无法凭借一个季度的KPI决定哪家店需要关,而是需要前两年每个季度KPI的同比结果来判断各个门店的业绩是上升的还是下降,才能决定关店。该分析方案设计有缺陷,小张很可能在实施项目前没有理解项目的_____。(正确答案个数:2个)
目的
范围
风险
绩效
设计师小王参与了多个使用可视化工具制作可视化大屏的项目,他根据自己的经验总结了一些可视化大屏的基本设计原则,其中正确的有______。(正确答案的数量:3个)
将大屏合理的拆解成多个板块,层次结构分明
重点KPI放在突出位置,最好能辅以细节解释数据
优先级越高的信息,越要放在中间和上方
大屏中心是视觉核
原创力文档


文档评论(0)