- 0
- 0
- 约7.86千字
- 约 22页
- 2026-05-02 发布于四川
- 举报
2026年市场调研大数据分析试题及答案
1.单项选择题(每题1分,共20分)
1.1在Pythonpandas中,对DataFramedf按列“price”降序排列并取前10行,正确语句是
A.df.sort_values(price,ascending=False).head(10)
B.df.sort(price,ascending=False).head(10)
C.df.nlargest(10,price)
D.df.sort_values(price).tail(10)
答案:A
1.2下列哪一项不是K-means聚类的固有缺陷
A.对初始中心点敏感
B.需预先指定K值
C.对异常值稳健
D.假设簇为球形分布
答案:C
1.3在A/B测试中,若显著性水平α=0.05,检验功效1-β=0.8,则第二类错误概率为
A.0.05
B.0.2
C.0.8
D.0.95
答案:B
1.4使用MapReduce统计10TB用户日志中“点击”次数,最关键的“洗牌”阶段完成的功能是
A.将点击事件按用户ID聚合到同一节点
B.对点击事件做去重
C.将HDFS块复制到3个节点
D.启动JobTracker
答案:A
1.5在随机森林中,关于Out-of-Bag(OOB)错误,下列说法正确的是
A.需要额外验证集
B.可用来估计泛化
原创力文档

文档评论(0)