- 0
- 0
- 约8.17千字
- 约 12页
- 2026-03-23 发布于上海
- 举报
高级数据分析师考试试卷(总分100分)
一、单项选择题(共10题,每题1分,共10分)
以下哪项是处理高维数据中类别特征的最佳实践?
A.直接删除类别特征
B.对类别特征进行标准化(Z-score)
C.使用独热编码(One-HotEncoding)
D.用均值填充缺失的类别值
答案:C
解析:类别特征(如“性别”“地区”)是离散非数值型数据,标准化(B)仅适用于连续型数据;直接删除(A)会丢失信息;均值填充(D)无意义。独热编码(C)通过二进制向量表示类别,是处理类别特征的标准方法。
在A/B测试中,确保实验结果有效的核心条件是?
A.实验组样本量是对照组的2倍
B.流量分配满足“互斥且均匀”
C.显著性水平设定为0.01
D.仅分析均值指标的变化
答案:B
解析:A/B测试的核心是随机分组,确保实验组与对照组的用户特征无显著差异(互斥且均匀)。样本量需通过统计功效计算(A错误);显著性水平(如0.05)是统计标准,非核心(C错误);需分析多维度指标(D错误)。
以下哪种场景最适合使用逻辑回归模型?
A.预测用户未来3个月的消费金额(连续值)
B.识别垃圾邮件(二分类问题)
C.对用户行为数据进行聚类分组
D.预测商品销量的季节性波动
答案:B
解析:逻辑回归是经典的二分类模型(B正确)。预测连续值(A)需线性回归;聚类(C)用K-means等;季节性预
您可能关注的文档
- 2026年审计专业技术资格考试题库(附答案和详细解析)(0103).docx
- 2026年执业医师资格考试考试题库(附答案和详细解析)(0125).docx
- 2026年注册岩土工程师考试题库(附答案和详细解析)(0312).docx
- 2026年绿色金融认证考试题库(附答案和详细解析)(0131).docx
- 2026年隐私保护工程师(CIPT)考试题库(附答案和详细解析)(0308).docx
- PythonScikit-learn机器学习模型评估.docx
- RCEP框架下的区域产业链重构趋势分析.docx
- 《百年孤独》的魔幻现实主义手法跨文化解读.docx
- 专利权侵权赔偿及案例.docx
- 两晋门阀政治的形成与衰落.docx
- 2026年新能源智能电网发展趋势分析报告.docx
- 2026年医疗智能药物研发报告及未来五至十年精准医疗报告.docx
- 2026年低空经济无人机物流报告及未来五至十年物流产业变革报告.docx
- 2026年金融区块链防伪创新报告及未来五至十年监管政策报告.docx
- 2026年新能源智能电网行业发展趋势与建设挑战分析.docx
- 2026年航空航天可重复使用火箭技术报告及未来五至十年太空探索商业化报告.docx
- 2026年可穿戴设备行业分析报告及未来五至十年健康监测报告.docx
- 2026年自动驾驶汽车安全报告及未来五至十年交通行业智能化报告.docx
- 2026年虚拟现实教育实训报告及未来五至十年沉浸式教学报告.docx
- 2026年建筑3D打印结构技术报告及未来五至十年绿色建筑报告.docx
原创力文档

文档评论(0)