- 0
- 0
- 约5.55千字
- 约 6页
- 2026-06-29 发布于上海
- 举报
数据科学专业认证(CDSP)
一、单项选择题(共10题,每题1分,共10分)
在机器学习中,如果一个模型在训练数据上表现很好,但在新的、未见过的数据上表现很差,这通常被称为什么现象?A.过拟合B.欠拟合C.泛化D.偏差答案:A解析:过拟合是指模型学习了训练数据中的噪声和细节,导致模型过于复杂,在训练集上准确率高,但在测试集上无法泛化。欠拟合是指模型太简单,无法捕捉数据中的规律。泛化是指模型将学到的知识应用到新数据的能力。
下列哪个统计量最稳健(Robust),对异常值不敏感?A.平均值B.中位数C.方差D.标准差答案:B解析:中位数是将数据排序后位于中间位置的值,它不受极端异常值的影响。平均值和方差/标准差对异常值非常敏感。
在数据清洗过程中,处理缺失值时,若数据呈正态分布,通常使用哪种方法进行填充?A.中位数填充B.均值填充C.众数填充D.随机填充答案:B解析:对于正态分布的数据,均值和标准差能最好地描述数据的分布特征,因此用均值填充缺失值是最科学的方法。中位数常用于偏态分布,众数用于分类数据。
下列哪个算法属于监督学习算法?A.K-均值聚类B.主成分分析(PCA)C.线性回归D.K近邻(KNN)答案:C解析:线性回归属于监督学习中的回归算法。K-均值聚类和PCA是无监督学习算法。KNN虽然是监督
您可能关注的文档
- 2026年儿童发展指导师考试题库(附答案和详细解析)(0607).docx
- 2026年外交翻译考试(DFT)考试题库(附答案和详细解析)(0526).docx
- 2026年房地产经纪人职业资格考试题库(附答案和详细解析)(0613).docx
- 2026年注册水利水电工程师考试题库(附答案和详细解析)(0528).docx
- 2026年注册照明设计师考试题库(附答案和详细解析)(0527).docx
- 2026年网络工程师考试题库(附答案和详细解析)(0613).docx
- RCEP对亚太区域经济一体化的影响.docx
- 《简爱》独立女性意识.docx
- 一次导航体验作文.docx
- 一次野外探险作文.docx
原创力文档

文档评论(0)