最全CPDA的考试真题与答案5经典版.pdf

一、 判断题(题数: 15 ,共 15.0 分) 1.定量属性可以是整数值或者是连续值。 ( ) 正确答案: √ 2. 分类模型的误差大致分为两种:训练误差( training error )和泛化误差( generalization error )。( ) 正确答案: √ 3.在决策树中,随着树中结点数变得太大,即使模型的训练误差还在继续减低,但是检验误 差开始增大,这是出现了模型拟合不足的问题。 ( ) 正确答案: × 4. 在聚类分析当中,簇内的相似性越大,簇间的差别越大,聚类的效果就越差。 ( ) 正确答案: × 5. 聚类分析可以看作是一种非监督的分类。 ( ) 正确答案: √ 6. 如果一个对象不强属于任何簇,那么该对象是基于聚类的离群点。 ( ) 正确答案: √ 7. 允许误差应根据错误记录对整个系统可能带来的破坏来确定, 通常正是那些低使用率的产 品或不常使用的产品为库存误差带来很大麻烦, 因此应结合数量方差百分比和绝对值方差来 确定误差。 ( ) 正确答案: √ 8. 召回率反映的是预测为正中的样本中正例的概率。 ( ) 正确答案: × 9. 支持度表示前项与后项在一个数据集中同时出现的频率。 ( ) 正确答案: √ 10. 最大最小值标准化法也叫极值法, 该方法适用于已知数据集的最小值或最大值情况。 ( ) 正确答案: √ 11. 波特五力模型中五个压力来源是供应商议价能力、购买者的议价能力、行业新进入者的 威胁、替代产品的威胁及企业内部的管理压力。 ( ) (1.0 分) 1.0 分 正确答案: × 12. 异常值在数理统计里一般是指一组观测值中与平均值的偏差超过三倍标准差的测定值。 ( ) 正确答案: × 13. 数据可视化可以便于人们对数据的理解。 ( ) 正确答案: √ 14. 大数据思维,是指一种意识,认为公开的数据一旦处理得当可以为人类急需解决的问题 提供答案。 ( ) 正确答案: √ 15. 资金本身具有时间价值。 ( ) 正确答案: × 二、 单选题(题数: 30 ,共 45.0 分) 1.某超市研究销售记录发现, 购买牛奶的人很大概率会购买面包, 这种属于数据挖掘的哪类 问题?( ) A 、聚类分析 B、关联规则 C、分类分析 D 、自然语言处理 正确答案: B 2. 以下两种描述分别对应哪两种对分类算法的评价标准?( ) (a) 警察抓杀人犯,描述警察抓的人中有多少个是杀人犯的标准。 (b) 描述有多少比例的杀人犯给警察抓了的标准。 A 、Precision, Recall B、Recall, Precision C、Precision, ROC D 、Recall, ROC 正确答案: A 3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( ) A 、数据获取 B、分类和预测 C、数据预处理 D 、数据可视化 正确答案: C 4. 当不知道数据所带标签时, 可以使用哪种技术促使带同类标签的数据与带其他标签的数据 相分离?( ) A 、分类 B、聚类 C、关联分析 D 、主成分分析 正确答案: B 5. 下面哪种不属于数据预处理的方法?( ) A 、变量代换 B、离散

文档评论(0)

1亿VIP精品文档

相关文档