CPDA考试真题与包括.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
CPDA考试真题与包含 CPDA考试真题与包含 PAGE / NUMPAGES CPDA考试真题与包含 精选文档 一、 判断题(题数: 15,共 15.0 分) 1.定量属性能够是整数值或许是连续值。 ( ) 正确答案: √ 2.分类模型的偏差大概分为两种:训练偏差( training error )和泛化偏差( generalization error )。( ) 正确答案: √ 3.在决议树中,跟着树中结点数变得太大,即使模型的训练偏差还在持续减低,可是查验误 差开始增大,这是出现了模型拟合不足的问题。 ( ) 正确答案: × 4.在聚类剖析中间,簇内的相像性越大,簇间的差异越大,聚类的成效就越差。 ( ) 正确答案: × 5.聚类剖析能够看作是一种非监察的分类。 ( ) 正确答案: √ 6.假如一个对象不强属于任何簇,那么该对象是鉴于聚类的离群点。 ( ) 正确答案: √ 7.同意偏差应依据错误记录对整个系统可能带来的损坏来确立, 往常正是那些低使用率的产 品或不常使用的产品为库存偏差带来很大麻烦, 所以应联合数目方差百分比和绝对值方差来 确立偏差。( ) 正确答案: √ 8.召回率反应的是展望为正中的样本中正例的概率。 ( ) 正确答案: × 9.支持度表示前项与后项在一个数据集中同时出现的频次。 ( ) 正确答案: √ 10.最大最小值标准化法也叫极值法, 该方法合用于已知数据集的最小值或最大值状况。 ( ) 正确答案: √ . 精选文档 11.波特五力模型中五个压力根源是供给商讨价能力、购置者的议价能力、行业新进入者的 威迫、代替产品的威迫及公司内部的管理压力。 ( ) 1.0 分) 1.0 分 正确答案: × 12.异样值在数理统计里一般是指一组观察值中与均匀值的偏差超出三倍标准差的测定值。 ( ) 正确答案: × 13.数据可视化能够便于人们对数据的理解。 ( ) 正确答案: √ 14.大数据思想,是指一种意识,认为公然的数据一旦办理适当能够为人类急需解决的问题供给答案。( ) 正确答案: √ 15.资本自己拥有时间价值。 ( ) 正确答案: × 二、 单项选择题(题数: 30,共 45.0 分) 1.某商场研究销售记录发现,购置牛奶的人很大体率会购置面包,这类属于数据发掘的哪种问题?( ) A、聚类剖析 B、关系规则 C、分类剖析 D、自然语言办理 正确答案: B 2.以下两种描绘分别对应哪两种对分类算法的评论标准?( ) (a)警察抓杀人犯,描绘警察抓的人中有多少个是杀人犯的标准。 描绘有多少比率的杀人犯给警察抓了的标准。 A、Precision, Recall B、 Recall, Precision C、 Precision, ROC D、Recall, ROC . 精选文档 正确答案: A 3.将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( ) A、数据获得 B、分类和展望 C、数据预办理 D、数据可视化 正确答案: C 4.当不知道数据所带标签时, 能够使用哪一种技术促进带同类标签的数据与带其余标签的数据相分别?( ) A、分类 B、聚类 C、关系剖析 D、主成分剖析 正确答案: B 5.下边哪一种不属于数据预办理的方法?( ) A、变量代换 B、失散化 C、齐集 D、预计遗漏值 正确答案: D 6.假定 12 个销售价钱记录组已经排序以下: 5, 10, 11, 13, 15, 35, 50, 55, 72, 92, 204, 215 使 用等宽区分(宽度为 50)方法将它们区分红四个箱,求 15 在哪个箱子里?( ) A、第一个 B、第二个 C、第三个 D、第四个 正确答案: A 7.以下哪些算法是分类算法?( ) A、DBSCAN B、 . 精选文档 C、 K-Mean D、K-medoids 正确答案: B 8.以下哪些分类方法能够较好地防止样本的不均衡问题?( ) A、KNN B、 SVM C、 Bayes D、神经网络 正确答案: A 9.对于 K 均值和 DBSCAN 的比较,以下说法不正确的选项是( )。 A、K 均值抛弃被它辨别为噪声的对象,而 DBSCAN 一般聚类全部对象 B、 K 均值使用簇的鉴于原型的观点,而 DBSCAN 使用鉴于密度的观点 C、 K 均值很难办理非球形的簇和不一样大小的簇, DBSCAN 能够办理不一样大小和不一样形状的 簇 D、K 均值能够发现不是显然分别的簇,即使簇有重叠也能够发现,可是 DBSCAN 会集并有 重叠的簇 正确答案: A 10.以下不属于关系剖析的重点因素的是( ) A、支持度 B、置信度 C、满意度 D、提高度 正确答案: C 11.因子剖析的主要作用有( ) A、对变量进行降维 B、对变量进行鉴

文档评论(0)

135****7958 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档