CPDA考试真题与答案-1.docx

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一、 单选题“大数据”是指规模超过1000TB的数据集。正确答案:?×?概率为0的事件是不可能事件,概率为1的事件是必然事件。正确答案:?×将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样。正确答案:?√统计图中的散点图主要用来观察变量之间的相关关系。正确答案:?√?抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。正确答案:?×?Datahoop1.2版中 K-means聚类分析要求输入的数据必须是数值型数据。正确答案:?√?如果事件A,B互斥,且P(A)0,P(B)0,则A,B独立。正确答案:?×??SQL中删除表的命令是“DELETE TABLE”。正确答案:?×?聚类分析中,各变量的取值在数量级上不能有过大的差异。正确答案:?√?如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。正确答案:?×?需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高价格。正确答案:?×?使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。正确答案:?√?线性回归模型的拟合优度可采用可决系数进行评判。可决系数越高,模型拟合效果越好;可决系数越小,模型拟合效果越差。正确答案:?×?一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。正确答案:?×?决策树中包含根结点、叶结点、内部结点和外部结点。正确答案:?×?二、 单选题1. 检查异常值常用的统计图形是(? )A、柱状图 B、箱线图C、帕累托图D、气泡图正确答案: B?2. 什么是KDD?(? )A、数据挖掘与知识发现B、领域知识发现C、文档知识发现D、动态知识发现正确答案: A?3. 东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"?以上对话体现了数据分析方法中的(? )A、关联B、聚类C、分类D、自然语言处理正确答案: A?4. 假设检验中显著性水平是(? )A、推断时犯取伪错误的概率B、推断时取伪弃真的概率C、正确推断的概率D、是推断的可信度正确答案: B?5. 矩估计的基本原理是(? )A、用样本矩估计总体矩B、使得似然函数达到最大C、使得似然函数达到最小D、小概率事件在一次试验中是不可能发生的正确答案: A?6. SQL查询语句中HAVING子句的作用是(? )A、指出分组查询的范围B、指出分组查询的值C、指出分组查询的条件D、指出分组查询的内容正确答案: C?7. 以下哪项关于决策树的说法是错误的( ?)A、冗余属性不会对决策树的准确率造成不利的影响B、子树可能在决策树中重复多次C、决策树算法对于噪声的干扰非常敏感D、寻找最佳决策树是NP完全问题正确答案: C?8. 以下哪种方法不属于于监督学习模型(??? )A、决策树B、线性回归C、关联分析D、判别分析正确答案: C?9考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,若采用合并策略,则由候选产生过程得到4-项集不包含( )A、1,2,3,4B、1,2,3,5C、1,2,4,5D、1,3,4,5正确答案: C?10. 下列不属于原始数据来源的是(?)A、行政记录B、统计调查C、统计年鉴D、实验正确答案: C?11. 下列不属于分类算法的是(? )A、C4.5算法B、逻辑回归C、KNN算法D、TF-TDF算法正确答案: D?12. 相关分析与回归分析的一个重要区别是( ?)A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度C、两者都研究变量间的变动关系D、两者都不研究变量间的变动关系正确答案: A?13. 数据仓库是随着时间变化的,下面的描述不正确的是(? )A、数据仓库随时间的变化不断增加新的数据内容B、捕捉到的新数据会覆盖原来的快照C、数据仓库随时间变化不断删去旧的数据内容D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合正确答案: C?14. 资金的时间价值是(? )A、同一资金在同一时点上价值量的差额B、同一资金在不同时点上价值量的差额C、不同资金在同一时点上价值量的差额D、不同资金在不同时点上价值量的差额正确答案: B?15. 描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是(? )A、极差B、标准差C、均值D、变异系数正确答案: B?16. 下列有关Apriori算法的说法中不正确的是(? )A、Apriori算法是关联分析中最

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档