完整版CPDA考试真题与答案1.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
--WORD格式---可编辑--- 一、单选题 1. “大数据”是指规模超过 1000TB 的数据集。正确答案: × 2. 概率为 0 的事件是不可能事件,概率为1 的事件是必然事件。 正确答案: × 3.将总体中的各单位按某一标志排列,再依固定间隔抽选调查单位的抽样方式为等距抽样。 正确答案: √ 4. 统计图中的散点图主要用来观察变量之间的相关关系。正确答案: √ 5. 抽样误差是指在调查过程中由于观察、测量等差错所引起的误差。正确答案: × 6. Datahoop1.2 版中 K-means 聚类分析要求输入的数据必须是数值型数据。正确答案: √ 7. 如果事件 A,B 互斥,且 P(A)0,P(B)0, 则 A , B 独立。 正确答案: × 8. SQL 中删除表的命令是“ DELETE TABLE”。正确答案: × 9. 聚类分析中,各变量的取值在数量级上不能有过大的差异。正确答案: √ 10. 如果某产品的生产和销售正处于市场成长期,其营销重点应该是延长产品寿命。 -- 精品资料分享---可编辑--格式--WORD. --WORD格式---可编辑--- 正确答案: × 11. 需求定价法的核心思想是力求在需求高涨时收取较低价格,而当需求低落时则收取较高 价格。 正确答案: × 12. 使用索引可以快速访问数据库中的数据,所以可以在数据库中尽量多的建立索引。正确答案: √ 13. 线性回归模型的拟合优度可采用可决系数进行评判。可决系数越高, 模型拟合效果越好; 可决系数越小,模型拟合效果越差。 正确答案: × 14. 一个时间序列中包含长期趋势、季节变动、循环变动和不规则变动,一般将四个因素一一分解之后进行分析。 正确答案: × 15. 决策树中包含根结点、叶结点、内部结点和外部结点。正确答案: × 二、单选题 1. 检查异常值常用的统计图形是() 、柱状图A B、箱线图 C、帕累托图 D、气泡图 正确答案:B 2. 什么是 KDD ?( ) A 、数据挖掘与知识发现 B、领域知识发现 -- 精品资料分享---可编辑--格式--WORD. --WORD格式---可编辑--- C、文档知识发现 D、动态知识发现 正确答案:A 3. 东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡 听了撒丫子就跑。 猪说:"你跑什么?"鸡叫道: “有本事主人买粉条的时候你小子别跑!" 以上对话体现了数据分析方法中的() A 、关联 B、聚类 C、分类 D、自然语言处理 正确答案:A 4. 假设检验中显著性水平是( ) A 、推断时犯取伪错误的概率 B、推断时取伪弃真的概率 C、正确推断的概率 D、是推断的可信度 正确答案:B 5. 矩估计的基本原理是() A 、用样本矩估计总体矩 B、使得似然函数达到最大 C、使得似然函数达到最小 D、小概率事件在一次试验中是不可能发生的 正确答案:A 6. SQL 查询语句中 HAVING子句的作用是() A 、指出分组查询的范围 B、指出分组查询的值 C、指出分组查询的条件 D、指出分组查询的内容 正确答案:C -- 精品资料分享---可编辑--格式--WORD. --WORD格式---可编辑--- 7. 以下哪项关于决策树的说法是错误的() A 、冗余属性不会对决策树的准确率造成不利的影响 B、子树可能在决策树中重复多次 C、决策树算法对于噪声的干扰非常敏感 D、寻找最佳决策树是 NP 完全问题 正确答案:C 8. 以下哪种方法不属于于监督学习模型() A 、决策树 B、线性回归 C、关联分析 D、判别分析 正确答案:C 9 考虑下面的频繁 3- 项集的集合: {1 ,2,3} , {1 ,2,4} ,{1 ,3, 4} , {1 ,3, 5} ,{2 ,3 ,

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档