CPDA重要知识点讲解.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
二、 单选题 1. 检查异常值常用的统计图形是(? ) A、柱状图 B、箱线图 C、帕累托图 D、气泡图 正确答案: B? 2. 什么是KDD?(? ) A、数据挖掘与知识发现 B、领域知识发现 C、文档知识发现 D、动态知识发现 正确答案: A? 3. 东北人养了一只鸡和一头猪。一天鸡问猪:"主人呢?"猪说:"出去买蘑菇了。"鸡听了撒丫子就跑。猪说:"你跑什么?"鸡叫道:“有本事主人买粉条的时候你小子别跑!"? 以上对话体现了数据分析方法中的(? ) A、关联 B、聚类 C、分类 D、自然语言处理 正确答案: A? 4. 假设检验中显著性水平是(? ) A、推断时犯取伪错误的概率 B、推断时取伪弃真的概率 C、正确推断的概率 D、是推断的可信度 正确答案: B? 5. 矩估计的基本原理是(? ) A、用样本矩估计总体矩 B、使得似然函数达到最大 C、使得似然函数达到最小 D、小概率事件在一次试验中是不可能发生的 正确答案: A? 6. SQL查询语句中HAVING子句的作用是(? ) A、指出分组查询的范围 B、指出分组查询的值 C、指出分组查询的条件 D、指出分组查询的内容 正确答案: C? 7. 以下哪项关于决策树的说法是错误的( ?) A、冗余属性不会对决策树的准确率造成不利的影响 B、子树可能在决策树中重复多次 C、决策树算法对于噪声的干扰非常敏感 D、寻找最佳决策树是NP完全问题 正确答案: C? 8. 以下哪种方法不属于于监督学习模型(??? ) A、决策树 B、线性回归 C、关联分析 D、判别分析 正确答案: C? 9考虑下面的频繁3-项集的集合:{1,2,3},{1,2,4},{1,3,4},{1,3,5},{2,3,4},{2,3,5},{3,4,5}假定数据集中只有5个项,若采用合并策略,则由候选产生过程得到4-项集不包含( ) A、1,2,3,4 B、1,2,3,5 C、1,2,4,5 D、1,3,4,5 正确答案: C? 10. 下列不属于原始数据来源的是(? ?) A、行政记录 B、统计调查 C、统计年鉴 D、实验 正确答案: C? 11. 下列不属于分类算法的是(? ) A、C4.5算法 B、逻辑回归 C、KNN算法 D、TF-TDF算法 正确答案: D? 12. 相关分析与回归分析的一个重要区别是( ?) A、前者研究变量之间关系的密切程度,后者研究变量间的变动关系,并用方程式表示 B、前者研究变量之间的变动关系,后者研究变量间关系的密切程度 C、两者都研究变量间的变动关系 D、两者都不研究变量间的变动关系 正确答案: A? 13. 数据仓库是随着时间变化的,下面的描述不正确的是(? ) A、数据仓库随时间的变化不断增加新的数据内容 B、捕捉到的新数据会覆盖原来的快照 C、数据仓库随时间变化不断删去旧的数据内容 D、数据仓库中包含大量的综合数据,这些综合数据会随着时间的变化不断地进行重新综合 正确答案: C? 14. 资金的时间价值是(? ) A、同一资金在同一时点上价值量的差额 B、同一资金在不同时点上价值量的差额 C、不同资金在同一时点上价值量的差额 D、不同资金在不同时点上价值量的差额 正确答案: B? 15. 描述一组对称(或正态)分布数据的离散程度时,最适宜选择的指标是(? ) A、极差 B、标准差 C、均值 D、变异系数 正确答案: B? 16. 下列有关Apriori算法的说法中不正确的是(? ) A、Apriori算法是关联分析中最常用的算法之一。 B、应用Apriori算法时,需要先设定模型的最小支持度、最小置信度等阈值。 C、应用Apriori算法时,输入的数据可以是连续型数据也可以是离散型数据。 D、Apriori算法扫描数据库的次数依赖于最大频繁项集中项的数量。 正确答案: C? 17. 当置信水平一定时,置信区间的宽度(?? ) A、随着样本量的增大而减小 B、随着样本量的增大而增大 C、与样本量的大小无关 D、先随着样本量的增大而减小,到一定程度后会随着样本量的增大而增大。 正确答案: A? 18. 一种商品价格变动与由此引起另外一种商品需求量相对变动的比率称为( ?) A、需求价格弹性 B、供给价格弹性 C、需求交叉弹性 D、供给交叉弹性 正确答案: C? 19. 分类器效果检验中的准确率是指(? ) A、预测正确的数据在总数据中的比例 B、预测为正的数据在总数据中的比例 C、预测为正的数据中实际为正的数据所占比例 D、实际为正的数据中被预测为正的数据所占比例 正确答案: C? 20. 给出下列结论: (1)在回归分析中,可用指数系数R方的值判断模型的拟合效果,R方越大,模型的拟合效果越好; (2)在回归分析中,可用残差平方和判断模型的拟合效果,残差平方和越大,模

文档评论(0)

jyr0221 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档