数据挖掘原理与应用 试题及答案 试卷十二答案.pdf

数据挖掘原理与应用 试题及答案 试卷十二答案.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据挖掘原理与应用试题及答案

数据挖掘原理与应用 试题及答案 试卷 一、(30 分,总共30题,每题答对得1分,答错得0 分)单选题 1、在ID3算法中信息增益是指( D ) A、信息的溢出程度 B、信息的增加效益 C、熵增加的程度最大 D、熵减少的程度最大 2、下面哪种情况不会影响K-means 聚类的效果?( B ) A、数据点密度分布不均 B、数据点呈圆形状分布 C、数据中有异常点存在 D、数据点呈非凸形状分布 3、下列哪个不是数据对象的别名 ( C ) A、样品 B、实例 C、维度 D、元组 4、人从出生到长大的过程中,是如何认识事物的? ( D ) A、聚类过程 B、分类过程 C、先分类,后聚类 D、先聚类,后分类 5、决策树模型中应如何妥善处理连续型属性:( C ) A、直接忽略 B、利用固定阈值进行离散化 C、根据信息增益选择阈值进行离散化 D、随机选择数据标签发生变化的位置进行离散化 6、假定用于分析的数据包含属性age。数据元组中age 的值如下(按递增序):13,15,16,16,19,20, 20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70。问题:使用按箱平均值 平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为:( A ) A、18.3 B、22.6 C、26.8 D、27.9 7、建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务? ( C ) A、根据内容检索 B、建模描述 C、预测建模 D、寻找模式和规则 8、如果现在需要对一组数据进行样本个体或指标变量按其具有的特性进行分类,寻找合理的度量事物相似 性的统计量,应该采取( A ) A、聚类分析 B、回归分析 C、相关分析 D、判别分析 9、时间序列数据更适合用( A )做数据规约。 A、小波变换 B、主成分分析 C、决策树 D、直方图 10、下面哪些场景合适使用PCA?( A ) A、降低数据的维度,节约内存和存储空间 B、降低数据维度,并作为其它有监督学习的输入 C、获得更多的特征 第 1 页(共 7 页) D、替代线性回归 11、数字图像处理中常使用主成分分析(PCA)来对数据进行降维,下列关于PCA 算法错误的是:( C ) A、PCA 算法是用较少数量的特征对样本进行描述以达到降低特征空间维数的方法; B、PCA 本质是KL-变换; C、PCA 是最小绝对值误差意义下的最优正交变换; D、PCA 算法通过对协方差矩阵做特征分解获得最优投影子空间,来消除模式特征之间的相关性、突出差异 性; 12、将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?( C ) A、频繁模式挖掘 B、分类和预测 C、数据预处理 D、数据流挖掘 13、假设使用维数降低作为预处理技术,使用PCA 将数据减少到k 维度。然后使用这些PCA 预测作为特征, 以下哪个声明是正确的?( B ) A、更高的“k”意味着更正则化 B、更高的“k”意味着较少的正则化 C、都不对 D、都正确 14、为节省神经网络模型的训练时间,神经网络模型的权重和偏移参数一般初始化为( D ) A、0 B、0.5 C、1 D、随机值 15、在逻辑回归输出与目标对比的情况下,以下评估指标中哪一项不适用?( D ) A、AUC-ROC B、准确度 C、Logloss D、均方误差 16、假设对数据提供一个逻辑回归模型,得到训练精度X 和测试精度Y。在数据中加入新的特征值,则下 列哪一项是正确的?提示:其

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档