- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大 学 试 卷
学年第 学期; 课号
课程名称 Python经济大数据分析 (B、闭卷); 适用班级(或年级、专业)
(每位考生需要答题纸(8k) 1 张、草稿纸(16k) 1 张)
考试时间 120 分钟 班级 学号 姓名
题 号
一
二
三
四
五
六
七
八
九
十
成绩
满 分
30
20
20
30
得 分
评卷人
一、单项选择题(每道题2分,共30分)
1.在进行数据抽样时候的标准不包括:( )
A. 可靠性 B. 有效性 C. 一致性 D. 相关性
2.以下代码的运行结果是?( )
def InputInt(a):
a=15
b=2
InputInt(b)
print(b)
15 B. 2 C. 15.2 D. b
3.对于数据挖掘中的原始数据,不需要考虑的问题包括( )。
A. 错误值 B. 重复 C. 不完整 D. 数据产生的人
4.对于不服从正态分布的变量、分类或等级变量之间的关联性常采用:( )
A. Spearman相关系数 B. 判定系数 C. Pearson相关系数 D. Gamma系数
5.在进行数据探索时能够一次查看数据的基本情况的方法是( )
A. subplot( ) B. describe( ) C. cumsum( ) D. add_subplot( )
6.由于研究目的和对比基础不同,在进行相对数比较时采用的方法不包括( )
A. 结构相对数 B. 比例相对数 C. 过程相对数 D. 强度相对数
7.以下不属于数据处理中经常使用的缺失值填充的方法( )。
A. 忽略元组 B. 属性均值填充缺失值
C. 最近邻填充缺失值 D. 回归填充缺失值
8.哪些算法不需要数据归一化?
A. kNN
B. SVM
C. k-means
D. 决策树
9.以下哪些方法不能用于处理欠拟合?
A. 增加模型复杂度
B. 增大正则化系数
C. 增加新的特征
D. 对特征进行变换,使用组合特征或高维特征
10.以下那种说法是错误的( )。
A. 一个系统越是有序,信息熵就越低
B. 中国足球队战胜巴西足球队的信息熵要小于中国乒乓球队战胜巴西乒乓球队的信息熵
C. 信息增益 = 信息熵 - 条件熵
D. 一个系统越是混乱,随机变量的不确定性就越大,信息熵就越高
11.关于CART算法,错误的是( )。
A. CART算法既可以处理分类问题,也可以处理回归问题
B. 可以处理样本不平衡问题
C. CART算法采用信息增益率的大小来度量特征的各个划分点
D. CART 分类树采用基尼系数的大小来度量特征的各个划分点
12.某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘中的( )。
A. 关联规则 B. 聚类 C. 分类 D. 自然语言处理
13.有关数据挖掘预处理不正确的说法是( )。
A. 预处理是数据挖掘一个不可少的环节
B. 数值规约可以使用聚类进行
C. 预处理涉及缺失值分析、异常值分析等很多工作
D. 预处理的过程可能本身就是一个数据挖掘过程
14. 假设属性income的最大最小值分别是12000元和98000元。利用最大最小规范化的方法将属性的值映射到0至1的范围内。对属性income的73600元将被转化为:( )
A. 0.821 B. 1.224 C. 1.458 D. 0.716
15.当不知道数据所带标签时,可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离?
A. 分类 B. 聚类 C. 关联分析 D. 协同过滤
二、填空题(每空2分,共20分)
1.数据抽样的标准包括:可靠性、有效性、___________。
2. Python中包含4种内建的数据结构为:________、字典、元组、_________。
3.常用的异常值探测方法是简单统计量分析、箱型图分析和_
您可能关注的文档
最近下载
- 特种作业操作证 制冷与空调运行操作作业 实操培训.pdf VIP
- CL01实验室内审检查记录表.pdf VIP
- 幼儿园:实习心得.docx VIP
- (高清版)DB52∕T 895-2014 混凝土砌块用轻质配砖.pdf VIP
- BS EN 10025-6-2004第6部分:技术交付条件用于高屈服强度的扁平产品淬火和结构钢回火的条件.pdf VIP
- 2025法律职业伦理历年试题及答案.doc VIP
- 《房颤诊断和治疗中国指南(2023)》解读PPT课件.pptx VIP
- 40篇短文搞定高考英语3500单词(回顾巩固用).pdf VIP
- 大学生职业生涯规划.pdf VIP
- 2025 公司招聘简章(模板).pdf VIP
原创力文档


文档评论(0)