- 1、本文档共22页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.()反映了学习方法对未知的测试数据集的预测能力,是学习中的重要概念。
A.训练误差
B.测试误差
C.统计误差
D.平均误差
答案:B
2.支持向量机的 MapReduce 实现要进行几轮 MapReduce?()
A.1
B.2
C.3
D.自行规定
答案:D
3.类的 R 型聚类是指()。
A.对样本个体进行聚类
B.对指标变量进行聚类
答案:B
4.在估计 PLSA 生成模型的参数时,使用()。
A.极大似然估计
B.对数似然函数
C.特征独立假设
D.贝叶斯定理
答案:A
5.在链接作弊的垃圾农场中,作弊者拥有并完全控制的网页称为()。
A.不可达网页
B.可达网页
C.自有网页
答案:C
6.潜在语义分析创新地引入了()。
A.单词维度
B.文本维度
C.话题维度
答案:C
7.非频繁模式()。
A.其置信度小于阈值
B.令人不感兴趣
C.包含负模式和负相关模式
D.对异常数据项敏感
答案:D
8.置信度(confidence)是衡量兴趣度度量()的指标。
A.简洁性
B.确定性
C.实用性
D.新颖性
答案: B
9.决策树中的叶结点表示()。
A.特征
B.类
C.属性
D.值域输出
答案:B
10.数据产生方式变革中数据产生方式是主动的主要是来自哪个阶段?()
A.运营式系统阶段
B.用户原创内容阶段
C.感知式系统阶段
答案:B
11.文本中所有单词的出现情况表示了文本的()。
A.种类
B.特征
C.语义内容
D.语义结构
答案:C
12.闵式距离参数是()时代表曼哈顿距离。
A.0
B.1
C.2
D.无穷
答案: B
13.为了计算中介度,必须计算所有边上()的数目。
A.所有路径
B.最短路径
C.结点入度
D.节点出度
答案:B
14.聚类属于()。
A.有监督学习
B.无监督学习
C.强化学习
D.对抗学习
答案:B
15.评价分类器效果时,表示正确分类的样本数与总样本数之比的指标是()。
A.准确率
B.精确率
C.召回率
D.F1 值
答案:A
16.逻辑斯谛分布的分布函数范围在()。
A.(-∞,∞)
B.(0 ,1)
C.(-1/2 ,1/2)
D.(-1 ,1)
答案: B
17.Apriori 算法的加速过程依赖于以下哪个策略?()
A.抽样
B.剪枝
C.缓冲
D.并行
答案:B
18.向量空间模型中,将单词在文本中出现的数据用一个()表示。
A.单词-文本矩阵
B.单词-向量矩阵
C.距离矩阵
D.权重矩阵
答案:A
19.潜在语义分析中,以()表示文本的语义内容。
A.话题
B.话题向量
C.语义向量
D.距离向量
答案:B
20.KNN 算法用 MapReduce 实现,要进行几轮 MapReduce?()
A.1
B.2
C.3
D.4
答案: B
21.按社团形成机制分类,社团包括()。
A.明显的社团
B.预定义社团
C.自组织社团
D.隐含的社团
答案:BC
22.决策树的生成过程是()。
A.递归地进行下去,直至所有训练据子集被基本正确分类,或者没有合适的特征为止,
最后每个子集都被分到叶结点上,即都有了明确的类
B.如果这些子集已经能够被基本正确分类,那么构建叶结点,并将这些子集分到所对
应的叶结点中去
C.构建根结点,将所有训练数据都放在根结点
D.选择一个最优特征,按照这一特征将训练数据集分割成子集,使得各个子集有一个
在当前条件下最好的分类
E.如果还有子集不能被基本正确分类,那么就对这些子集选择新的最优特征,继续对
其进行分割,构建相应的结点
答案:ABCDE
23.回归分析方法中,按照输入变量个数分类,可分为()。
A.一元回归
B.多元回归
C.线性回归
D.非线性回归
答案:AB
24.下列哪些任务适合构建分类模型?()
A.银行业务中,客户申请贷款,根据客户的相关数据分析他是属于“诚信”类还是
“失信”类
B.邮件系统可以根据 email 标题和内容区分出垃圾邮件
C.医学研究人员根据病理数据,合理辨识病情状况,采取合理治疗手段
D.房价预测
答案:ABC
25.ID3 算法流程为()。
A.从根结点开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征
作为结点的特征,由该特征的不同取值建立子结
您可能关注的文档
- 商务英语谈判技巧—要求优惠、给予优惠 .pdf
- 高级网络技术复习题 .pdf
- [东北师范大学]《管理会计》20春在线作业1-1 .pdf
- 中国电信校园招录考试专业基础知识题库 .pdf
- 南开大学2021年9月《企业管理概论》作业考核试题及答案参考19.pdf
- 西工大16秋《行政管理学》在线作业 .pdf
- 药理学试卷(四) .pdf
- [四川大学]《人员招聘和录用(1)1155》18秋在线作业1 .pdf
- 公共伦理学_在线作业_1 .pdf
- 通信网络管理员中级考试试题与答案 .pdf
- 白天晚上教学课件.ppt
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题带答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解一套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及完整答案详解1套.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及参考答案详解1套.docx
- 2025年山东菏泽市事业单位招聘急需紧缺岗位目录(第一批)笔试模拟试题参考答案详解.docx
- 2025年山东菏泽市牡丹区中医医院引进急需紧缺专业技术人才30人笔试模拟试题及答案详解1套.docx
- 画西瓜教学课件.ppt
最近下载
- (高清版)W-S-T 442-2024 临床实验室生物安全指南.docx VIP
- 不同公司橡胶助剂名称对照表橡Chemical Cross Reference.pdf VIP
- 世界陆地地形和海底地形.ppt VIP
- 连云港社区工作者考试真题库(2024版).docx VIP
- 2011全国电子设计大赛报告终极版(智能小车).doc VIP
- 神源(SYRUNS)SY5000P变频器使用说明书用户手册.pdf VIP
- Q/GDW_12218-2022_低压交流配网不停电作业技术导则_.pdf VIP
- 欧瑞(惠丰HFinverter)F1500-G变频器说明书.pdf
- 石油化工建设工程施工安全技术标准.docx VIP
- 计算机程序设计员考试题一.pdf VIP
文档评论(0)