西瓜书机器学习课后答案周志华.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 绪论 (略) 第一章 绪论 (略) 第二章 模型评估与选择 第二章 模型评估与选择 1.数据集包含 1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训 1.数据集包含 1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训 练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。 练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。 一个组合问题 ,从 500500 正反例 中分别选出 150150 正反例用于留出法评估 ,所 以可能取 一个组合问题 ,从 500500 正反例 中分别选出 150150 正反例用于留出法评估 ,所 以可能取 150 150 2 )2 ( ) 法应该是( 。 法应该是 500 。 500 2.数据集包含100个样本,其中正反例各一半,假定学习算法所产生的模型是将新样本预测 2.数据集包含100个样本,其中正反例各一半,假定学习算法所产生的模型是将新样本预测 为训练样本数较多的类别 (训练样本数相同时进行随机猜测),试给出用 10 折 叉验证法 为训练样本数较多的类别 (训练样本数相同时进行随机猜测),试给出用 10 折 叉验证法 和留一法分别对错误率进行评估所得的结果。 和留一法分别对错误率进行评估所得的结果。 10 折交叉检验 :由于每次训练样本 中正反例数 目一样 ,所 以讲结果判断为正反例的概率也 10 折交叉检验 :由于每次训练样本 中正反例数 目一样 ,所 以讲结果判断为正反例的概率也 是一样的,所 以错误率的期望是 5050% 。 是一样的,所 以错误率的期望是 5050% 。 留一法 :如果留下的是正例 ,训练样本 中反例的数 目比正例多一个 ,所 以留出的样本会被判 留一法 :如果留下的是正例 ,训练样本 中反例的数 目比正例多一个 ,所 以留出的样本会被判 断是反例;同理 ,留出的是反例 ,则会被判断成正例 ,所 以错误率是 100% 。 断是反例;同理 ,留出的是反例 ,则会被判断成正例 ,所 以错误率是 100% 。 3.若学习器A 的F1值比学习器B高,试析A 的BEP值是否也比B高。 3.若学习器A 的F1值比学习器B高,试析A 的BEP值是否也比B高。 4.试述真正例率 (TPR)、假正例率 (FPR)与查准率 (P)、查全率 (R)之间的联系。 4.试述真正例率 (TPR)、假正例率 (FPR)与查准率 (P)、查全率 (R)之间的联系。 查全率: 真实正例被预测为正例的比例 查全率: 真实正例被预测为正例的比例 真正例率: 真实正例被预测为正例的比例 真正例率: 真实正例被预测为正例的比例 显然查全率与真正例率是相等的。 显然查全率与真正例率是相等的。 查准率:预测为正例的实例 中真实正例的比例 查准率:预测为正例的实例 中真实正例的比例 假正例率: 真实反例被预测为正例的比例 假正例率: 真实反例被预测为正例的比例 两者并没有直接的数值关系。 两者并没有直接的数值关系。

文档评论(0)

萧关逢候骑 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档