西瓜书机器学习课后答案周志华.pdf

下载文档

6968
0
约1.28万字
约 8页
2020-12-29 发布于江苏
举报
版权申诉
保障服务

西瓜书机器学习课后答案周志华.pdf

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第一章绪论（略）第一章绪论（略）第二章模型评估与选择第二章模型评估与选择 1.数据集包含 1000个样本，其中500个正例，500个反例，将其划分为包含70%样本的训 1.数据集包含 1000个样本，其中500个正例，500个反例，将其划分为包含70%样本的训练集和30%样本的测试集用于留出法评估，试估算共有多少种划分方式。练集和30%样本的测试集用于留出法评估，试估算共有多少种划分方式。一个组合问题，从 500500 正反例中分别选出 150150 正反例用于留出法评估，所以可能取一个组合问题，从 500500 正反例中分别选出 150150 正反例用于留出法评估，所以可能取 150 150 2 )2 ( ) 法应该是( 。法应该是 500 。 500 2.数据集包含100个样本，其中正反例各一半，假定学习算法所产生的模型是将新样本预测 2.数据集包含100个样本，其中正反例各一半，假定学习算法所产生的模型是将新样本预测为训练样本数较多的类别（训练样本数相同时进行随机猜测），试给出用 10 折叉验证法为训练样本数较多的类别（训练样本数相同时进行随机猜测），试给出用 10 折叉验证法和留一法分别对错误率进行评估所得的结果。和留一法分别对错误率进行评估所得的结果。 10 折交叉检验：由于每次训练样本中正反例数目一样，所以讲结果判断为正反例的概率也 10 折交叉检验：由于每次训练样本中正反例数目一样，所以讲结果判断为正反例的概率也是一样的，所以错误率的期望是 5050% 。是一样的，所以错误率的期望是 5050% 。留一法：如果留下的是正例，训练样本中反例的数目比正例多一个，所以留出的样本会被判留一法：如果留下的是正例，训练样本中反例的数目比正例多一个，所以留出的样本会被判断是反例；同理，留出的是反例，则会被判断成正例，所以错误率是 100% 。断是反例；同理，留出的是反例，则会被判断成正例，所以错误率是 100% 。 3.若学习器A 的F1值比学习器B高，试析A 的BEP值是否也比B高。 3.若学习器A 的F1值比学习器B高，试析A 的BEP值是否也比B高。 4.试述真正例率（TPR）、假正例率（FPR）与查准率（P）、查全率（R）之间的联系。 4.试述真正例率（TPR）、假正例率（FPR）与查准率（P）、查全率（R）之间的联系。查全率: 真实正例被预测为正例的比例查全率: 真实正例被预测为正例的比例真正例率: 真实正例被预测为正例的比例真正例率: 真实正例被预测为正例的比例显然查全率与真正例率是相等的。显然查全率与真正例率是相等的。查准率:预测为正例的实例中真实正例的比例查准率:预测为正例的实例中真实正例的比例假正例率: 真实反例被预测为正例的比例假正例率: 真实反例被预测为正例的比例两者并没有直接的数值关系。两者并没有直接的数值关系。