- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 绪论 (略)
第一章 绪论 (略)
第二章 模型评估与选择
第二章 模型评估与选择
1.数据集包含 1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训
1.数据集包含 1000个样本,其中500个正例,500个反例,将其划分为包含70%样本的训
练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。
练集和30%样本的测试集用于留出法评估,试估算共有多少种划分方式。
一个组合问题 ,从 500500 正反例 中分别选出 150150 正反例用于留出法评估 ,所 以可能取
一个组合问题 ,从 500500 正反例 中分别选出 150150 正反例用于留出法评估 ,所 以可能取
150
150 2
)2
( )
法应该是( 。
法应该是 500 。
500
2.数据集包含100个样本,其中正反例各一半,假定学习算法所产生的模型是将新样本预测
2.数据集包含100个样本,其中正反例各一半,假定学习算法所产生的模型是将新样本预测
为训练样本数较多的类别 (训练样本数相同时进行随机猜测),试给出用 10 折 叉验证法
为训练样本数较多的类别 (训练样本数相同时进行随机猜测),试给出用 10 折 叉验证法
和留一法分别对错误率进行评估所得的结果。
和留一法分别对错误率进行评估所得的结果。
10 折交叉检验 :由于每次训练样本 中正反例数 目一样 ,所 以讲结果判断为正反例的概率也
10 折交叉检验 :由于每次训练样本 中正反例数 目一样 ,所 以讲结果判断为正反例的概率也
是一样的,所 以错误率的期望是 5050% 。
是一样的,所 以错误率的期望是 5050% 。
留一法 :如果留下的是正例 ,训练样本 中反例的数 目比正例多一个 ,所 以留出的样本会被判
留一法 :如果留下的是正例 ,训练样本 中反例的数 目比正例多一个 ,所 以留出的样本会被判
断是反例;同理 ,留出的是反例 ,则会被判断成正例 ,所 以错误率是 100% 。
断是反例;同理 ,留出的是反例 ,则会被判断成正例 ,所 以错误率是 100% 。
3.若学习器A 的F1值比学习器B高,试析A 的BEP值是否也比B高。
3.若学习器A 的F1值比学习器B高,试析A 的BEP值是否也比B高。
4.试述真正例率 (TPR)、假正例率 (FPR)与查准率 (P)、查全率 (R)之间的联系。
4.试述真正例率 (TPR)、假正例率 (FPR)与查准率 (P)、查全率 (R)之间的联系。
查全率: 真实正例被预测为正例的比例
查全率: 真实正例被预测为正例的比例
真正例率: 真实正例被预测为正例的比例
真正例率: 真实正例被预测为正例的比例
显然查全率与真正例率是相等的。
显然查全率与真正例率是相等的。
查准率:预测为正例的实例 中真实正例的比例
查准率:预测为正例的实例 中真实正例的比例
假正例率: 真实反例被预测为正例的比例
假正例率: 真实反例被预测为正例的比例
两者并没有直接的数值关系。
两者并没有直接的数值关系。
文档评论(0)