机器学习第2章模型评估与选择.pptVIP

下载本文档

27
0
约小于1千字
约 18页
2020-02-02 发布于湖北
举报
版权申诉

机器学习第2章模型评估与选择.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Non-Deterministic Polynomial Complete Problems * 回归：预测连续值；分类：预测离散值 * 查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低；而查全率高时，查准率往往偏低。 P-R曲线：将样本按正例的可能性排序，依次预测所得P、R值对应的曲线。 * * * 给予均方误差的回归任务 * 第2章模型评估与选择主要内容经验误差与过拟合评估方法性能度量比较检验偏差与方差误差误差（error）：学习器实际预测输出与样本真实输出之间的差异训练集：训练误差（training error），（经验误差，empirical error）训练集的补集：泛化误差（generalization error）我们希望泛化误差小的学习器过拟合过拟合（overfitting）：训练过度使泛化能力下降欠拟合（underfitting）：未能学好训练样本的普遍规律过拟合是机器学习的关键障碍且不可避免！模型误差包含了数据误差，或者说模型信息中包含了噪声。学习器泛化评估——实验测试测试方法数学表达注意事项优缺点留出法（hold-out）分层采样（stratified sampling）重复试验取平均评估结果测试集小，评估结果方差较大训练集小，评估结果偏差较大交叉验证法（cross validation）留一法（Leave-One-Out，LOO）每次使用一个样本验证不受随机样本划分方式影响数据量大时计算量大自助法（bootstrapping）可重复采样/有放回采样数据集较小有用改变初始数据集的分布，引入偏差调参与最终模型性能度量任务需求——以二分类为例多混淆矩阵 ROC与AUC 代价敏感错误率与代价曲线比较检验 Non-Deterministic Polynomial Complete Problems * 回归：预测连续值；分类：预测离散值 * 查准率和查全率是一对矛盾的度量。一般来说，查准率高时，查全率往往偏低；而查全率高时，查准率往往偏低。 P-R曲线：将样本按正例的可能性排序，依次预测所得P、R值对应的曲线。 * * * 给予均方误差的回归任务 *

您可能关注的文档

文档评论（0）

kch + 关注: 实名认证

文档贡献者

教师资格证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2023年10月08日上传了教师资格证

1亿VIP精品文档

更多 >

机器学习第2章模型评估与选择.pptVIP