完整翻译版《机器学习要领》.pdfVIP

下载本文档

71
0
约8.33万字
约 115页
2019-04-26 发布于广东
举报
版权申诉

完整翻译版《机器学习要领》.pdf

1、本文档共115页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器学习训练秘籍属于 deeplearning.ai 项目. © 2018 Andrew Ng. All Rights Reserved. Page 2 Machine Learning Yearning-Draft Andrew Ng 目录 1 机器学习为什么需要策略? 2 如何使用此书来帮助你的团队 3 先修知识与符号说明 4 规模驱动机器学习发展 5 开发集和测试集的定义 6 开发集和测试集应该服从同一分布 7 开发集和测试集应该有多大？? 8 使用单值评估指标进行优化 9 优化指标和满意度指标 10 通过开发集和度量指标加速迭代 11 何时修改开发集、测试集和指标 12 小结：建立开发集和测试集 13 快速构建并迭代你的第一个系统 14 误差分析：根据开发集样本评估想法 15 在误差分析时并行评估多个想法 16 清洗误标注的开发集和测试集样本 17 将大型开发集拆分为两个子集，专注其一 18 Eyeball 和 Blackbox 开发集该设置多大？ 19 小结：基础误差分析 20 偏差和方差：误差的两大来源 21 偏差和方差举例 22 与最优错误率比较 23 处理偏差和方差 24 偏差和方差间的权衡 25 减少可避免偏差的技术 Page 3 Machine Learning Yearning-Draft Andrew Ng 26 训练集误差分析 27 减少方差的技术 28 诊断偏差与方差：学习曲线 29 绘制训练误差曲线 30 解读学习曲线：高偏差 31 解读学习曲线：其它情况 32 绘制学习曲线 33 为何与人类表现水平进行对比 34 如何定义人类表现水平 35 超越人类表现水平 36 何时在不同的分布上训练与测试 37 如何决定是否使用你所有的数据 38 如何决定是否添加不一致的数据 39 给数据添加权重 40 从训练集泛化到开发集 41 辨别偏差、方差和数据不匹配误差 42 解决数据不匹配问题 43 人工合成数据 44 优化验证测试 45 优化验证测试的一般形式 46 强化学习举例 47 端到端学习的兴起 48 端到端学习的更多例子 49 端到端学习的优缺点 50 流水线组件的选择：数据可用性 51 流水线组件的选择：任务简单性 Page 4 Machine Learning Yearning-Draft Andrew Ng 52 直接学习更为丰富的输出 53 根据组件进行误差分析 54 误差归因至某个组件 55 误差归因的一般情况 56 组件误差分析与人类水平对比 57 发现有缺陷的机器学习流水线 58 建立超级英雄团队 - 让你的队友阅读这本书吧！ Page 5 Machine Learning Yearning-Draft Andrew Ng 1 机器学习为什么需要策略? 机器学机器学习习（（machine learning））已然成为无数重要应用的基石——如今，在网络搜索、垃圾邮件检测、语音识别以及产品推荐等领域，你都能够发现它的身影。如果你或你的团队正在研发一款机器学习相关应用，并期待取得较快进展，那么这本书将会是你的得力助手。案例：建立猫咪图片初创公司想象一下，你正在建立一家初创公司，这家公司的产品目标是为猫咪爱好者们提供数不尽的猫咪图片，你打算应用神神经经网网络络（（neural network））技术来构建一套计算机视觉系统，通过该系统来识别图片中的猫。但悲剧的是，目前你的学习算法准确度还不够好。为了改进这个猫咪检测器，你正面临着巨大的压力。可你该怎么做呢？你的团队给出了许多建议，例如： ● 获取更多的数据，即收集更多的猫咪图片 ● 收集更加多样化的训练数据集