机器学习应用快速入门-Error.PDFVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.1 机器学习与数据科学 1 1 第 1 章 机器学习应用快速入门 2 3 本章介绍机器学习的基础知识,包括常见主题与概念,这些内容将让你更容易理解相关逻辑 以及所讲主题。本章的目标是让你快速了解应用机器学习的详细步骤,掌握机器学习的主要原理。 4 本章涵盖以下内容: 介绍机器学习及其与数据科学的关系 讨论机器学习应用的基本步骤 5 讨论所处理数据的类型及其重要性 讨论收集数据以及对数据进行预处理的方法 使用机器学习理解数据 使用机器学习从数据获取有用信息并创建预测器 6 如果你已经熟悉机器学习,并急于开始编写代码,请跳过本章内容,直接阅读其他章节。然 而,如果你想重温这些内容或者搞清一些概念,强烈建议你认真学习本章。 7 1.1 机器学习与数据科学 如今,每个人都在谈论机器学习与数据科学。那么,机器学习究竟是什么?它与数据科学有 8 着怎样的联系呢?这两个术语常被混淆,因为它们经常使用相同的方法,有着明显的重叠。因此, 下面先区分这两个术语。 Josh Wills在Twitter上说: 9 “所谓的数据科学家指这样一类人,他们比软件工程师更懂统计学,比统计学家更 懂软件工程。” 10 更具体地说,数据科学包含从数据获取知识的整个过程,它综合运用统计学、计算机科学以 及其他领域的各种方法,帮助人们从数据中获取有用的知识与信息。事实上,数据科学是一个不 断反复的过程,包括数据的采集、清洗、分析、可视化和部署。 10 2 第 1 章 机器学习应用快速入门 另一方面,机器学习主要涉及数据科学的分析与建模阶段使用的通用算法与技术。对于机器 学习,Arthur Samuel在 1959年提出如下定义: “机器学习是指研究、设计与开发某些算法,让计算机获得学习的能力,而不需要 明确的编程。” 1.1.1 机器学习能够解决的问题 机器学习方法主要有如下三种: 监督学习 无监督学习  强化学习 给定一组样本输入X 与它们的结果Y ,监督学习的目标是产生一个通用的映射函数f ,使得每 一个输入都有对应的确定输出,即f : X Y 。 监督学习的一个应用例子是检测信用卡欺诈。学习算法会学习所有带有“正常”或“可疑” 标记(向量Y )的信用卡交易(矩阵X ),并最终产生一个决策模型(即f 函数),对未见过的交易 打标记(“正常”或“可疑”)。 相反,无监督学习算法所学的数据没有给定的结果标签Y ,它主要学习数据的结构,比如将 相似的输入数据归入某个聚类。因此,使用无监督学习能

文档评论(0)

jinzhuang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档