第1章 机器学习概述.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1章机器学习概述;一、什么是机器学习;机器学习与人脑学习比较;数据集(Dataset):数据是进行机器学习的基础,所有数据的集合称为数据集。

样本(Sample):数据集中每条记录是关于一个事件或对象的描述,称为样本。

属性(Attribute)或特征(Feature):每个样本在某方面的表现或性质。

特征向量(FeatureVector):每个样本的特征对应的特征空间中的一个坐标向量。;学习(Learning)或者训练(Training):从数据中学得模型的过程,这个过程通过执行某个学习算法来完成。

训练数据(TrainingData):训练过程中使用的数据。

训练样本(TrainingSample):训练数据的每个样本。

训练集:训练样本组成的集合。

标记(Label):训练数据中可能会指出训练结果的信息。

;分类(Classification):使用计算机学习出的模型进行预测得到的是离散值。

二分类:只涉及两个类别的分类任务,其中一个类为正类(PositiveClass),另一个类为负类(NegativeClass),如是猫、不是猫两类。

多分类(Multi-classClassification):涉及多个类别的分类任务。

回归(Regression):使用计算机学习出的模型进行预测得到的是连续值。

;分类与回归的区别;

测试(Test):学习到模型后,使用其进行预测的过程。

泛化能力(Generalization):学习到的模型适用于新样本的能力。机器学习的目标是使得学习到的模型能很好得适用于新样本,而不是仅仅在训练样本上适用。;在建立预测模型的过程中将预测结果与训练数据的实际结果进行比较,不断的调整预测模型,直到模型的预测结果达到一个预期的准确率。

典型例子:分类和回归任务、决策树、贝叶斯模型、支持向量机、深度学习;数据并不被特别标识,计算机自行学习分析数据内部的规律、特征等,进而得出一定的结果(如内部结构、主要成分等)。

典型例子:聚类算法;半监督学习介于监督学习和非监督学习之间,输入数据部分被标识,部分没有被标识,没标识数据的数量常常远远大于有标识数据数量。

这种学习模型可以用来进行预测,但是模型首先需要学习数据的内在结构以便合理的组织数据来进行预测。;基于与环境的交互进行学习。通过尝试来发现各个动作产生的结果,对各个动作产生的结果进行反馈(奖励或惩罚)。在这种学习模式下,输入数据直接反馈到模型,模型必须作出调整。

;Scikit-Learn是基于Python语言的机器学习工具。它建立在NumPy,SciPy,Pandas和Matplotlib之上,里面的API的设计非常好,所有对象的接口简单,很适合新手上路。;谢谢

文档评论(0)

长情又很酷 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档