10种机器学习算法介绍(68页).pdf

  1. 1、本文档共69页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

机器学习算法介绍

基本概念分类

监督式学习分类算法

多轮学习以达到目的:实现回归或分类适用因变量为离散变量

非监督式学习回归算法

特定方法实现聚类。(由于目的性不明,适用因变量为连续变量

所以一般没有多轮)

聚类和分类的差别

强化学习

聚类:无限种类别可能

不断学习,永无止境

分类:有限种类别可能

监督式学习

工作机制

这个算法由一个目标变量或结果变量(或因变量)组成。

此变量由已知的一系列预示变量(自变量)预测而来。

利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。

这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。

例子

线性回归,决策树,SVM,K–近邻算法,逻辑回归等

非监督式学习

工作机制

没有任何目标变量或结果变量要预测或估计。

用在不同的组内聚类分析。

例子

关联算法,K–均值算法

强化学习

工作机制

训练机器进行决策。

机器被放在一个能让它通过反复试错来训练自己的环境中。

机器从过去的经验中进行学习,并且尝试利用了解最透彻的知识作出精确的判断。

例子

马尔可夫决策过程

十大机器学习算法

1、线性回归

2、逻辑回归

3、决策树

4、SVM

5、朴素贝叶斯

6、k-Means算法

7、kNN算法

8、Apriori算法

9、最大期望算法(EM)

10、PageRank

监督式学习与非监督式学习的差别

监督式学习方法,要求:

事先明确知道各个类别的信息

所有待分类项都有一个类别与之对应

如果不能满足上述两个条件(例如有海量数据),则需适用聚类算法,即非监督式学习。

监督式学习非监督式学习

线性回归

逻辑回归K-means

决策树

Apriori

朴素贝叶斯EM

SVMPageRank

KNN

线性回归

适用场景

根据连续变量估计实际数值(房价、呼叫次数、总销售额等)。

原理

可通过拟合最佳直线来建立自变量和因变量的关系。拟合结果是条直线Y=a*X+b:其中Y是因变量,a

是斜率,x是自变量,b是截距

最佳直线叫做回归线。系数a和b通过最小二乘法获得。

Python代码

from

sklearn

import

linear_model

x_train=input_variables_values_training_datasets

y_train=target_variables_values_training_datasets

x_test=input_variables_values_test_datasets

linear

=

linear_model.LinearRegressi

文档评论(0)

动点策划 + 关注
官方认证
服务提供商

动点策划通过提供各行各业经典策划案例,策划思路,行业最新动态,旨在做好你的助手,为你正在谋划的事情提供框架思路或创作灵感。

认证主体迈通人才资源咨询(广东)有 限公司
IP属地广东
统一社会信用代码/组织机构代码
914400007224748147

1亿VIP精品文档

相关文档