- 1、本文档共69页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
机器学习算法介绍
基本概念分类
监督式学习分类算法
多轮学习以达到目的:实现回归或分类适用因变量为离散变量
非监督式学习回归算法
特定方法实现聚类。(由于目的性不明,适用因变量为连续变量
所以一般没有多轮)
聚类和分类的差别
强化学习
聚类:无限种类别可能
不断学习,永无止境
分类:有限种类别可能
监督式学习
工作机制
这个算法由一个目标变量或结果变量(或因变量)组成。
此变量由已知的一系列预示变量(自变量)预测而来。
利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。
这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。
例子
线性回归,决策树,SVM,K–近邻算法,逻辑回归等
非监督式学习
工作机制
没有任何目标变量或结果变量要预测或估计。
用在不同的组内聚类分析。
例子
关联算法,K–均值算法
强化学习
工作机制
训练机器进行决策。
机器被放在一个能让它通过反复试错来训练自己的环境中。
机器从过去的经验中进行学习,并且尝试利用了解最透彻的知识作出精确的判断。
例子
马尔可夫决策过程
十大机器学习算法
1、线性回归
2、逻辑回归
3、决策树
4、SVM
5、朴素贝叶斯
6、k-Means算法
7、kNN算法
8、Apriori算法
9、最大期望算法(EM)
10、PageRank
监督式学习与非监督式学习的差别
监督式学习方法,要求:
事先明确知道各个类别的信息
所有待分类项都有一个类别与之对应
如果不能满足上述两个条件(例如有海量数据),则需适用聚类算法,即非监督式学习。
监督式学习非监督式学习
线性回归
逻辑回归K-means
决策树
Apriori
朴素贝叶斯EM
SVMPageRank
KNN
线性回归
适用场景
根据连续变量估计实际数值(房价、呼叫次数、总销售额等)。
原理
可通过拟合最佳直线来建立自变量和因变量的关系。拟合结果是条直线Y=a*X+b:其中Y是因变量,a
是斜率,x是自变量,b是截距
最佳直线叫做回归线。系数a和b通过最小二乘法获得。
Python代码
from
sklearn
import
linear_model
x_train=input_variables_values_training_datasets
y_train=target_variables_values_training_datasets
x_test=input_variables_values_test_datasets
linear
=
linear_model.LinearRegressi
动点策划通过提供各行各业经典策划案例,策划思路,行业最新动态,旨在做好你的助手,为你正在谋划的事情提供框架思路或创作灵感。
文档评论(0)