《人工智能》第6章机器学习.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

;第六章机器学习;;机器学习基本概念;1.根据学习任务分类;(3)标注(Labeling)

通过输入一个观测序列(ObservationSequence)

输出对应的标注序列(LabelSequence)

输出的每一个值,都类似分类问题中的类别,这些值用向量的形式表示

标注任务应用比较广泛,例如分词、词性标注、关系抽取等

(4)排序学习(LearningToRank)

一组对象(Object)之间的有序关系,使对象基于某种准则按照顺序进行排列

准则包括对象之间的分值或者偏好等

主要应用与搜索引擎、文档检索、推荐系统等

(5)聚类(Clustering)

通过分析,将输入数据划分成若干个类簇(Cluster)的机器学习任务,同一类簇中的数据之间具有内在的关系。

聚类与分类的不同之处在于,聚类不是通过训练数据预先训练模型,而是直接使用算法划分输入数据

类簇是通过分析得到的,而不是训练数据中的标注

应用领域包括场景分割、医学影象分析、客户行为分析和分组等;2.根据学习范式分类;机器学习概述;3.按照学术流派分类;f?

图像识别

f?

围棋

f?

机器翻译

f? “你好!” ;;统计学习;例子:预测住房价格。我们使用一个数据集,该数据集包含纽约的住房价格。根据不同房屋尺寸所售出的价格,画出这个的数据集:;假设我们有以下几组样本,我们的房屋价格预测就是一个监督学习算法的工作方式;代价函数:

假设函数(也就是用来进行预测的函数),线性函数形式也已在上图中表示出来了。但问题是,诸如θ0和θ1之类这些θi我们通常称其为模型参数。那么我们如何选择这两个参数值θ0和θ1呢?选择不同的参数θ0和θ1我们会得到不同的假设函数。例如下图:;因此在线性回归中,我们要解决的是一个最小化问题。

我们选择的参数θ0和θ1决定了我们得到的直线相对于我们的训练集的准确程度,模型所预测的值与训练集中实际值之间的差距(下图中蓝线所指)就是建模误差(modelingerror)。;k均值聚类(k-MeansCluster)

学习范式:非监督学习

学习任务:聚类

通过迭代,将样本分到k个类中,使每个样本与所属类的中心或均值最近

需要选择恰当的k值

可能收敛到局部??优,导致违反直觉的错误

在大数据集上很容易部署

可用于市场划分、机器视觉等,也可作为其他算法的预处理步骤

;贷款金额;支持向量机(SupportVectorMachine)

学习范式:通常为监督学习

学习任务:主要为分类

定义在特征空间上的间隔最大的线性分类器

通过在数据群中选取支持向量来确定及调整超平面的位置,使超平面与最近的支持向量的间隔尽可能大

可以通过软间隔最大化、核函数等方法扩大适用范围

可用于文本分类、手写识别等

朴素贝叶斯分类器(NaiveBayesClassification)

学习范式:监督学习

学习任务:分类

基于贝叶斯定理与特征条件独立假设,学习输入输出的联合概率分布

例如在信用评估中,我们可以统计信用良好人群的特征,然后根据概率分布估计新客户信用良好的概率等

可应用于文本分类、信用评估等;隐马尔可夫模型(HiddenMarkovmodel)

学习范式:监督学习

学习任务:标注

关于时序的概率模型

由隐藏的马尔可夫链随机生成不可观测的随机状态序列,再由各个状态生成观测值而产生观测序列

模型可以根据给出的观测变量序列,估计对应的隐藏变量序列,并对未来的观测变量做预测

可用于语音识别、气象预测等

主成分分析(PrincipleComponentsAnalysis)

学习范式:非监督学习

常用的降维方法

先对给定数据进行规范化,使每个变量的平均值为0、方差为1

之后使用正交变换将数据转换成线性无关的新变量

通过少数主成分表示原始数据,可以达到降维的目的

主要用于发现数据变量之间的关系,降低分析难度;提升算法(Boosting)

学习范式:集成学习

学习任务:通常应为分类

通过改变训练样本的权重,训练多个弱学习器

将这些弱学习器集成起来,形成一个强学习器

具有较高的检测速率,不容易出现过拟合现象

需要较多的训练数据与训练时间

常用的集成算法有AdaBoost、XGBoost等;;深度学习与感知器(Perceptron)

深度学习模型通常由多种结构组合而成

深度学习模型可用于多种学习范式及多种学习任务

感知器是联结学习的早期模型之一,也是现在深度神经网络的基础

感知器能构造出线性的决策边界,来表示部分逻辑函数

将多个感知器连接并层叠起来,表征能力就会极大提高

;深度学习;全连接神经网络

(FullyConnectedNeu

文档评论(0)

autohhh + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档