《人工智能》第6章机器学习.pptx

下载文档

4
0
约2.18千字
约 31页
2025-04-29 发布于浙江
举报
版权申诉
保障服务

《人工智能》第6章机器学习.pptx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

;第六章机器学习;;机器学习基本概念;1.根据学习任务分类;（3）标注（Labeling）

通过输入一个观测序列（ObservationSequence）

输出对应的标注序列（LabelSequence）

输出的每一个值，都类似分类问题中的类别，这些值用向量的形式表示

标注任务应用比较广泛，例如分词、词性标注、关系抽取等

（4）排序学习（LearningToRank）

一组对象（Object）之间的有序关系，使对象基于某种准则按照顺序进行排列

准则包括对象之间的分值或者偏好等

主要应用与搜索引擎、文档检索、推荐系统等

（5）聚类（Clustering）

通过分析，将输入数据划分成若干个类簇（Cluster）的机器学习任务，同一类簇中的数据之间具有内在的关系。

聚类与分类的不同之处在于，聚类不是通过训练数据预先训练模型，而是直接使用算法划分输入数据

类簇是通过分析得到的，而不是训练数据中的标注

应用领域包括场景分割、医学影象分析、客户行为分析和分组等;2.根据学习范式分类;机器学习概述;3.按照学术流派分类;f?

图像识别

围棋

机器翻译

f? “你好！” ;;统计学习;例子：预测住房价格。我们使用一个数据集，该数据集包含纽约的住房价格。根据不同房屋尺寸所售出的价格，画出这个的数据集：;假设我们有以下几组样本，我们的房屋价格预测就是一个监督学习算法的工作方式;代价函数：

假设函数（也就是用来进行预测的函数），线性函数形式也已在上图中表示出来了。但问题是，诸如θ0和θ1之类这些θi我们通常称其为模型参数。那么我们如何选择这两个参数值θ0和θ1呢？选择不同的参数θ0和θ1我们会得到不同的假设函数。例如下图：;因此在线性回归中，我们要解决的是一个最小化问题。

我们选择的参数θ0和θ1决定了我们得到的直线相对于我们的训练集的准确程度，模型所预测的值与训练集中实际值之间的差距（下图中蓝线所指）就是建模误差（modelingerror）。;k均值聚类（k-MeansCluster）

学习范式：非监督学习

学习任务：聚类

通过迭代，将样本分到k个类中，使每个样本与所属类的中心或均值最近

需要选择恰当的k值

可能收敛到局部??优，导致违反直觉的错误

在大数据集上很容易部署

可用于市场划分、机器视觉等，也可作为其他算法的预处理步骤

;贷款金额;支持向量机（SupportVectorMachine）

学习范式：通常为监督学习

学习任务：主要为分类

定义在特征空间上的间隔最大的线性分类器

通过在数据群中选取支持向量来确定及调整超平面的位置，使超平面与最近的支持向量的间隔尽可能大

可以通过软间隔最大化、核函数等方法扩大适用范围

可用于文本分类、手写识别等

朴素贝叶斯分类器（NaiveBayesClassification）

学习范式：监督学习

学习任务：分类

基于贝叶斯定理与特征条件独立假设，学习输入输出的联合概率分布

例如在信用评估中，我们可以统计信用良好人群的特征，然后根据概率分布估计新客户信用良好的概率等

可应用于文本分类、信用评估等;隐马尔可夫模型（HiddenMarkovmodel）

学习范式：监督学习

学习任务：标注

关于时序的概率模型

由隐藏的马尔可夫链随机生成不可观测的随机状态序列，再由各个状态生成观测值而产生观测序列

模型可以根据给出的观测变量序列，估计对应的隐藏变量序列，并对未来的观测变量做预测

可用于语音识别、气象预测等

主成分分析（PrincipleComponentsAnalysis）

学习范式：非监督学习

常用的降维方法

先对给定数据进行规范化，使每个变量的平均值为0、方差为1

之后使用正交变换将数据转换成线性无关的新变量

通过少数主成分表示原始数据，可以达到降维的目的

主要用于发现数据变量之间的关系，降低分析难度;提升算法（Boosting）

学习范式：集成学习

学习任务：通常应为分类

通过改变训练样本的权重，训练多个弱学习器

将这些弱学习器集成起来，形成一个强学习器

具有较高的检测速率，不容易出现过拟合现象

需要较多的训练数据与训练时间

常用的集成算法有AdaBoost、XGBoost等;;深度学习与感知器（Perceptron）

深度学习模型通常由多种结构组合而成

深度学习模型可用于多种学习范式及多种学习任务

感知器是联结学习的早期模型之一，也是现在深度神经网络的基础

感知器能构造出线性的决策边界，来表示部分逻辑函数

将多个感知器连接并层叠起来，表征能力就会极大提高

;深度学习;全连接神经网络

（FullyConnectedNeu

您可能关注的文档

文档评论（0）

autohhh + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

《人工智能》第6章机器学习.pptx