- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
;第六章机器学习;;机器学习基本概念;1.根据学习任务分类;(3)标注(Labeling)
通过输入一个观测序列(ObservationSequence)
输出对应的标注序列(LabelSequence)
输出的每一个值,都类似分类问题中的类别,这些值用向量的形式表示
标注任务应用比较广泛,例如分词、词性标注、关系抽取等
(4)排序学习(LearningToRank)
一组对象(Object)之间的有序关系,使对象基于某种准则按照顺序进行排列
准则包括对象之间的分值或者偏好等
主要应用与搜索引擎、文档检索、推荐系统等
(5)聚类(Clustering)
通过分析,将输入数据划分成若干个类簇(Cluster)的机器学习任务,同一类簇中的数据之间具有内在的关系。
聚类与分类的不同之处在于,聚类不是通过训练数据预先训练模型,而是直接使用算法划分输入数据
类簇是通过分析得到的,而不是训练数据中的标注
应用领域包括场景分割、医学影象分析、客户行为分析和分组等;2.根据学习范式分类;机器学习概述;3.按照学术流派分类;f?
图像识别
f?
围棋
f?
机器翻译
f? “你好!” ;;统计学习;例子:预测住房价格。我们使用一个数据集,该数据集包含纽约的住房价格。根据不同房屋尺寸所售出的价格,画出这个的数据集:;假设我们有以下几组样本,我们的房屋价格预测就是一个监督学习算法的工作方式;代价函数:
假设函数(也就是用来进行预测的函数),线性函数形式也已在上图中表示出来了。但问题是,诸如θ0和θ1之类这些θi我们通常称其为模型参数。那么我们如何选择这两个参数值θ0和θ1呢?选择不同的参数θ0和θ1我们会得到不同的假设函数。例如下图:;因此在线性回归中,我们要解决的是一个最小化问题。
我们选择的参数θ0和θ1决定了我们得到的直线相对于我们的训练集的准确程度,模型所预测的值与训练集中实际值之间的差距(下图中蓝线所指)就是建模误差(modelingerror)。;k均值聚类(k-MeansCluster)
学习范式:非监督学习
学习任务:聚类
通过迭代,将样本分到k个类中,使每个样本与所属类的中心或均值最近
需要选择恰当的k值
可能收敛到局部??优,导致违反直觉的错误
在大数据集上很容易部署
可用于市场划分、机器视觉等,也可作为其他算法的预处理步骤
;贷款金额;支持向量机(SupportVectorMachine)
学习范式:通常为监督学习
学习任务:主要为分类
定义在特征空间上的间隔最大的线性分类器
通过在数据群中选取支持向量来确定及调整超平面的位置,使超平面与最近的支持向量的间隔尽可能大
可以通过软间隔最大化、核函数等方法扩大适用范围
可用于文本分类、手写识别等
朴素贝叶斯分类器(NaiveBayesClassification)
学习范式:监督学习
学习任务:分类
基于贝叶斯定理与特征条件独立假设,学习输入输出的联合概率分布
例如在信用评估中,我们可以统计信用良好人群的特征,然后根据概率分布估计新客户信用良好的概率等
可应用于文本分类、信用评估等;隐马尔可夫模型(HiddenMarkovmodel)
学习范式:监督学习
学习任务:标注
关于时序的概率模型
由隐藏的马尔可夫链随机生成不可观测的随机状态序列,再由各个状态生成观测值而产生观测序列
模型可以根据给出的观测变量序列,估计对应的隐藏变量序列,并对未来的观测变量做预测
可用于语音识别、气象预测等
主成分分析(PrincipleComponentsAnalysis)
学习范式:非监督学习
常用的降维方法
先对给定数据进行规范化,使每个变量的平均值为0、方差为1
之后使用正交变换将数据转换成线性无关的新变量
通过少数主成分表示原始数据,可以达到降维的目的
主要用于发现数据变量之间的关系,降低分析难度;提升算法(Boosting)
学习范式:集成学习
学习任务:通常应为分类
通过改变训练样本的权重,训练多个弱学习器
将这些弱学习器集成起来,形成一个强学习器
具有较高的检测速率,不容易出现过拟合现象
需要较多的训练数据与训练时间
常用的集成算法有AdaBoost、XGBoost等;;深度学习与感知器(Perceptron)
深度学习模型通常由多种结构组合而成
深度学习模型可用于多种学习范式及多种学习任务
感知器是联结学习的早期模型之一,也是现在深度神经网络的基础
感知器能构造出线性的决策边界,来表示部分逻辑函数
将多个感知器连接并层叠起来,表征能力就会极大提高
;深度学习;全连接神经网络
(FullyConnectedNeu
文档评论(0)