机器学习-机器学习基本方法.pdfVIP

下载本文档

301
0
约1.16万字
约 55页
2022-07-02 发布于湖南
举报
版权申诉

机器学习-机器学习基本方法.pdf

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

机器学习机器学习第2章机器学习基本方法第2章机器学习基本方法章节介绍 • 本章主要介绍机器学习地基础知识,包括常用概念与统计分析基础知识 • 目地是理解掌握机器学习地主要原理 • 主要涵盖以下内容,统计分析,高维数据降维,特征工程,模型训练等章节结构 • 统计分析 • 统计基础 • 常见概率分布 • 参数估计 • 假设检验 • 线性回归 • Logistics回归 • 判别分析 • 非线性模型 • 高维数据降维 • 主成分分析 • 线性判别分析章节结构 • 特征工程 • 特征构造 • 特征选择 • 特征提取 • 模型训练 • 模型训练常见术语 • 训练数据收集 • 可视化分析 • 可视化分析地作用 • 可视化分析方法 • 可视化分析常用工具 • 常见地可视化图表统计分析 • 统计学是研究如何搜集资料,整理资料与进行量化分析,推断地一门科学,在科学计算,工业与金融等领域有着重要应用,统计分析是机器学习地基本方法 • 与统计分析有关地基本概念有以下几个 • 总体:根据定目地确定地所要研究事物地全体 • 样本:从总体中随机抽取地若干个体构成地集合 • 推断:以样本所包含地信息为基础对总体地某些特征作出判断,预测与估计 • 推断可靠性:对推断结果从概率上地确认,作为决策地重要依据 • 统计分析分为描述性统计与推断性统计,描述性统计是通过对样本进行整理 ,分析并就数据地分布情况获取有意义地信息,从而得到结论。推断统计又分为参数估计与假设检验,参数估计是对样本整体中某个数值进行估计,如推断总体平均数等,而假设检验是通过对所做地推断验证,从而进择行才方案统计基础议程 • 输入空间,特征空间与输出空间 • 向量空间模型包括输入空间,特征空间与输出空间,输入与输出所有地可能取值地集合分别称为输入空间与输出空间,每个具体地输入是一个实例, 通常由特征向量表示,所有特征向量存在地空间成为特征空间。输入变量用一般用xx表示,输出变量用y表示 • 联合概率分布 • 在监督式学习中是假设输入与输出地变量x与y遵循联合概率分布,表示样本数据存在一定地规律,可以假定这个联合概率分布地存在,但是其分布是未知地,x与y具有联合概率分布地假设就是监督学习关于数据地基本假设 • 假设空间 • 机器学习模型是由输入空间到输出空间地映射地集合,这个集合就是假设空间。假设空间确定了预测地范围。监督学习地目地是学习一个由输入到输出地映射规律,这个映射规律就是模型。监督学习地模型包括板率模型,非统计基础议程 • 均值,标准差,方差,协方差 • 均值描述地是样本集合地平均值 • 标准差描述是样本集合地各个样本点到均值地距离分布,描述地是样本集地分散程度 • 在机器学习中地方差就是估计值与其期望值地统计方差。如果进行多次重复验证地过程,就会发现模型在训练集上地表现并不固定,会出现波动,这些波动越大,它地方差就越大 • 协方差主要用来度量两个随机变量关系,如果结果为正值,则说明两者是正有关地;结果为负值,说明两者是负有关地;如果为0,就是统计上地相互独立 • 超参数 • 超参数是机器学习算法地调优参数,常应用于估计模型参数地过程中,由用户直接指定,可以使用启发式方法来设置,并能依据给定地预测问题而调整统计基础议程 • 损失函数与风险函数 • 损失函数是关于模型计算结果与样本实际目地结果地非负实值函数,记作用它来解释模型在每个样本实例上地误差损失函数地值越小,说明预测值与实际值越接近, 即模型地拟合效果越好 • 损失函数主要包括以下几种: 0-1损失函数,平方损失函数,绝对损失函数,对数损失函数 • 训练误差统计基础议程 • 正则化与交叉验证 • L0正则化 • L1正则化 • L2正则化 • HoldOut检验 • 简单交叉检验 • K折交叉检验 • 留一交叉检验常见概率分布议程 • 均匀分布 • 正态分布 • 分布 • 卡方分布 • F-分布 • 二项分布 • 0-1分布 • Poisson分布参数估计议程 • 参数估计是用样本统计量去估计总体地参数, 即根据样本数据选择统计量去推断总体地分布或数字特征

您可能关注的文档

文档评论（0）

王小磊 + 关注: 实名认证

文档贡献者

临床内科执业资格证持证人

该用户很懒，什么也没介绍

咨询Ta 进入空间

领域认证该用户于2023年03月29日上传了临床内科执业资格证

1亿VIP精品文档

更多 >

机器学习-机器学习基本方法.pdfVIP