- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
简单自学机器学习理论.docx
简单自学机器学习理论——引言 (Part I )本文章来自于阿里云云栖社区摘要:?本篇文章是机器学习理论三部曲中的第一部分,主要介绍学习机器学习的动机及基本理论知识,详细介绍机器学习所学习的问题、泛化误差以及学习问题是否可解的公式化表示,为初步研究机器学习的人员介绍了机器学习的基本处理过程。本文由北邮@爱可可-爱生活?老师推荐,阿里云云栖社区组织翻译。以下为译文机器学习理论——part I?前言(第II部分内容点此原文链接:/articles/67168?spm=5176.100239.blogcont67165.11.l83d1K;第III部分内容点此原文链接:/articles/67170?spm=5176.100239.blogcont67165.12.NKvvyR)动机大多数人在小的时候被魔术师以及魔术技巧所迷住,并想弄明白其中的奥秘。有些人会带着这份迷恋研究到更深处并学习魔术技巧,有些人会接受专业的训练,而其他人会继续平庸下去。我在年幼时也尝试过魔术技巧并沉迷于其中,然而后来学习的是另外一种魔术,称作计算机编程。编程确实酷似魔法,?和魔术一样,自学的现象在计算机编程世界占了上风。在过去的两年计算机开发者调查显示,超过一半的开发者是无师自通。我是在全职工作外学习这些计算机科学知识,当你已经工作后再尝试学习这些科目会是相当大的一个挑战。如今我们可以找到很多关于计算机科学的视频、文章、博客以及自定进度点播MOOC课程,这几乎涉及每个方面。其中很多写的很详细并解释得很清楚,而且可以自由访问。这些资源的存在使得自我学习过程更加全面,使工作/生活/学习的平衡更易于管理,不幸的是,这并不是学习编程的完全正确趋势。机器学习虽然在大二就开始自学机器学习,但当毕业后才意识到自己错过了许多基础知识。所以在同样情形下,我很高兴发现自己避免了这种情况的发生,但机器学习理论不像计算机科学世界那么容易驯服。虽然互联网上充满了学习资源,但理论方面的内容是不一样的。即使你可以找到书籍、讲义、甚至是全部的讲座,但大多数不能像一系列博客、短视频或者MOOC提供的灵活性。本文根据作者本身学习计算机科学的经验,给出了学习机器学习理论的这一系列文章,能够填补自主学习机器学习的理论与实践之间的差距,从而在征途上少一些艰辛。这个系列是为了谁?该系列意图是为了给机器学习理论方面提供简单的介绍,这将会对你是有利的,如果你是:????机器学习的从业者,并想深入了解详细过程;???机器学习的学生,尝试深入钻研机器学习理论并会喜欢一些宽松政策;如果你是机器学习的初学者,这可能不是你的最佳起点。使用实际教程开始会更好。当你掌握了机器学习实践的窍门后,如果你觉得有必要,可以回到这里。先决条件理论需要数学知识,机器学习的理论也不例外。但是由于这仅仅是为了简单的介绍,不会钻研太深的数学分析,将更加注重理论的直觉与足够的数学知识以为了保持严谨。大多数所需要的知识是:概率和随机变量,和微积分的基本知识。注意事项我仍然不是这个领域的专家,所以当你在这个系列中发现一些错误,请让我知道;这仅仅是一个简单介绍,如果你想真正理解该领域,在阅读该系列的同时也要努力工作;现在将机器学习问题快速公式化,以便建立起数学模型和框架形式化学习问题在这个系列中,将主要侧重有监督学习问题,数据集?,其中xi是特征向量,yi是标签,问题是给定xi,怎么得到yi的值。比如说xi是具体医学测量结果的特征向量,yi是病人是否为糖尿病,我们希望从给定的医学测试结果中诊断是否患有糖尿病。为了建立理论框架,重新梳理下已经知道的内容1 ?知道从众多人口中随机采样的数据集中的值(xi,yi),具体的例子中的数据集是从众多可能患者中随机采样得到? ?将该例子公式化,两个随机变量X和Y表示xi与yi,且概率分布分别为P(X)和P(Y);2 ?我们知道X与Y之间有一些规则,并希望任意的XY对都能符合该规则,定义该规则,正式将其称为空间,X是从输入空间X中取值得到,Y是从输出空间Y取值得到;3 ?特征值与标签之间有一定的联系,在某种程度上,特征值决定标签值,或者说Y的值是以X值为条件;正式地,将其称作条件概率P(Y|X),利用该概率可以得到其联合概率密度P(X|Y);根据这三点,可以定义统计模型,下图形式化的描述了模型的处理过程目标函数机器学习过程的根本任务是理解条件概率分布P(Y|X)的性质,为了避免麻烦,下面介绍一些简单的工作。可以使用均值和方差分解一个随机变量,均值是随机变量的中心,方差是测量随机变量在均值周围是如何分布。假设给定随机变量V和W,则其中E[V|W]是随机变量V给W的条件均值,该均值可以将V的值分解为两部分。任意W与V的相关联值(wi,vi)的关系可以定义如下ζ表示噪声变量ζ的值,称为噪声分量,同样地定义统计模型(x
您可能关注的文档
最近下载
- 换热站建设标准.doc VIP
- 研究生2024版新中特课件第二章新时代新征程中国共产党的使命任务.pptx VIP
- 推进供热企业标准化体系建设思考(工商管理毕业论文).doc VIP
- 2025入党积极分子发展对象培训考试题库100题含答案(完整版).docx VIP
- 调味品生产自动化一体化项目环境影响报告表.pdf VIP
- 2024年安徽省高考生物试卷(含答案详解).pdf
- 一年级语文上册新教材第八单元解读.docx
- 2025年国企竞聘笔考试试题库目简答题及答案指导.docx VIP
- DB11∕T 808-2020 市政基础设施工程资料管理规程.docx
- 《小学数学作业分层设计——五年级上册第三单元”小数除法“》.pdf VIP
原创力文档


文档评论(0)