机器学习简介及实例作业（整理）.ppt

下载文档 降价啦

5
0
约4.18千字
约 23页
2020-10-21 发布于湖北
举报
版权申诉
保障服务

机器学习简介及实例作业（整理）.ppt

1、本文档共23页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

最新. 机器学习最新. * 什么是机器学习现今，机器学习已应用于多个领域，远超出大多数人的想象，下面就是假想的一日，其中很多场景都会碰到机器学习：假设你想起今天是某位朋友的生日，打算通过邮局给她邮寄一张生日贺卡。你打开浏览器搜索趣味卡片，搜索引擎显示了10个最相关的链接。你认为第二个链接最符合你的要求，点击了这个链接，搜索引擎将记录这次点击，并从中学习以优化下次搜索结果。然后，你检查电子邮件系统，此时垃圾邮件过滤器已经在后台自动过滤垃圾广告邮件，并将其放在垃圾箱内。接着你去商店购买这张生日卡片，并给你朋友的孩子挑选了一些尿布。结账时，收银员给了你一张1美元的优惠券，可以用于购买6罐装的啤酒。之所以你会得到这张优惠券，是因为款台收费软件基于以前的统计知识，认为买尿布的人往往也会买啤酒。然后你去邮局邮寄这张贺卡，手写识别软件识别出邮寄地址，并将贺卡发送给正确的邮车。当天你还去了贷款申请机构，查看自己是否能够申请贷款，办事员并不是直接给出结果，而是将你最近的金融活动信息输入计算机，由软件来判定你是否合格。最新. * 机器学习问题的几个实例机器学习问题到处都是，它们组成了日常使用的网络或桌面软件的核心或困难部分。苹果的Siri语音理解系统就是实例。以下，是几个真正有关机器学习到底是什么的的实例。 1、垃圾邮件检测：根据邮箱中的邮件，识别哪些是垃圾邮件，哪些不是。这样的模型，可以程序帮助归类垃圾邮件和非垃圾邮件。这个例子，我们应该都不陌生。 2、信用卡欺诈检测：根据用户一个月内的信用卡交易，识别哪些交易是该用户操作的，哪些不是。这样的决策模型，可以帮助程序退还那些欺诈交易。 3、数字识别：根据信封上手写的邮编，识别出每一个手写字符所代表的数字。这样的模型，可以帮助程序阅读和理解手写邮编，并根据地利位置分类信件。 4、语音识别：从一个用户的话语，确定用户提出的具体要求。这样的模型，可以帮助程序能够并尝试自动填充用户需求。带有Siri系统的iPhone就有这种功能。 5、人脸识别：根据相册中的众多数码照片，识别出那些包含某一个人的照片。这样的决策模型，可以帮助程序根据人脸管理照片。某些相机或软件，如iPhoto，就有这种功能。最新. * 什么是机器学习 1、林轩田：机器学习想做的事情，简单的说是要从资料中归纳出有用的规则。大数据说的是对大量的资料做分析，而人工智能说的是让机器看起来更聪明，两者都可以使用机器学习来做核心的工具。我们可以举 2012 年的 KDD-Cup 做例子，当年腾讯给的题目之一，是希望能从大量的线上广告资料中，找出“这个广告到底会不会被点击”的规则，如果机器能找出有用的规则，我们就会有更高“智能”的广告系统了。 2、Arthur?Samuel定义的机器学习(1959) “在不直接针对问题进行编程的情况下，赋予计算机学习能力的一个研究领域” 3、通俗讲，机器学习，两部分：首先是“机器”，这个机器一般其实指的就是“电脑”其次学习，这个学习也分为两部分，一是“数据”二是“算法”。其实和人是一样的，比如你父母教你认识“打棒球”这个体育运动的时候。肯定要给你看打棒球的图片或者视频，或者需要跟你描述这个运动，这些就是“数据”。至于说“算法”的话，描述本身就是一种算法。比如他们告诉你“拿着球棒，这样那样挥舞击球的就是棒球”。这样，在没有他们帮助的情况下，再给你一个新的打棒球的图片，你也认出这是打棒球4、简单讲就是，总结过去，预测未来。。最新. * 什么是机器学习最新. * 机器学习问题的类型关于机器学习，有一些常见的分类。以下这些分类，是我们在研究机器学习时碰到的大多问题都会参考的典型。分类：标记数据，也就是将它归入某一类，如垃圾/非垃圾（邮件）或欺诈/非欺诈（信用卡交易）。决策建模是为了标记新的未标记的数据项。这可以看做是辨别问题，为小组之间的差异性或相似性建模。回归：数据被标记以真实的值（如浮点数）而不是一个标签。简单易懂的例子如时序数据，如随着时间波动的股票价格。这个建模的的决策是为新的未预测的数据估计值。聚类：不标记数据，但是可根据相似性，以及其他的对数据中自然结构的衡量对数据进行分组。可以从以上十个例子清单中举出一例：根据人脸，而不是名字，来管理照片。这样，用户就不得不为分组命名，如Mac上的iPhoto。规则提取：数据被用作对提议规则（前提/结果，又名如果）进行提取的基础。这些规则，可能但不都是有指向的，意思是说，这些方法可以找出数据的属性之间在统计学上有说服力的关系，但不都是必要的涉及到需要预测的东西。有一个找出买啤酒还是买尿布之间关系的例子，（这是数据挖掘的民间条例，真实与否，都阐述了期望和机会）。最新. * 实例详解机器学习如何解决