机器学习入门介绍.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
机器学习入门介绍

入门介绍 机器学习:是什么?机器学习是这样一种概念,即存在某些能够从数据集中获取有趣信息的通用算法,它的实现无需为单个特定问题量身定制无法迁移到其它情景的代码。与从头到尾敲代码不同,你要做的是把数据输入通用算法,然后它会基于这些数据建立其自身的逻辑。 拿分类算法举例,它能将数据归入不同组别。一种能够识别手书的数字的分类算法,亦可在不改任何一行代码的情况下用于垃圾邮件筛选。同一个算法,输入不同的训练数据,继而产生了不同的分类逻辑。 机器学习:怎么做?我们大致可将机器学习算法划入两类:监督式学习与非监督式学习。它们之间的差别很简单,但极其重要。 监督式学习 假设你是一个事业蒸蒸日上的地产中介,雇佣了一批刚入行的员工。此时你会面对这样一个问题:你可以单凭第一眼印象就对房屋的估值做到心中有谱,可是你的雇员缺乏这样的经验,对如何进行房屋估值心里没底。 为了协助雇员们的业务工作(也许同时为了给你自己放个假),你决定编写一个 app。这个小程序可以根据业务所在区房屋的大小、社区情况和同类房屋的售价等因素进行估值。 于是,你逐条录入三个月内的市内房屋售卖记录。对于每一笔交易,你记下卧室数量、房屋面积、社区环境的细节,当然也包括最重要的成交价: 这是我们的「训练数据」。 我们希望程序能使用这些训练数据来预估你的业务所在区中另一房屋的价格: 我们要使用训练数据来预测其它房屋的售价。 这就是监督式学习。在训练数据中,你已经知道每套房屋的售价,换句话说,你已经知道问题的答案,可以从答案反推出解决问题的逻辑。 为了完成你的 app,你向机器学习算法输入关于每套房屋的训练数据,算法则试图找出哪种数学机制可以满足这些数字间的推导计算。 这就好比,虽然知道数学考试中算式的答案,但所有的计算符号都消失不见了: 哦!一个调皮的学生把标准答案中算式的计算符号都抹去了! 在这种情况下,你能够复原算式的本来面目吗?你知道自己必须做点什么,将每一个算式中等号左边的数字进行某种运算,得到等号右边的答案。 在监督式学习中,你放手让计算机自己去找到数据的内部关系。一旦你理解特定问题集背后所运行的数学机制,就能回答任何其它同类型的问题! 监督式学习 假设你是一个事业蒸蒸日上的地产中介,雇佣了一批刚入行的员工。此时你会面对这样一个问题:你可以单凭第一眼印象就对房屋的估值做到心中有谱,可是你的雇员缺乏这样的经验,对如何进行房屋估值心里没底。 为了协助雇员们的业务工作(也许同时为了给你自己放个假),你决定编写一个 app。这个小程序可以根据业务所在区房屋的大小、社区情况和同类房屋的售价等因素进行估值。 于是,你逐条录入三个月内的市内房屋售卖记录。对于每一笔交易,你记下卧室数量、房屋面积、社区环境的细节,当然也包括最重要的成交价: 这是我们的「训练数据」。 我们希望程序能使用这些训练数据来预估你的业务所在区中另一房屋的价格: 我们要使用训练数据来预测其它房屋的售价。 这就是监督式学习。在训练数据中,你已经知道每套房屋的售价,换句话说,你已经知道问题的答案,可以从答案反推出解决问题的逻辑。 为了完成你的 app,你向机器学习算法输入关于每套房屋的训练数据,算法则试图找出哪种数学机制可以满足这些数字间的推导计算。 这就好比,虽然知道数学考试中算式的答案,但所有的计算符号都消失不见了: 哦!一个调皮的学生把标准答案中算式的计算符号都抹去了! 在这种情况下,你能够复原算式的本来面目吗?你知道自己必须做点什么,将每一个算式中等号左边的数字进行某种运算,得到等号右边的答案。 在监督式学习中,你放手让计算机自己去找到数据的内部关系。一旦你理解特定问题集背后所运行的数学机制,就能回答任何其它同类型的问题! 非监督式学习 回到原先地产中介的例子,在你无从得知每套房屋的售价时又当如何呢?实际上,即便你只知道每套房屋的大小和所在地等信息,仍然可以做一些很酷的事。这就是非监督式学习。 即使你没有打算预测未知变量的数值(如价格),仍可用机器学习来做一些有趣的事。 这有点像有人交给你一张纸,上面记着一组数字,然后告诉你:「我实在是不明白这些数字意味着什么。也许你能帮我找找这里面是否存在某种模式或组合等信息。祝你好运!」 那么你能拿这数据做些什么呢?首先,你可以找到一个在数据中自动确定不同细分市场的算法。也许你会发现,在本地高校附近社区购房的买家们实际上倾向于带有很多卧室的小房型,但是在郊区购房的买家们更青睐房屋总面积非常大的三居室。了解不同种类的客户可以指导你的市场工作。 另一件挺酷的事是你可以让程序自动查找离群点——迥然异于其余房屋的部分。这些在某些方面显得鹤立鸡群的房屋可能是巨型豪宅,考虑到其佣金回报率更高,此时你便可以考虑派遣手下最精英的销售人员集中处理那些区域的生意。 下文将集中介绍监督式学习,但这不意味

文档评论(0)

haihang2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档