人工智能应用基础 课件 第7章 机器学习与分类.ppt

人工智能应用基础 课件 第7章 机器学习与分类.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 人工智能应用第七章 机器学习与分类 房价的预估 机器学习应用场景 项目实践 机器学习简介 住房是每个人都绕不开的热门话题。在互联网时代,旺盛的住房需求催生出一批二手房网络交易平台,如58同城、安居客、链家等。人们可以将自己闲置的房产挂在二手房交易平台出售,而如何准确预估自己待售的房产对于业主而言十分关键。如果房屋标价过低,虽然房屋能够很快出售,但会承受差价的损失;房屋标价过高无人问津,久而久之即便降价也无人过问,由此可见房价预估对售房者的重要性。 ◆预估房价 房价的预估 在机器学习中,上表中的已知数据样本称作训练集,用于训练房价预估模型。将训练集数据提供给机器学习算法,机器学习算法的任务是输出一个函数h,即假设函数。假设函数的作用是将房屋面积作为输入变量(x),并输出相应房屋的预估价格(y),它是一个引导从x到y的函数。设假设函数为h?(x),为便于表示及理解,案例中h?(x)为线性函数而非其他复杂形式的非线性函数。其表示形式为h?(x)=?0+?1x。 房价的预估 机器学习的概念 机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。它致力于如何通过计算的手段,利用经验来改善系统的自身性能。在计算机系统中,“经验”通常以“数据”的形式存在,因此,机器学习所研究的主要内容是关于在计算机上从数据中产生“模型”(model)的算法,即“学习算法”(learning algorithm)。有了学习算法,我们把经验数据提供给它,就能基于这些数据产生模型,在面对新的情况时(如一个没有剥开的橙子),模型会给我们提供相应的判断。如果说计算机科学是研究关于“算法”的学问,那么机器学习就是研究关于“学习算法”的学问。 机器学习简介 机器学习的要素 1、数据。越多越好。事实上,数据是深度学习复兴的核心,因为复杂的非线性模型比其他机器学习需要更多的数据。图片:例如你的手机图片,里面可能包含猫、狗、恐龙、高中同学聚会或者昨天的晚饭。 文本:邮件、新闻和微信聊天记录。 声音:有声书籍和电话记录。 2、结构数据:Jupyter notebook(里面有文本,图片和代码)、网页、租车单和电费表 3、模型。通常数据和我们最终想要的相差很远,例如我们想知道照片中的人是不是在高兴,所以我们需要把一千万像素变成一个高兴度的概率值。 4、损失函数。我们需要对比模型的输出和真实值之间的误差。 5、训练。通常一个模型里面有很多参数。我们通过最小化损失函数来学这些参数。 机器学习简介 机器学习的种类 监督学习(Supervised Learning,SL)是利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程,也称为监督训练或有教师学习。 无监督学习与监督学习相反,所处的学习环境都是非标签数据。本质上来讲,无监督学习就是“聚类”的近义词。 半监督学习(Semi-Supervised Learning,SSL)是机器学习领域研究的重点问题,是监督学习与无监督学习相结合的一种学习方法。 机器学习简介 垃圾电子邮件过滤 在互联网时代,人们的日常生活及工作办公过程中经常会使用电子邮件收发一些消息、文档或其他形式的附件。在享受电子邮件带给我们的便利时,也经常会收到一些垃圾邮件。当垃圾邮件充斥整个网络时,不但会减慢网络速度,有时用户在不知情或不经意间点击,无意中下载恶意软件、木马或病毒。由此可见垃圾电子邮件也属于网络犯罪的一种,拦截垃圾对网络安全至关重要。随着机器学习技术的成熟与发展,研究人员开始使用机器学习算法解决垃圾邮件过滤的问题。通过将邮件文本转化为向量,使用算法过滤和其他过滤统计相结合的方式使得垃圾邮件拦截率达到95%以上。 机器学习应用场景 推荐系统 随着数据的与日俱增,人们在海量的数据面前变得手足无措,为了解决这种信息过载的问题,推荐系统孕育而生,它是机器学习的一个重要应用。推荐系统是根据用户的各类信息,将用户感兴趣的产品推荐给用户的个性化信息推荐系统,常见于淘宝、京东等互联网购物平台。推荐系统使用机器学习算法通过研究用户的兴趣偏好进行个性化计算,由系统发现用户的兴趣点,从而引导用户发现自己的信息需求。优秀的推荐系统不仅能为用户提供良好的个性化服务,还能和用户之间建立密切的关系,让用户对推荐产生依赖。 机器学习应用场景 金融反欺诈 与传统金融不同,互联网金融业务基本发生在线上,往往几秒钟就完成审核、申请、放款等操作,面临前所未有的欺诈风险。黑白名单是最原始的反欺诈方式,例如银行的征信系统。但黑白名单更新慢、成本高,无法适应新型的互联网金融欺诈。为了应对新的形势,引入机器学习中的无监督学习,防止欺诈行为的发生,并及时阻止开户欺诈、欺诈交易、账号盗取等。根据用户间的相互关联构造网络图。欺诈者经常团伙作案

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档