2024人工智能机器学习导论.pptx

下载文档

0
0
约7.19千字
约 62页
2024-09-16 发布于山西
举报
版权申诉
保障服务

2024人工智能机器学习导论.pptx

1、本文档共62页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

人工智能导论机器学习概览

2016200690年代中期80年代初期60-70年代1956AI1950推理期知识期学习期机器学习从何而来

机器学习机器学习??机器学习（MachineLearning)

机器学习（MachineLearning)人类学习利用经验不断提高性能机器善于处理数据不断提高性能能否把“经验”变成数据，让机器可以“模仿”人类进行学习？机器学习：机器利用数据学习人类经验，不断提高性能的过程

机器学习（MachineLearning)经典定义：利用经验改善系统自身的性能[T.Mitchell教科书,1997]大数据?大价值智能数据分析机器学习经验 ? 数据随着该领域的发展，目前主要研究智能数据分析的理论和方法，并已成为智能数据分析技术的源泉之一大数据时代

机器学习（MachineLearning)机器学习是人工智能的核心研究领域（之一）今天的“人工智能热潮”正是由于机器学习、尤其深度学习技术取得了巨大进展基于大数据、大算力发挥出巨大威力机器学习深度学习人工智能

机器学习（MachineLearning)机器学习（MachineLearning）究竟是什么东东？看两个例子

一个例子：“文献筛选”出自[C.Brodleyetal.,AIMagazine2012]在“循证医学”（evidence-basedmedicine）中，针对特定的临床问题，先要对相关研究报告进行详尽评估查询PubMed以获取候选摘要人工找出值得全文审读的文章

“文献筛选”在一项关于婴儿和儿童残疾的研究中，美国Tufts医学中心筛选了约33,000篇摘要尽管Tufts医学中心的专家效率很高，对每篇摘要只需30秒钟，但该工作仍花费了250小时aportionofthe33,000abstracts每项新的研究都要重复这个麻烦的过程！需筛选的文章数在不断显著增长！

“文献筛选”为了降低昂贵的成本,Tufts医学中心引入了机器学习技术邀请专家阅读少量摘要，标记为“有关”或“无关”对是否“有关”进行预测分类模型人类专家只需阅读50篇摘要，系统的自动筛选精度就达到93%人类专家阅读1,000篇摘要，则系统的自动筛选精度度达到95%(人类专家以前需阅读33,000篇摘要才能获得此效果)

“画作鉴别”画作鉴别(paintingauthentication)：确定作品的真伪勃鲁盖尔（1525-1569）的作品？梵高（1853-1890）的作品？该工作对专业知识要求极高具有较高的绘画艺术修养掌握画家的特定绘画习惯只有少数专家花费很大精力才能完成分析工作！很难同时掌握不同时期、不同流派多位画家的绘画风格！

“画作鉴别”真迹+赝品待鉴定画作为了降低分析成本,机器学习技术被引入自动鉴定分类模型Kr?llerMüller美术馆与Cornell等大学的学者对82幅梵高真迹和6幅赝品进行分析，自动鉴别精度达95%[C.Johnsonetal.,2008]Dartmouth学院、巴黎高师的学者对8幅勃鲁盖尔真迹和5幅赝品进行分析，自动鉴别精度达100%[J.Hughesetal.,2009][J.Mairaletal.,2012](对用户要求低、准确高效、适用范围广)

典型的机器学习过程决策树，神经网络，支持向量机，Boosting，贝叶斯网，……模型训练数据色泽根蒂敲声好瓜青绿蜷缩浊响是乌黑蜷缩浊响是青绿硬挺清脆否乌黑稍蜷沉闷否类别标记（label）训练?=是新数据样本(浅白,蜷缩,浊响，?)类别标记未知使用学习算法（learningalgorithm）数据集：训练集、测试集示例(instance),样例(example),样本(sample)属性(attribute),特征(feature)属性值属性空间,样本空间,输入空间特征向量(featurevector)标记空间,输出空间分类,回归二分类,多分类监督学习(supervisedlearning)无监督学习(unsupervisedlearning)强化学习(reinforcementlearning)假设(hypothesis)真相(ground-truth)学习器(learner)

潜在意义训练集测试集特征标记横：输?（数据）-输出（标记）纵：历史（数据）-未来（数据）机器学习：面向未来的技术

学习的目标机器学习技术的根本目标就是模型具有泛化能力！“简单理解”：应对未见样本的预测能力未来不可知，依靠“合理假设”，利用历史数据估计模型泛化能力如：历史和未来数据来自于相同的分布（I.I.D.假设）

MachineL