- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
2.1机器学习与深度学习?
物联网工程学院
基础概念机器学习是一种让计算机系统能够从数据中自动学习和改进的技术。它通过分析大量数据,识别出数据中的模式和规律,从而实现对新数据的预测或分类等任务。随着现代计算机性能的提高,对包含较多隐含层的大规模深层神经网络的训练开始变得可行,这种使用深层神经网络进行机器学习方法也被称为深度学习。
发展历程1950年阿兰·图灵1957年1959年1974年1995年2006年2016年2022年弗兰克·罗森布拉特阿瑟·萨缪尔保罗·韦博斯万普尼克杰弗里·辛顿DeepMindOpenAI
基础概念机器学习往往用于处理难以通过直接编程来解决的问题。机器学习算法是一种能够从训练数据中学习的算法。这里的“学习”是指通过对数据的处理,算法可以提高解决某类任务的性能。
基础概念机器学习监督学习非监督学习利用一组已知类别的样本来调整分类器的参数,使其达到所要求性能的过程。{在没有类别信息的情况下,通过对所研究对象的大量样本的数据分析来实现对样本的分类或发现数据中的内在结构。
分类与回归分类回归监督学习的预测任务主要可以分为分类(Classification)和回归(Regression)两类。
分类与回归分类分类是根据给定的输入数据(特征)将每个样本分配给预定义的类别或标签中的一个。分类的输出是离散的,表示样本所属的类别。分类的结果是预定义且离散的,例如识别猫和狗图片就是一个二分类任务,对图片的预测结果只有两种:猫或者狗。识别手写阿拉伯数字则是一个多分类任务,识别结果为0~9中的一个数字,即一共有十种分类结果。
分类与回归回归回归同样是机器学习中的一种任务,但其目标是根据已知的输入变量和输出变量(目标变量)的关系,预测未知输出变量的值。与分类不同,回归问题的输出是连续的数值,而不是离散的类别。例如,在房价预测中,算法需要根据房屋的面积、位置、房龄等特征预测房屋的售价;在股票价格预测中,算法需要根据历史交易数据预测未来某个时间点的股票价格。
评价指标评价指标是针对相同数据输入不同算法模型,或输入不同参数的同一种算法模型时,给出的关于算法或参数好坏的定量指标。在模型评估过程中,通常需要使用多种不同的指标进行评估,以全面反映模型的性能。这里我们以邮件分类为例,探讨几种常用评价指标的计算方式。
评价指标假设邮件分类的结果有两种:正常邮件和垃圾邮件。我们将正常邮件定义为正类(Positive),垃圾邮件定义为负类(Negative),则邮件分类可能出现以下四种情况:TP(真正类,TruePositive)——将正常邮件识别成了正类;FP(假正类,FalsePositive)——将垃圾邮件识别成了正类;TN(真负类,TrueNegative)——将垃圾邮件识别成了负类;FN(假负类,FalseNegative)——将正常邮件识别成了负类;不难看出,TP和TN是正确的分类,而FP和FN是错误的分类。实际情况正常邮件垃圾邮件预测结果正类TPFP负类FNTN
评价指标根据以上结果,我们可以定义分类准确率(Accuracy),即预测正确的结果占总样本的百分比,计算公式为:虽然准确率能够判断总的正确率,但是在样本不均衡的情况下,并不能作为很好的指标来衡量结果。比如在样本集中,正样本有90个,负样本有10个,样本是严重不均衡的。对于这种情况,我们只需要将全部样本预测为正样本,就能得到90%的准确率,但是完全没有意义。所以,我们需要寻找新的指标来评价模型的优劣。
评价指标精确率(Precision)是针对预测结果而言的指标,其含义是在被所有预测为正的样本中实际为正样本的概率,计算公式为:精确率反映了对正样本结果中的预测准确程度,也就是模型识别出的正类中,真正的正类所占的比例。在邮件分类的例子中,精确率反应了模型预测的正类中正常邮件的比例,这体现了模型给出的正类的准确程度,因此精确率又称查准率。
评价指标召回率(Recall)是针对原样本而言的指标,其含义是在实际为正的样本中被预测为正样本的概率,计算公式为:观察公式,真正类TP表示被模型找出的正类,假负类FN表示实际是正类但被模型误判为负类,所以TP+FN表示总体样本中实际正类的数量,也就是说召回率反应的是模型在全体样本中找出所有实际正类的能力,因此召回率又称查全率。
评价指标F1值(F1Score)是用于综合评估分类模型性能的指标,它结合了精确率和召回率。F1值是精确率和召回率的调和平均数,它可以用来衡量模型在保持精确率和召回率之间的平衡时的性能。F1值可以用以下公式计算:
原创力文档


文档评论(0)