3、机器学习,人工智能应用工程师-高级.docxVIP

3、机器学习,人工智能应用工程师-高级.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

这是考试大纲,我想按大纲开始学习,今天学习(三)机器学习,按照大纲,给我出一份学习材料。要求材料丰富,详细,严格按大纲的大标题,小标题出具。内容要尽量通俗易懂。最后有关键知识的练习题和解析。再最后额外加入扩展知识学习内容。

机器学习

机器学习概述

机器学习的概念

-**定义**:机器学习是让计算机从数据中自动学习规律,并用于预测或决策的技术。简单说,就是让机器像人类一样“通过经验改进行为”。

-**核心逻辑**:输入数据→训练模型→模型对新数据做出预测(如通过历史房价数据学习规律,预测新房价格)。

机器学习的特点

**数据驱动**:依赖大量数据(如训练图像识别模型需数万张标注图片);

**可优化性**:通过调整参数提升模型性能(如调整神经网络的层数);

3.**自动化**:无需人工编写规则,模型自动从数据中提取特征(如垃圾邮件识别模型自动学习垃圾邮件关键词)。

(三)机器学习系统中反馈的作用

-**定义**:反馈是模型预测结果与真实结果的差异,用于指导模型优化。

-**类比**:如学生做题后对答案(反馈),发现错误后调整解题思路(优化模型)。

-**技术实现**:通过损失函数(如均方误差MSE)计算反馈,再用梯度下降法更新模型参数。

(四)机器学习的任务流程

**数据收集**:获取相关数据(如收集用户点击行为数据);

**数据预处理**:清洗数据、划分训练集/测试集(如删除重复数据,80%数据用于训练,20%用于测试);

**模型选择**:选择合适算法(如预测房价用线性回归);

**模型训练**:用训练数据教模型学习规律;

**模型评估**:用测试数据验证模型准确性(如计算预测房价与实际价格的误差);

**模型应用**:用训练好的模型对新数据预测(如预测未上市房源价格)。

(五)机器学习与深度学习、人工智能的关系

概念

定义

关系

人工智能(AI)

让机器具备类人智能的技术总称

最大范畴,包含机器学习、深度学习

机器学习(ML)

AI的核心分支,通过数据学习规律

是AI的“实现手段”,深度学习是ML的子集

深度学习(DL)

基于多层神经网络的机器学习技术

属于ML,因层数多(如100层以上神经网络)得名,擅长处理图像、语言等复杂数据

(六)机器学习与数据挖掘、数据分析的区别

-**机器学习**:重点是“预测”和“决策”(如用历史销售数据预测未来销量);

-**数据挖掘**:重点是“发现数据中的隐藏模式”(如发现超市中啤酒与尿布常被一起购买);

-**数据分析**:重点是“描述数据现状”(如统计某产品各地区销量占比)。

核心概念解析

**数据集、特征和标签**:

-**数据集**:一组数据的集合(如10万张猫狗图片);

-**特征**:数据的属性(如图片的颜色、形状);

-**标签**:数据的类别或目标值(如图片是“猫”还是“狗”)。

**监督式学习和非监督式学习**:

-**监督学习**:数据有标签(如用标注好的“垃圾邮件”和“正常邮件”数据训练分类模型);

-**无监督学习**:数据无标签(如将用户按行为分成不同群体,无需提前知道群体定义)。

**强化学习和非强化学习**:

-**强化学习**:通过“行动-反馈”循环学习(如AlphaGo通过不断下棋优化策略,赢棋获奖励,输棋获惩罚);

-**非强化学习**:不依赖实时反馈(如监督学习、无监督学习)。

**训练集、验证集和测试集**:

-**训练集**:用于教模型学习(如80%数据);

-**验证集**:调整模型参数(如10%数据);

-**测试集**:评估最终模型(如10%数据)。

**决策树**:

-类似“if-else”规则树(如判断一个人是否适合贷款:收入5000?→是→负债30%?→是→批准贷款)。

**熵**:-衡量数据混乱程度(如一堆硬币中正反比例越均匀,熵越高;全是正面,熵越低),决策树用熵选择最优分裂条件。

神经网络

神经网络的演变历史

-**起源(1943年)**:麦卡洛克和皮茨提出神经元数学模型,模仿生物神经元的“激活-抑制”机制;

-**低谷(1969年)**:明斯基指出单层感知机无法解决异或问题,导致研究停滞;

-**复兴(1980年代)**:反向传播算法解决多层网络训练难题,推动BP神经网络发展;

-**爆发(2010年后)**:深度学习(多层神经网络)因算力突破(GPU)和大数据崛起,如AlexNet在ImageNet图像识别中超越人类。

麦卡洛克—皮茨网络的概念和特点

-**模型结构**:单个神经元接收多个输入,加权求和后与阈值比较,决定是否激活(输出1或0);

-**类比**:类似

文档评论(0)

灵犀 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档