机器学习与深度学习指南_1.docxVIP

  • 2
  • 0
  • 约3.02万字
  • 约 42页
  • 2026-06-06 发布于江西
  • 举报

机器学习与深度学习指南

第一章机器学习基础概念与数学原理

第一节监督学习与非监督学习辨析

监督学习是指利用带有标签的数据集来训练模型,使得模型能够根据输入数据自动预测输出标签的过程。其核心在于“输入-输出”的配对关系,模型通过学习映射函数$f(x)\approxy$来最小化预测值与真实值之间的误差。例如,在医疗诊断中,医生提供包含“患者年龄”、“血压”、“血糖”等特征以及对应的“疾病类型”标签的数据库,机器学习算法通过分析这些配对数据,自动学习出“高血压”与“高血糖”之间的关联,从而对新患者的数据进行预测。非监督学习则是指在没有预先提供标签的情况下,让模型自行发现数据内部的结构、模式或簇的分布。它不关注输出标签,而是旨在无监督地组织数据,通常用于数据探索、聚类或降维。例如,在电商分析中,商家收集了用户的购物历史数据(如购买的商品类别、时间、金额),但不知道用户具体喜欢买什么,机器学习算法则通过聚类算法将这些用户自动划分为“价格敏感型”、“高频浏览型”等无标签群体,以便后续进行用户画像构建。

两者在数据依赖性和学习目标上存在本质区别:监督学习高度依赖高质量的标注数据,且目标是预测未知的标签;而非监督学习不依赖标签,仅依赖数据的内在分布,目标是发现未知的结构。在实际应用中,如图像分类任务,若目标为识别猫狗图则需监督学习;若目标为将杂乱的人脸图像自动分组为不同种

文档评论(0)

1亿VIP精品文档

相关文档