- 1
- 0
- 约2.75万字
- 约 39页
- 2026-06-16 发布于江西
- 举报
设计与开发手册
第1章基础理论
1.1机器学习核心概念解析
机器学习(MachineLearning,ML)被定义为让计算机系统通过经验而非显式编程来解决问题的过程,其核心在于从数据中自动发现规律并构建模型。在定义中,必须明确区分“监督学习”(有标签数据,如图像分类)、“无监督学习”(无标签数据,如聚类分析)和“半监督学习”(混合数据场景),这是算法选择的基础。核心算法如线性回归通过最小化平方误差损失函数来拟合直线,其数学表达为$y=\beta_0+\beta_1x+\epsilon$,其中$\epsilon$代表残差,目标是使所有样本的预测值与实际值的差异最小化。
随机森林算法利用“bagging(BootstrapAggregating)策略,通过有放回地从训练集中抽取样本构建多个决策树,最后通过投票或平均方式融合结果,有效解决过拟合问题,其准确率通常在98%以上。支持向量机(SVM)通过寻找一个最大化间隔的超平面来分类数据,其关键概念是“支持向量”(SupportVector),即距离超平面最近的样本点,这些点决定了分类边界的最优位置。梯度下降法通过计算损失函数对参数的导数(梯度),沿负梯度方向迭代更新参数值,从而优化模型,例如在训练神经网络时,使用Adam优化器能更稳定地收敛于最优解。
模型评估指标如准确率(Accur
原创力文档

文档评论(0)