- 1
- 0
- 约2.96万字
- 约 42页
- 2026-06-06 发布于江西
- 举报
机器学习与应用手册(执行版)
第1章机器学习基础理论
1.1(概率分布与期望概念)
在机器学习的数据挖掘与分析中,概率分布是描述数据样本随机性的核心数学工具,它定义了数据在未知状态下可能呈现的各种形态;例如,当我们使用高斯分布(正态分布)来描述图像像素的灰度值时,会发现大多数像素值会集中在图像中心的亮度附近,而边缘和背景像素的分布则呈现向两侧衰减的尾部特征,这种分布形态直接决定了数据集中样本的集中趋势与离散程度。期望(Expectation)则是概率分布的一个关键统计量,它代表了随机变量所有可能取值的加权平均,反映了数据集中样本的平均水平或中心位置;在实际应用中,例如计算一组客户年龄数据的期望值时,我们会发现其平均值约为35岁,这意味着在无限次的抽样中,该数据集中的数值会围绕35岁这个中心值呈现高概率聚集,从而为后续的特征工程提供了明确的均值基准。
概率分布的均值(Mean)与方差(Variance)是衡量数据集中样本分布形态的两个基本参数,均值决定了数据的中心位置,而方差则表征了数据点相对于均值的偏离程度;若某组销售数据的方差较大,说明销售人员业绩在不同区域间差异显著,这提示我们需要引入更复杂的策略来平衡不同区域的市场表现,否则简单的平均策略可能失效。在贝叶斯推断的框架下,概率分布不仅描述了数据的已知或观测状态,还包含了关于数据机制的先验知识,即假设数据服
您可能关注的文档
最近下载
- 2026年小学一二年级第一学期无纸笔化考核方案及测试题(一二年级语文数学).pdf
- 数智化供应链物流仓储实施入库作业教案.pdf VIP
- 2026高考政治黑龙江考试真题及答案.docx VIP
- 2026黑龙江高考地理真题试卷+参考答案.docx VIP
- 2025初中生物会考真题卷及答案.docx VIP
- 2026黑龙江高考数学真题试卷+参考答案.docx VIP
- 众智HGM9510发电机组并联控制器用户手册.pdf VIP
- 2026黑龙江高考语文真题试卷+参考答案.docx VIP
- 瓜果蔬菜、肉类食材食材加工方案及相关食材制度.docx VIP
- 医疗美容医疗机构基本标准(试行).docx VIP
原创力文档

文档评论(0)