Clemitine数据的基本分析.pptVIP

  • 40
  • 0
  • 约5.4千字
  • 约 47页
  • 2017-08-10 发布于河南
  • 举报
5.2.2 绘制散点图 数值型变量之间相关性的分析还可以通过散点图直观观察。 这里观察基本费用和年龄之间的相关性,可选择Graphs卡中的Plot节点并将其连接到数据流恰当的位置上。 5.3 变量分布探索 统计建模中常常要求变量服从正太分布,如果不能满足分布要求,应对变量进行适当的转换处理。 Clementine提供了非常直观的图形方式,大大缩短了变量分布探索的过程。可通过Output卡中的Transform节点实现该过程。 normal distribution ?? 正态分布 一种概率分布。正态分布是具有两个参数μ和σ^2的连续型随机变量的分布,第一参数μ是服从正态分布的随机变量的均值,第二个参数σ^2是此随机变量的方差,所以正态分布记作N(μ,σ^2 )。 服从正态分布的随机变量的概率规律为取与μ邻近的值的概率大 ,而取离μ越远的值的概率越小;σ越小,分布越集中在μ附近,σ越大,分布越分散。正态分布的密度函数的特点是:关于μ对称,在μ处达到最大值,在正(负)无穷远处取值为0,在μ±σ处有拐点。它的形状是中间高两边低 ,图像是一条位于x轴上方的钟形曲线。当μ=0,σ^2 =1时,称为标准正态分布,记为N(0,1)。μ维随机向量具有类似的概率规律时,称此随机

文档评论(0)

1亿VIP精品文档

相关文档