第6章-分类和预测详解.pptVIP

  • 21
  • 0
  • 约5.72千字
  • 约 37页
  • 2016-03-13 发布于湖北
  • 举报
属性选择度量 数学符号 D为元组的训练集,元组属于m个不同的类Ci(i=1,,,m) Ci,D是D中的Ci类的元组集合 |Ci,D|和|D|分别表示各自的元组个数 线性回归 线性回归 线性回归 * 线性回归 研究因变量Y对自变量X的线性相依关系 参数需要估计以最好的拟合给定的数据 绝大多数情况“最好的拟合”是由最小二乘法(least squares method)实现, 其他的方法也有 用于预测(包括时间序列数据的预测),推断,假设检验和因果关系的建模 y x y = x + 1 X1 Y1 Y1’ * 线性回归 线性回归: 包含一个响应变量y 和一个预测变量x y = w0 + w1 x 最小二乘法: 估计与点列最适合的直线 对给定的数据,计算 将这两个值代入公式计算 得到一元线性回归公式 羽毛? =1 =0 下蛋=1 =0 下蛋=1 下蛋=0 =1 热血? * * * * * * I : the expected information needed to classify a given sample E (entropy) : expected information based on the partitioning into subsets by A * * * * * * * * * 分类和预测是两种数据分析形式,用于提取描述重要数据类或预测未来的数据趋

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档