第9讲-预测算法线性回归.pptx免费

上海育创网络科技有限公司 数据挖掘课程培训 讲师:阿贝 (北风网 ) 什么是预测 对客观事物未来发展的预料、估计、分析、判断和推测; 预测是基于这样的假设:通过以往经验或数据得到的规律或模式会在将来重现。 预测类别 基于经验和判断对预测对象作定性分析,一般不单纯依赖当前的系统数据。主要有集思广义法和德尔菲法。定性预测的准确程度主要取决于预测者的经验、理论、业务水平以及掌握的情况和分析判断能力。 根据准确、及时、系统、全面的调查统计资料和信息运用统计方法或其他数学模型对未来事件、现象发展的规模、水平、速度和比例等量的关系的测定。 定量预测类别 定量预测步骤 分析历史数据和信息,发现数据中的规律 通过一定的数学模型来描述这种规律 验证预测模型的准确度并对模型进行适当调整 预测误差 预测本身就意味着存在一定的不确定性,这些不确定性包括无法解释的原因以及不能预测的波动性。因此预测不可避免的会产生误差。 预测误差=不确定性+信息不完整+预测模型 不确定性:问题自身存在一定的不确定性,无法避免 信息不完整:需要获得更多的相关信息,难度较大 预测模型:选择更优的算法或模型 回归模型 回归模型是揭示随机变量之间的相互关系,进行数据分析的有力工具。回归模型利用已知数据通过确定含有待定系数的特定函数表达式展现自变量、因变量之间的联系; 根据函数表达式是线性或者非线性可以分为线性回归和非线性回归,根据函数表达式是一元(自变量)或者多元可以分为一元回归和多元回归。 回归模型要满足的条件 对应自变量的待预测变量(因变量)的取值有相同的方差 因变量取值的分布是相互独立的 对应于任意自变量的因变量的取值是正态分布 线性回归 最小平方法(最小二乘法) + + = + … 误差 因子分析 定量分析因子对目标变量产生的影响,即影响度。 影响度计算方式 定量数据:t值 定性数据:t值范围 因子分析 价格(y)=a+ + +d*引擎大小+e*马力+f*轴距 +g*宽度+h*长度+i*空车重量+j*燃料箱容量+h*油耗 产地 类型 因子分析获取最优解 使用所有因子进行回归分析 删除影响度最小的因子,进行回归分析 重复前两步,直到只剩一个因子 THANK YOU 上海育创网络科技有限公司

文档评论(0)

1亿VIP精品文档

相关文档