教材配套教学——统计技术.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教材配套教学——统计技术

清华大学出版社 第7章 统计技术 之一 回归分析 本章目标 * 第*页,共25页 回归分析 掌握线性回归分析方法 了解非线性回归 了解树回归 贝叶斯分析 掌握贝叶斯分析方法 掌握使用Weka建立贝叶斯分类器的方法 聚类技术 了解分层聚类技术——凝聚聚类和Cobweb聚类 了解模型聚类技术E——M算法 了解数据挖掘中的统计技术与机器学习技术 7.1 回归分析 回归分析(Regression Analysis) 一种统计分析方法 用来确定两个或两个以上变量之间的定量的依赖关系,并建立一个数学方程作为数学模型,来概化一组数值数据,进而进行数值数据的估值和预测,应用非常广泛。 一元回归分析和多元回归分析 线性回归分析和非线性回归分析 * 第*页,共25页 7.1.1线性回归分析 其中 是自变量, 是因变量 和c是常量。 * 第*页,共25页 式7.1 线性回归方程的格式 1、简单线性回归(Simple Linear Regression) 只有一个自变量作为因变量的预测。 典型的斜截式(Slope-Intercept Form)方程。 * 第*页,共25页 式7.2 简单线性回归格式 y = ax + c 其中 X——自变量,y——因变量,a和c——常量; 方程的图形是斜率为a,y轴截距为c的一条直线。 常量a和c的确定,是建立回归方程的重要工作,称为参数估计(Parametric?Estimating)。 常用的计算a和b的统计学方法是最小二乘法(Least-Squares Criterion)。 最小二乘法 又称最小平方法。 通过使得因变量预测值与实际值之间的误差的平方和(方差)最小,而得出a和c的最优解。 【例7.1】 给出一组x,y值,如表7.1所示。将x作为自变量,y作为因变量,应用最小二乘法计算a和c的值,建立简单回归方程。 使用MS Excel建立线性回归方程 x y 1 3 4 7 2 6 3 8 * 第*页,共25页 表7.1 一组x,y值 图7.1 表7.1中实例数据的的散点图和趋势线 使用最小二乘法 要使得y的计算值与实际值之间的方差(误差平方和)(式7.3)最小。 分别对a和c求偏导,再使两个偏导数为0(式 7.4/5)。 * 第*页,共25页 (式7.3) 偏导计算结果—— 60a+20c-134=0,20a+8c-48=0 解方程组,得到—— a=1.4,b=2.5 (式7.4/5) 2、多元线性回归(Multivariable Linear Regression) 有两个或两个以上的自变量的线性回归 由多个自变量的最优组合共同来预测或估计因变量,结果更有效、更准确,更符合实际需要。 * 第*页,共25页 其中 是自变量, 是因变量 和c是常量, 又称回归系数 。 式7.1 多元线性回归方程 3、实验:使用Excel和Weka进行多元线性回归 使用Excel帮助文档中的LINEST函数指南实例数据集——“办公楼”数据集(表7.2)和Excel的LINEST函数建立多元线性回归方程,为某办公楼估值。 使用办公楼数据集和Weka软件的建立多元线性回归模型,为某办公楼估值。 * 第*页,共25页 表7.2 Excel帮助文档中的办公楼数据集 Space(x1) Offices(x2) Entrances(x3) Age(x4) Value 2310 2 2 20 142000 2333 2 2 12 144000 2356 3 1.5 33 151000 2379 3 2 43 150000 2402 2 3 53 139000 2425 4 2 23 169000 2448 2 1.5 99 126000 2471 2 2 34 142900 2494 3 3 23 163000 2517 4 4 55 169000 2540 2 3 22 149000 【例7.2】 使用办公楼数据集和Excel的LINEST函数,建立多元线性回归方程,在对模型进行评估后,估计出某个未知价值的办公楼的价值。 执行线性回归分析的步骤 (1)新建一个Excel的工作簿,使用第A1到E12放入表7.2中的数据; (2)LINEST函数的输出需要显示在至少n列的区域(回归变量的总数,本例中n=5)。用鼠标选中至少5列的空白区域,作为回归分析输出区域。 (3)执行回归,在Excel公

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档