网站大量收购独家精品文档,联系QQ:2885784924

袁卫统计学2013春资料.ppt

  1. 1、本文档共414页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 7.3.2 回归模型参数的估计 以某班女生的身高和体重资料为例: 先用笨办法观察,是不是“越高越重” ——尽管存在反例,但“越高越重”的趋势存在:每高1厘米,体重增0.415kg 以极小值(身高146,体重40)为起点,可得关係式: 体重=40+(身高-146) ×0.415 如身高156,体重的估计值是44.15 显然,这公式表现大略变化规律,还要考虑随机因素 回归模型 关键问题是确定a和b,即直线方程。 直线方程用来 概括散点的走向 * 内容回顾 算術平均数的数学性质 每个数据值与算術平均数有不同的差距,以“离差平方和”表示该差距之合体,相对最小 平均与变异是数据集合的本质 数据是表象,纷乱而多变,其本质是一般水平值,比较稳定,算術平均数最宜 * 最小平方法Least Squares Method A procedure for using sample data to find the estimated regression equation. We will find out the Least squares line. The phrase least squares is actually a shortened version of least sum of squared errors. An error is simply the difference between the observed y value and the predicted value y^. These errors are squared and added up for all of the points in the sample. The Least squares line minimized the sum of the squared errors. * Least Squares Method: geometry explain * Least Squares Method: mathematical solution 对a、b求偏导数,并令其为零 结果: * 7.3.3线性回归方程拟合优度的测定 判定係数coefficient of determination TSS=ESS+RSS * 度量拟合程度 拟合优度检验是指对样本回归线与样本观测值之间拟合程度的检验。度量拟合程度的指标是判定係数r2 。 基本思路:因变量Y的变异,能够被X的变异解释的比例越大,则OLS回归线对总体的解释程度就越好。 Xi X SRF Y 总平方和(TSS):实测的Y值围绕其均值的总变异: * 定义判定係数: 估计的Y值围绕其均值的总变异 未被解释的围绕回归线的Y值的变异 * 身高体重回归直线 806个点 34%的体重差异可以由身高解释 换言之: 身高在34%的程度上决定了体重 * r2的意义 coefficient of determination决定係数或判定係数:自变量决定了的r2因变量 拟合优度(Goodness of Fit)。度量拟合优度的统计量是可决係数r2 。 * 回归模型的解释能力举例 设身高与体重的均值分别为171cm,60kg。二者之间的关係是y = 0.6488x - 51.267,如果某人180,他“应该”重0.6488*180-51.267=65.5 今有某大隻佬,180cm,75.5kg,别人讥笑他太肥。他辩解:“因为我比一般人高,所以我也比一般人重” 如果认识不太细致,祇好接受此人的辩解 * 回归模型的解释能力举例 更进一步的认识:一般规律是,你越高,你就越重,当你高达180时,你应该重65.5,而你重达75.5,多出来的这10kg就是你超级肥的部分 75.5-60=(75.5-65.5)+(65.5-60) 实际值超出一般值的部分 =回归模型能够解释的超出部分+回归模型无法解释的部分 个体的总差异=规律性的差异+个体异常所形成的差异 * 估计标准误差Standard Error of Estimate Standard之一项解释:公认为权威或优秀的 Widely recognized as a model of authority or excellence 实际值与理论值之间存在误差,犹如个别值与平均值之间存在误差 回归方法的理论值是沿着相同的规律所形成的不同表现,其内涵规律本身没有發生变化 共同意义:随机变动与“恒常”之差距 测量方法相同:个别偏离一般的平均水平 计算时,自由度(Degree of Freedom)是n-2。理由:回归方程描述二维数据的变化规律,这二维数据各自的自由度是n-1,故计算估计标准误差时自由度为n-2 。 可

文档评论(0)

三哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档