回归分析之一.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 模型进一步复杂化 增加第二个限制性的参数 两种可能遇到的情况 两组实验设计 简单回归分析 两组设计 对应于独立样本的t检验 我们用X表示一个观测到的数值里属于哪个组别: Xi = -1 if in group A, Xi = +1 if in group B 这种情况我们将在以后的课程中进行讨论 简单回归分析(其中X是连续变量) 例如垒球中的入场人数于平均击球次数 模型 所估计参数的代数解释 b0是当X为0是Y的预测值; b1是当X改变一个单位时,我们所预测到的Y的变化。 所估计参数的几何解释 截距与斜率 回归线 b0和b1的计算 原理:使误差最小 误差 误差表 误差的变异(MSE) 预测的标准误 模型比较 两参数模型 单参数模型 两模型比较的图示 关于β1的统计推断 等价的假设: H0: 保留模型 C HA: 接受模型A H0: η2=0 HA: η2>0 H0: β1 =0 HA: β1 ≠ 0 SSE与PRE SSR = SSE(C) – SSE(A) SSR = 1023.6 - 897.2 = 126.4 * * * * * * * * * * * * * 回归分析与实验设计之一 数据分析概述 2005年各省大型连锁专业店数目 数据来自国家统计局网站() 序号 省份 数量 序号 省份 数量 1 北京 2072 17 湖北 1825 2 天津 537 18 湖南 2533 3 河北 857 19 广东 5589 4 山西 398 20 广西 1660 5 内蒙古 1270 21 海南 282 6 辽宁 2240 22 重庆 4307 7 吉林 332 23 四川 1630 8 黑龙江 599 24 贵州 1009 9 上海 3392 25 云南 1585 10 江苏 3871 26 西藏 2 11 浙江 3770 27 陕西 180 12 安徽 3943 28 甘肃 1245 13 福建 1557 29 青海 38 14 江西 1831 30 宁夏 335 15 山东 4115 31 新疆 539 16 河南 698 数据分析概述 数据分析的一般思路是: DATA = MODEL + ERROR 因此,数据分析的基本目标就是尽可能减少误差,增加模型的代表性。 数据分析概述 简单模型与扩展模型 Model C (compact model) vs. Model A (Augmented model) 误差减少率(PRE) 模型与误差 一个最简单的模型: 从误差的角度思考, 我们可以说如果没有误差,Y所有的取值将等于模型(β) 误差中间包括除了模型之外的所有可能影响到Y的取值的因素。 误差 可能的误差的代表性度量 问题:如何选择? 对ERROR的定义 b0的值 对error的计数 众数 error绝对值的和 中数 error平方的和 平均数 Error加权平方的和 加权平均数 一个参数估计值的性质 无偏性(Unbiasedness) 2.有效性(Efficiency) 3. 一致性(Consistency) 平均值抽样分布的标准误: 中位数抽样分布的标准误: 比较:均值和中数作为模型参数 两者都是模型参数的无偏估计 都是一致的估计 均值的标准误小于中数的标准误,因此相对于中数,均值是一个更为有效的估计 关于误差的假设 误差正态分布 2. 误差独立 3. 误差变异齐性 4. 误差无偏 例1: 某年级学生历年来平均数学成绩为65,某教师采用新的教学方法,结果他班上15名学生的平均成绩为78。校长想知道这个班所代表的群体的平均成绩是否显著的不同于65。 具体成绩如下: Y=72, 52, 93, 86, 96, 46, 55, 74, 129, 61, 57, 115, 79, 89, 68 单组t检验的方法 H0: μ = 65 HA: μ≠ 65 从模型比较的角度思考 最简单的模型,没有参数: Yi = B0 + εi 其中B0是一个未经估计的任意常数 新的较为简单的模型, 有一个参数 Yi = β0 + εi 其中β0 是一个可以从数据中估计产生的参数. b0 (样本均值) 是我们对 β0的估计值, 因此: Yi = b0 +ei 假设 检验假设 (双侧) H0: β0 = B0 其中 β0 = μ 且 B0 = 65 HA: β0 ≠ B0 or H0: μ = 65 HA: μ≠ 65 模型 MODEL C: (简单模型)

文档评论(0)

书屋 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档