统计案例复习优秀课件 通用[文字可编辑].ppt

统计案例复习优秀课件 通用[文字可编辑].ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十三章 推理与证明 一节统计案例 课前自主学案 知识梳理 1. ( 1 ) ? ? ? ? ? 设 回 归 直 线 方 程 为 y = b x + a , 其 中 a , b 是 待 定 系 数 : 1 1 2 2 1 1 ( )( ) ? ( ) ? n n i i i i i i n n i i i i x x y y x y nxy b x x x nx a y bx ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 1 1 1 1 , n n i i i i x x y y n n ? ? ? ? ? ? 其中 叫做样本点中心 ( , ) x y ( 2 )相关系数:相关系数是因果统计学家皮尔逊提出的,对 于变量 y 与 x 的一组观测值,把 1 2 2 1 1 1 2 2 2 2 1 1 ( ) ( ) ( ) ( ) ( ) ( ) n i i i n n i i i i n i i i n n i i i i x x y y r x x y y x y n x y x n x y n y ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 叫做变量 y 与 x 之间的样本相关系数,简称相关系数,用它 来衡量两个变量之间的线性相关程度 . 当 r 为正时,变量 y 与 x 正 相关,当 r 为负时,变量 y 与 x 负相关 . ( 3 )相关系数的性质: |r|≤1 ,且 |r| 越接近 1 ,相关程度越大; 且 |r| 越接近 0 ,相关程度越小 . 具体的说,若 r ∈[ -1,-0.75 ] , 那 么负相关很强,若 r ∈[ 0.75,1 ] , 那么正相关很强;若 r ∈ ( - 0.75, - 0.3 ] , 或 r ∈[ 0.3,0.75), 那么相关性一般;若 r ∈[ - 0.25,0.25 ] , 那么相关性较弱 . 2. 残差分析 , ? ? ? ? ? ? ? ? b ? e e ) ( 1 , 2 , , ) ? ( 1 , 2 , , ) , , i i i i i i i i i i y b x a e a b e y i n y y y b x a i n e x y ? ? ? ? ? ? ? ? ? ? 中 , 叫 做 模 型 的 未 知 参 数 , 叫 做 随 机 误 差 。 我 们 可 以 建 立 回 归 方 程 y =x + a , y 是 b x + a 中 的 估 计 值 , 由 于 e = y - y , 所 以 是 的 估 计 量 , 这 样 , 对 于 样 本 点 ( x , 相 对 于 它 们 的 随 机 误 差 为 e 称 为 相 应 于 样 品 点 ( ) ( i = 1 , 2 , , n ) 的 残 差 。 ( 2 )残差平方和 2 2 2 2 2 2 1 2 1 1 2 2 ? ? ? ? ? ? Q = e e () ( ) ( ) n n n e y y y y y y ? ? ? ? ? ? ? ? ? ? 当 Q 的值越小,说明线性回归模型的拟合效果越好 . (3) 用相关指数 R 2 来刻画回归的效果,其计算公式是: 2 2 1 2 1 ( ) ( ) n i i i n i i y y R y y ? ? ? ? ? ? ? R 2 的值越大,说明残差平方和越小,也就是说模型的拟合效果越 好,在线性回归模型中, R 2 表示解释变量对预报变量变化的贡献 率, R 2 越接近于 1 ,表示回归效果越好 . 3. 独立性检验 ( 1 )用变量的不同“值”表示个体所属的不同类别,这种变 量成为分类变量 . 例如:是否吸烟,宗教信仰,国籍等 . ( 2 )列出两个变量的频数表,成为列联表 . ( 3 )一般地,假设有两个分类变量 X 和 Y , 它们的值域分别是 {x 1 , x 2 } 和 {y 1 , y 2 } ,其样本频数列联表(称为 2*2 列联表)为 2 × 2 y 1 y 2 总计 x 1 a b a+b x 2 c d c+d 总计 a+c b+d a+b+c+d 2 2 ( ) ( ) ( ) ( ) ( ) n a d b c K a b c d a c b d ? ? ? ? ? ? ( 其中 n=a+b+c+d 为样本容量 ) ,则利用独立性检验判断表来判 断“ x 与 y 的关系” . 注意常将: 的叫做 K 2 的观测值 . 这种利用随机

文档评论(0)

wangsux + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档