应用计量经济学第17章.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
* * * * * * * * * * * * * * * * * * * * 第17章 统计学原理 Slides by Niels-Hugo Blunch Washington and Lee University 概率 一个随机变量X,它的取值是由一个随机现象来决定的 离散型随机变量的取值是可数的,例如:0、1、2 连续型随机变量的聚值在一个区间内是无限的,例如:时间、距离 离散型随机变量 X 的概率分布 P[Xi] 是对X可能的取值: X1, X2 ……所对应的概率 例如,当抛掷一个六面骰子时,有六种可能的结果,平均每一种结果出现的可能性是1/6 Figure 17.1 给出了概率分布图 Figure 17.1 六面骰子的概率分布 均值、方差与标准差 期望(或均值)是离散型随机变量 X 对其各种可能的取值X, ,使用每一个概率作为权重,进行加权平均的结果: (17.1) 方差是离散型随机变量 X对其各种可能的取值X, 与其期望的差的平方,使用每一个概率作为权重,进行加权平均的结果: (17.2) 标准差是方差的平方根 连续随机变量 连续型随机变量的取值在一个给定的区间内是无限的,或者说,可以取任何在这个区间内的值 例如, Figure 17.2 展示了 a spinner 随机地选择圆上的一个点 连续概率密度曲线的下方面积给出一个给定区间的概率 Figure 17.3展示了 spinner例子的概率密度曲线 Figure 17.2 0~1之间任选一个数 Figure 17.3 Spinner的 连续概率密度分布 标准化变量 为了标准化一个随机变量 X ,可以首先减去其均值,然后再除以它的标准差: (17.3) 无论原来的随机变量 X 有怎样的初始单位,标准化后的随机变量 Z 的均值均为0,标准差均为1 标准化变量 Z 衡量了有多少个标准差倍的 X 大于或小于随机变量X的均值: 如果 X 等于均值,那么 Z 等于0 如果 X 超过均值一个标准差,那么 Z 等于1 如果 X 小于均值两个标准差,那么 Z 等于-2 Figures 17.4 与 17.5 展示了抛掷骰子与抛掷普通硬币的情况 Figure 17.4a 标准化变量Z,六面骰子的概率分布 Figure 17.4b 标准化变量Z,六面骰子的概率分布 Figure 17.4c 标准化变量Z,六面骰子的概率分布 Figure 17.5a 标准化变量Z,硬币实验的概率分布 Figure 17.5b 标准化变量Z,硬币实验的概率分布 Figure 17.5c 标准化变量Z,硬币实验的概率分布 正态分布 Figure 17.6 展示了正态分布的概率密度曲线 Z 在特定区间取值的概率由概率密度曲线下方的面积决定 这个面积可以被统计软件计算出来,也可以在附录中查表获得 服从正态分布的例子(至少是粗略的): 人类、狗、番茄的重量 拇指的长度、肩膀的宽度、头骨的宽度 IQ值、SAT、GRE得分 猫身体上毛的数量、树上树叶的数量、扇贝壳螺纹的数量 Figure 17.6 正态分布 正态分布 中心极限定理是经验研究中一个非常有力的理论,该理论建立在正态分布之上 中心极限定理是指: 如果 Z 是 N个独立的、有相同分布、有有限方差、有非零标准差的随机变量(可以是离散的,也可以是连续的)的和,那么,随着N的增加,Z的概率分布将趋向于正态分布 抽样 首先,定义这些关键概念: 总体:研究对象的全体集合 样本:我们实际观察到的总体的一个部分 统计推断:使用来自总体的样本以获得关于总体特征的方法 选择性偏误 任何一个样本与总体都存在系统性差异,用样本来代替总体会产生样本偏误 最常见的一种导致样本偏误的可能是选择性偏误,即在选择样本时,系统地排除部分样本 选择性偏误的发生与我们方便地获取数据来源有关 Self-selection bias can occur when we examine data for a group of people who have chosen to be in that group 当我们使用来自同一组的数据……会产生自选择偏误 生存着偏误、无应答偏误 回溯研究通常研究同时期选择的样本的过去取值 例如,65岁老年人一生的医学记录检查 相反,预测研究则对同时期选择的样本的未来值感兴趣 回溯研究与生存者偏误是不同的,生存者偏误中我们排除了那些已经不存在的总体的值 无应答偏误是指参与一项实验或一项调查的一些个体系统性拒绝造成的偏误 随机选择的力量 在一个来自总体的样本容量为N的简单随机样本中: 总休的每一个取值都有可能被包含到样本中 每一个样本都有相同的机会被选到 我们是如何进行随机选择的? 将总体的每一个个体名称写在纸片上 将全部纸片放

文档评论(0)

676200 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档