- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
应用统计学总复习
教师:严洁
2012年 6月
[本课件专为北大政府管理学院《应用统计学》课程所设计,限于选修本课程的学生使用,
未经作者允许请勿以任何方式传播。]
第一部分:重要概念、知识点
一、 应用统计学全景
1.1 描述统计:是指用归纳性的数值对一个已知的样本或者总体的数量特征
进行概括
1.2 推断统计:是从样本信息推论到总体数量特征的统计技术
1.3. 测量尺度
1.3.1 定类尺度:每一种不同的数字或符号代表着不同的类别或标记的一
种度量方法。是测量定类变量所使用的尺度。
1.3.2 定序尺度:每一种数字或符号代表着有序的选项,但各选项之间不
必是等距关系的一种度量方法。
1.3.3 定距尺度:是指有一个固定的数字区间贯穿于一个度量序列之中的
度量方法。每个数字之间是等距的,并且 0 只代表等距序列中的一
个位置,而不是代表“一无所有”。
1.3.4定比尺度:是指数字的赋值能够具有所有算术特征的一种度量方法。
0就代表“一无所有”。
二、 描述统计
2.1 平均值mean:用于定距及以上变量的集中趋势的描述。
2.2 众数mode:出现次数最多的值,用于任一层次的变量集中趋势的描述。
2.3 中位值median:数据序列中处于中央位置的值,用于定序及以上变量的
集中趋势的描述。
第 1 页 共 14 页
2.4 方差 variance、标准差 std.deviation: 观察值与其平均值之差的平方
和除以全部观察总数。方差的平方根就是标准差。标准差越大,平均值
的代表性越小。它表示数据的离散程度。
2.5集中趋势:均值、中位数、众数;离散趋势:方差、标准差、四分位差、
极差。
2.6 列联表:通过将两个变量交互分类,旨在发现变量之间是否存在某种联
系的频次/频率分布表。适用于定类、定序变量。
2.6.1 列联表的卡方检验:检验变量之间是否独立。在sig0.05的情况下,
说明变量之间不独立。
2.6.2 列联强度系数:表示变量之间关系的强弱。在sig0.05的情况下,
绝对值越接近于1,说明变量之间关系越强。
2.6.3 定类变量:ф系数、C 系数、 V 系数、λ系数(lambda)、τ系数
(Goodman Kruksal Tau-y)
2.6.4 定序变量:斯皮尔曼等级相关系数ρ、Gamma系数、 Kendall’s Tau
系数、d系数
三、 推断统计
3.1 概率分布:回答的是随机现象一共有多少种结果以及每种结果所伴随的
概率是多少。
3.2 抽样分布:是样本统计量的概率分布。对一个固定的总体,在确定的样
.....
本设计和样本量的条件下,样本统计量的所有可能取值及其出现概率的
序列就是该统计量的抽样分布。
3.3 正态分布:
3.3.1 正态分布的两个参数——均值和标准差一旦确定,正态分布的具体
形态也就唯一确定。
3.3.2 3σ 法则:在正态分布中,有 68.3%的变量值落在以平均数为中心
的一个标准差范围内;有 95.4%的变量值落在以平均数为中心的两
个标准差范围内;有 99.7%的变量值落在平均数为中心的三个标准
差范围内。
第 2 页 共 14 页
3.4 标准正态分布:标准差为1,均值为0的正态分布N(0, 1)称为标准正态
文档评论(0)