- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2018年常用统计方法.doc
常用统计方法
常用统计方法
各种情形下最常用统计方法索引
数量资料统计描述
T检验和u检验
秩和检验
方差分析
分类资料统计描述
卡方检验
回归与相关分析
二项分布与Poisson分布
各种情形下最常用统计方法索引
因变量:连续
单个自变量: 二分类 T检验
多分类 单因素方差分析
连续 相关分析,回归分析
多个自变量: 分类变量为主 方差分析模型
连续变量为主 线性回归模型
因变量:有序分类
单个自变量: 二分类 秩和检验
多分类 秩和检验
连续 Logistic回归分析
多个自变量: 分类变量为主 Logistic回归分析
连续变量为主 判别分析、Logistic回归分析
因变量:无序分类(含二分类)
单个自变量: 二分类 卡方检验
多分类 卡方检验
连续 Logistic回归分析
多个自变量: 分类变量为主 Logistic回归分析、最优尺度分析
连续变量为主 判别分析、Logistic回归分析
注:当自变量和因变量均为有序/无序多分类时,实际上还有CMH卡方最为常用。 希望将变量/纪录分成若干个类别,但类别数不清楚,或各类别的特征不明:聚类分析
, 希望建立判别方程,对以后新进入的案例进行所属类别的预测:判别分析
, 需要探索多个变量间的内在联系或内在结构:因子分析、对应分析
, 生存时间和生存结局都是需要关心的因素,同时数据中存在大量的失访:生存分析
, 得到的是时间序列数据,需要对以后的情形加以预测:时间序列模型
, 考察的特征需要有多个应变量来表示,同时研究多个自变量对他们的影响:多元方
差分析模型
1
数量资料统计描述
对数值变量资料进行统计分析的一般步骤,是先对观察测量得到的变量值(即观察值)进
行统计描述,再在此基础上进行深入的统计推断。统计描述的工作主要是在编制频数表的基础上描述资料的集中位置和离散程度。
一、数值变量资料的频数表
1. 频数表(frequency table)的编制方法:
(1)找出观察值中的最大值(largest value)、最小值(smallest value)和极差(range)。
(2)据极差大小确定组段和组距(class interval),将其分为10个左右的组段。
(3)列表划记落在各组段内的观察值个数即可得频数表。
根据编制出的频数表即可了解该数值变量资料的频数分布特征。
2. 频数分布的特征及类型:
(1)两个特征:集中趋势(central tendency)和离散趋势(tendency of dispersion)
(2)两种类型:对称分布(symmetric distribution)和偏态分布(skewed distribution),偏态分布又有正偏态(positively skewed)和负偏态(negatively skewed)之分。 3. 频数表的用途:
(1)描述资料的分布特征和分布类型。
(2)进一步计算有关指标或进行统计分析。
(3)发现特大、特小的可疑值。
(4)据此绘制频数分布图。
二、集中位置的描述
描述一组观察值集中位置或平均水平的指标称为平均数(average)。它能使人对资料有个简明概括的印象,并能进行资料间的比较。常用的平均数有算术均数、几何均数和中位数。 1. 算术均数(arithmetic mean)
简称均数(mean),有总体均数和样本均数之分,分别用希腊字母和英文字母表示。 ,x
(1)计算方法
不分组资料用直接法。即所有观察值的累积和除以观察值个数, 相同观察值较多或分组资料常用加权法(weighting method)。
(2)均数的应用
适用于对称分布,特别是正态分布的资料,不适
原创力文档


文档评论(0)