- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
3数据文件操作
3.1一般操作
数据排序
数据文件分组
数据文件合并
对记录的合并
对变量的合并
数据文件转置
变量取值的求秩
求出变量取值在指定条件下的大小顺序,使得取值按照一定的顺序进行排列,秩就反映了取值在这个有序列里的位置信息。
变量值的重新编码
可分为生成新变量和不生成新变量
计算新变量
3.2分类汇总
按指定的分类变量对观测值量进行分组,然后计算各分组内的某些变量的描述统计量。
按性别、年龄 分类,算出身高、体重的均值,并统计每个分类的个数。
3.3观测值的权重
3.4数据文件的结构重组
子公司与季度 销售量问题
横向结构:每个子公司一条观测值记录,包含它在4个季度
纵向结构:每个子公司每个季度建立一条观测值
4基本统计分析功能
统计分析和建模之前,对数据进行描述性工作。
展现数据的基本统计指标。
4.1 OLAP:在线分析过程
汇总变量:连续型变量
分组变量:
实例操作:
设置变量间差异
设置分组间差异:
输入对选中的分组变量进行比较的 第一个类别的取值
输入对选中的分组变量进行比较的 第二个类别的取值
交互式操作:右键图表-编辑
4.2 观测的摘要报告分析
4.3 行和列的摘要报告分析
4.4 频数分析
4.4.1 对分组变量的频数分析
4.4.2 对连续变量的频数分析
4.5 描述性统计分析
主要用来对连续变量,可以将原始数据转换成标准Z分值(标准化数据)并存入当前数据集,标准化后的变量值没有度量衡的差异,更加易于比较。
4.6 探索性分析
能够帮助用户决定选择何种统计方法进行数据建模,判断是否需要把数据转换成正态分布,以及是否需要做非参数统计。
4.7 列联表分析
5均值比较和T检验
能否用样本均值估计总体均数,两个变量均值接近的样本是否来自均值相同的总体。
两个样本某变量的均值不同,其差异是否具有统计意义,它能否说明总体之间存在的差异。
假设检验:
|--参数检验(定量数据)
|--单样本:T检验、Z检验
|--双样本
|--独立样本
|--配对样本
|--非参数检验(非定量数据)
|--单样本:卡方检验、K-S检验、游程、二项式
|--双样本
|--独立样本
|--配对样本
对来自正态总体的两个样本进行均值比较,常用t方法,因方差是否相同而T公式不同
对方差齐次性检验常使用F检验。
5.1均值过程
常用于分组计算、比较指定变量的描述性统计量。
实例:
学生身高随年龄(第一层)、性别(第二层)的统计
5.2单样本T检验
用于检验单个变量的均值与给定的常数之间是否存在显著差异,样本均值与总体均值之间的差异。
要求:单样本来源于正态总体分布
零假设:样本均值=总体均值
t分布的临界值:t0.05和t0.01
实例:
儿童身高于70的假设
5.3两独立样本T检验
检验两个样本是否来自均值相同的总体
5.4配对样本T检验
自身配对
同源配对
6非参数检验
非参数检验方法不依赖于总体的分布,在总体分布情况不明时,同来检验不同样本是否来自同一个总体的统计推断方法。
6.1简介
非参数与参数检验的区别:
参数检验:
对样本所属总体的性质做出若干假设,即对总体的分布形状做某些限定,如:Z检验、t检验、F检验等。把所要推断的总体的数字特征看做未知的参数进行推断,称为参数统计方法,基于此做的假设检验就称为参数检验,
参数检验只有在关于在总体分布的假设成立时,所得出的结论才是正确的。
非参数检验:对总体不做太多或严格限定的统计推断方法。
优点: 检验条件宽松,适应性强
检验方法灵活,用途广泛。不但应用于定距、定比等连续变量的检验,且适用于定类、定序等分类变量的检验。使用等级或符号秩
计算相对简单,易于理解
缺点:功效低。
6.2卡方检验 Chi-square test
6.3二项式检验 Binominal test
6.4游程检验 Runs test
6.5 K-S单样本检验 1-Simple K-S test
6.6 两样本独立检验 2 Independent Simples test
6.7 k个独立样本的检验 K Independent Simples test
6.8 两个相关样本的检验 2 Related Simple test
6.9 k个相关样本的检验 K Related Simple test
7多重响应分析
7.1概述
多重响应分析,多重应答,针对同一个问题被访者可能回答出多个有效的答案。
本质是分类,通常对多选题的结果进行数据转换:二分法和分类法。
7.2变量集定义
能够将多个基本变量定义为多重响应的数据分类,多重二分类变量集或多重多分类变量集。然后进行频数分析或交叉表分析。
7.3变量集的频数分析
7.4交叉表分析
7.5
8回归分
文档评论(0)