- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 描述统计与假设检验 (提纲)
第四章 描述统计与假设检验 (提纲)
第一节 统计资料的整理
一、统计资料的输入
1.数据编码
编码的一般方法是,对于定类变量,一般对不同的类别给予不同的代码;对于定序变量,可以用数值大小表现其排序,这里的数值根据需要,可以作为代码(字符)使用,也可以作为数值使用;对于定距或定比变量,一般直接用其数值表现其不同。
2.输入方法:
一是直接在SPSS上输入,一般做法是定义变量(定义变量的方法见《统计分析》P27),然后将各变量的具体数值或代码输入。如变量为性别、年龄、教育程度、工资
二是由其他数据中取得,如从EXCEL中取得,数据库文件中取得、或文本文件中取得。
从EXCEL数据输入
3.数据的标准化
对变量进行变换,使其成为均值为0,方差为1的标准化数据。
三、数据重新编码
可以通过重新编码的方法,编制组距数列。例如,根据年龄,编制20以下、20~30,30~40、40~50、50以上等几组:
再来统计年龄的频数分布:
age
FrequencyPercentValid PercentCumulative PercentValid1.0210.010.010.0 2.0525.025.035.0 3.0735.035.070.0 4.0420.020.090.0 5.0210.010.0100.0 Total20100.0100.0
也可以保持原变量age,将分组后的变量用新变量age1表示:
四、变量的加权
已有的分组资料如何输入?
例:
完成的产品数x人数f131153205212221
要求计算均值、标准差
可以用变量加权的方法
Descriptive Statistics
NMinimumMaximumMeanStd. Deviationx1213.0022.0018.50003.06001Valid N (listwise)12
二、统计资料的整理——统计分组
1.定类变量或单个数值变量的分组
进行频数统计即可
2.组距式分组
先对变量按照各组的上下限范围进行重新编码,然后进行频数统计。
3.两个变量的交叉式分组——列联表的编制
用CROSS TABLE进行分组
例如收入按年龄的分布、收入按年龄的分布
第二节 描述统计与分析
一、集中趋势分析
集中趋势是从一组数据中抽象出的一个代表值,以代表现象的共性和一般水平。
集中趋势的作用:说明某一社会现象在一定条件下数量的一般水平;对不同空间的同类现象或同一现象在不同时间的状态进行比较;分析某些社会现象之间的依存关系。
常用的测量指标:
1、众数:出现频率最高的变量值。
?????2、中位数:是将观察总数一分为二的变量值。
?????3、平均数
二、离中趋势分析
离中趋势:用以概括描述数据间差异程度的统计指标。
常用的测量指标:
1、异众比率:非众数的各变量值的总频数在观察总数中的比例。
????? 2、极差:等于最大观察值与最小观察值间的差。是对定序及定序以上尺度的变量离散程度的测量。
??????3、四分互差:Q = Q3 - Q1? 是对定序及定序以上尺度的变量离散程度的测量。四分位数:
四分位数(Quartile),把所有观察值由小到大排列并分成四等份,处于三个分割点位置的得分就是四分位数。
第一四分位数 (Q1),又称“较小四分位数”,等于该样本中所有数值由小到大排列后第25%的数字。 第二四分位数 (Q2),即中位数,等于该样本中所有数值由小到大排列后第50%的数字。 第三四分位数 (Q3),又称“较大四分位数”,等于该样本中所有数值由小到大排列后第75%的数字。
4、方差与标准差:只适用于定距变量。
5、离散系数与标准分数:离散系数是标准差与平均数之百分比。
三、分布特征:
1.峰度
峰度是用于衡量分布的集中程度或分布曲线的尖峭程度的指标。
2.偏度
偏度是用于衡量分布的不对称程度或偏斜程度的指标。
四、双变量关联分析
关联表的自变量与因变量位置
自变量作为列变量,因变量作为行变量(恰如横坐标为自变量,纵坐标为因变量)
2×3表示2行3列。
1.变量的独立性
分析两个分类变量之间或者一个分类变量与顺序变量之间是否存在关联,关联的紧密程度如何。对这类问题的处理称为独立性检验(Test of Independence).
2.定类变量间的相关程度测量
3.定序变量间的关联程度的测量
4.定距(定比)变量间的关联程度测量
5.定类变量与定距变量的关联程度测量
两个变量中,自变量为定类变
文档评论(0)