江西理工大学spss总结.docVIP

下载本文档

11
0
约7.14千字
约 6页
2017-04-23 发布于重庆
举报
版权申诉

江西理工大学spss总结.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

江西理工大学spss总结

变量:SPSS数据文件中一列数据称为一个变量，每个变量有变量名；一行数据称为一条个案或观测量。如果用户不指定变量名，软件自动以VAR+5位数字变量取值的类型：三种基本类型：数值型、字符型、日期型角色：用于定义变量在后续统计分析中的功能作用，用户可以选择输入、目标和两者等类型的角色。数据的转置功能：是将数据文件中的行、列进行互换，即将观测量转变为变量，而将变量转变为观测量数据分类汇总功能：是按指定的分类变量值对所有的观测量进行分组，对每组观测量的变量求描述性统计量，并生成分组数据文件文件的合并：是指将一个外部数据文件的观测量或变量增加到当前工作文件中，使它们合并成一个文件，文件合并分为观测量合并和变量合并 “秩”是指数据按大小顺序排列之后的名次。如2,5,-1,0,4，按小到大排序为-1、0、2、4、5.那2的秩即为3. 描述性统计量的分类：集中趋势（均值，众数，中位数，其他）离散程度（全距，标准差，方差，离散系数，其他）分布形态（偏度，峰度）集中趋势：是指一组数据向某一中心值靠拢的倾向，一般要寻找能反映数据一般水平的代表值均值：不足--均值往往受到异常大或异常小的数值影响，所以对于严重偏态的分布，均值往往会失去代表性。众数：适用于单峰对称的情况，对于多峰的分布，一般不用它来描述。中位数：指将分布数列中的各单位的标志值依其大小顺序排列，位于中间位置的标志值成为中位数。离散程度：是指一组数据远离其中心值的程度，即考察数据分布的疏离程度。全距（range）：最大值与最小值之差，又称极差。全距=最大值—最小值。不足：仅仅取决于两个极端值的水平，不能反映期间的变量分布情况，提供信息太少。标准差(standard deviation)：变量取值距离均值的平均离散程度的统计量。偏度：是描述变量取值分布形态对称性的统计量。当偏度为0，说明数据对称分布；当偏度值大于0，表示变量取值右偏，直方图中有一条长尾拖在右边，当偏度小于0，表示数据左偏，即数据的长尾在左边。峰度：是描述变量取值分布形态陡缓程度的统计量，是指分布图形的尖峰程度。当数据分布和标准正态分布的陡缓程度相同时，峰度为0；当峰度值大于0，说明数据的分布比标准正态分布更陡峭，为尖峰分布；当峰度小于0，为平峰分布。探索性数据分析（exploratary data analysis）：基本思想是从数据本身出发，不限制于原有模型的假设，采用非常灵活的方法来探索数据分布的大致情况，再进一步结合模型的研究，为总体数据的准确性提供更好的基础。数据分析的步骤：探索性数据分析和证实分析。探索性数据分析：从复杂的数据中分离出数据的基本模式和特点，让分析者发现其中的规律，以便选择分析方法主要内容：1）检查数据是否有错2）获取数据分布特征3）对数据进行初步观察，发现一些内在规律 SPSS基本图形：条形图、线图、面积图、饼形图、高低图、帕累托图、工序控制图、箱形图、误差条图、散点图、直方图、P-P图可进一步派生出多种类型的交互图形及不同风格的二维、三维图形。条形图（Bar chart）：是用条带的长短和高低来表示数据指标大小的图形，用于性质相似的间断性资料的比较。简单条形图（simple），显示基于某一分类的各类数据间的对比情况，用间隔的等宽条带来表示数据大小，图形的形成由两个统计量决定复式条形图（clustered），在simple基础上分组，每组多增加变量，图形形成由2个或2个以上变量决定。堆栈（stacked）把多个变量的结果叠加在一个条带上，分段表示。按统计量描述方式有3种类型：1）个案分组模式（summaries for groups of cases）（个案组的摘要），将根据分组变量对所有个案进行分组，然后根据分组后的个案数据创建条形图。2）变量分组模式（summaries for separate variables）（各个变量的摘要），能描述多个变量，简单类型的条形图能描述文件中的每一个变量，复杂的则使用另一个分类变量来描述一个变量。3）个案模式（values of individual cases）（个案值），将分组变量中每个个案值生成一个条形图。变量分组模式，单条形图情况下，不设置X轴分类，即以一个变量作为一个X轴。线图：是一种用线段的转折来说明两个变量相互依存变化情况的统计图，通常用于描述变量随时间变化的趋势，揭示变量对时间的依存关系。箱型图：主要是利用变量观测数据的中位数、四分位数等统计量来反映变量的分布情况。（1）简单箱形图，是基于单一分组方式的数据分布图。（2）复式箱形图，在simple基础上，增加次级分组方式形成的数据分布图。图形符号含义：1）矩形框：上中下三