- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
江西理工大学spss总结
变量:SPSS数据文件中一列数据称为一个变量,每个变量有变量名;一行数据称为一条个案或观测量。
如果用户不指定变量名,软件自动以VAR+5位数字
变量取值的类型:三种基本类型:数值型、字符型、日期型
角色:用于定义变量在后续统计分析中的功能作用,用户可以选择输入、目标和两者等类型的角色。
数据的转置功能:是将数据文件中的行、列进行互换,即将观测量转变为变量,而将变量转变为观测量
数据分类汇总功能:是按指定的分类变量值对所有的观测量进行分组,对每组观测量的变量求描述性统计量,并生成分组数据文件
文件的合并:是指将一个外部数据文件的观测量或变量增加到当前工作文件中,使它们合并成一个文件,文件合并分为观测量合并和变量合并
“秩”是指数据按大小顺序排列之后的名次。如2,5,-1,0,4,按小到大排序为-1、0、2、4、5.那2的秩即为3.
描述性统计量的分类:集中趋势(均值,众数,中位数,其他)离散程度(全距,标准差,方差,离散系数,其他)分布形态(偏度,峰度)
集中趋势:是指一组数据向某一中心值靠拢的倾向,一般要寻找能反映数据一般水平的代表值 均值:不足--均值往往受到异常大或异常小的数值影响,所以对于严重偏态的分布,均值往往会失去代表性。 众数:适用于单峰对称的情况,对于多峰的分布,一般不用它来描述。 中位数:指将分布数列中的各单位的标志值依其大小顺序排列,位于中间位置的标志值成为中位数。
离散程度:是指一组数据远离其中心值的程度,即考察数据分布的疏离程度。
全距(range):最大值与最小值之差,又称极差。 全距=最大值—最小值。 不足:仅仅取决于两个极端值的水平,不能反映期间的变量分布情况,提供信息太少。 标准差(standard deviation):变量取值距离均值的平均离散程度的统计量。
偏度:是描述变量取值分布形态对称性的统计量。 当偏度为0,说明数据对称分布;当偏度值大于0,表示变量取值右偏,直方图中有一条长尾拖在右边,当偏度小于0,表示数据左偏,即数据的长尾在左边。
峰度:是描述变量取值分布形态陡缓程度的统计量,是指分布图形的尖峰程度。 当数据分布和标准正态分布的陡缓程度相同时,峰度为0;当峰度值大于0,说明数据的分布比标准正态分布更陡峭,为尖峰分布;当峰度小于0,为平峰分布。
探索性数据分析(exploratary data analysis):基本思想是从数据本身出发,不限制于原有模型的假设,采用非常灵活的方法来探索数据分布的大致情况,再进一步结合模型的研究,为总体数据的准确性提供更好的基础。
数据分析的步骤:探索性数据分析和证实分析。
探索性数据分析:从复杂的数据中分离出数据的基本模式和特点,让分析者发现其中的规律,以便选择分析方法 主要内容:1)检查数据是否有错2)获取数据分布特征3)对数据进行初步观察,发现一些内在规律
SPSS基本图形:条形图、线图、面积图、饼形图、高低图、帕累托图、工序控制图、箱形图、误差条图、散点图、直方图、P-P图 可进一步派生出多种类型的交互图形及不同风格的二维、三维图形。
条形图(Bar chart):是用条带的长短和高低来表示数据指标大小的图形,用于性质相似的间断性资料的比较。 简单条形图(simple),显示基于某一分类的各类数据间的对比情况,用间隔的等宽条带来表示数据大小,图形的形成由两个统计量决定 复式条形图(clustered),在simple基础上分组,每组多增加变量,图形形成由2个或2个以上变量决定。 堆栈(stacked)把多个变量的结果叠加在一个条带上,分段表示。
按统计量描述方式有3种类型:1)个案分组模式(summaries for groups of cases)(个案组的摘要),将根据分组变量对所有个案进行分组,然后根据分组后的个案数据创建条形图。2)变量分组模式(summaries for separate variables)(各个变量的摘要),能描述多个变量,简单类型的条形图能描述文件中的每一个变量,复杂的则使用另一个分类变量来描述一个变量。3)个案模式(values of individual cases)(个案值),将分组变量中每个个案值生成一个条形图。
变量分组模式,单条形图情况下,不设置X轴分类,即以一个变量作为一个X轴。
线图:是一种用线段的转折来说明两个变量相互依存变化情况的统计图,通常用于描述变量随时间变化的趋势,揭示变量对时间的依存关系。
箱型图:主要是利用变量观测数据的中位数、四分位数等统计量来反映变量的分布情况。 (1)简单箱形图,是基于单一分组方式的数据分布图。 (2)复式箱形图,在simple基础上,增加次级分组方式形成的数据分布图。 图形符号含义:1)矩形框:上中下三
文档评论(0)