网站大量收购闲置独家精品文档,联系QQ:2885784924

第一章数据系统分析.ppt

  1. 1、本文档共118页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一章 数据系统 第一节 数据类型及其整理 第二节 数据的分布特征 第一节 数据类型及其整理 一、数据类型 1、定性数据 2、定量数据 二、数据来源 1、野外调查 2、定位或半定位观测 3、室内实验 4、判图 5、统计资料和文献 数据录入与数据结构构建:SPSS17.0 在变量视窗中需要确定以下属性: 变量名(Name):字符不宜多于8个,字母不分大小写,存档名称不能跟SPSS内特有名相冲突,如ALL、BY、AND、NOT、OR等,默认变量名VAR00001…… 数据类型(Type)、宽度(Width)、列宽度(Columns) 变量名标签(Label)、变量值标签(Value Labels) 缺失数据(Missing) 度量尺度(Measure) 例1:根据调查问卷,构建SPSS数据结构表 例2:运用下列表格资料,建立SPSS数据结构表 例3:在下列关于职称和年龄关系的数据中,如何进行SPSS数据的输入? 例4:多选项数据的输入 根据实际调查需要,要求被调查者从问卷给出的若干个可选答案中选择一个以上的答案,常用到多选项分析。 多选项分析的一般步骤:1)将多选项问题分解;2)进行频数分析。 二、数据的整理 1、检查资料、统计分组与图表绘制 2、数据的合并与分割 3、数据的函数变换 4、数据的其他变换 (1)资料检查 确保资料的可靠性、完整性和准确性 举例:从校园到工作:2011大学生求职经历调查 (2)统计分组 统计分组是按照一定标志和要求,把数据分成不同的组,为后续的统计研究打下基础。 统计分组可分为:按质量标志分组和按数量标志分组。 按质量标志分组,多用于人文-经济地理领域,其组数取决于社会经济现象的基本类型和其在研究中的意义,而且不分组距。如:在人口地理研究中,将人口按性别、民族、职业进行分组。 按数量标志分组,是先依其变量类型不同,分为离散型变量和连续型变量,然后再根据其特征的不同进行分组。 离散型变量可采用单项式(每个变量为一组)和组距式(整个变量分成几个区间,每个区间为一组)处理。 连续型变量只能采取组距式分组。又可分为等距和不等距分组两种。 操作步骤 第一步,求变量的全距R R=Xmax-Xmin 第二步,确定组数n n=1+3.32lgN 第三步,计算组距:h=R/n 第四步,确定每组的上、下限 组距分组的SPSS软件操作 (3)图表绘制 2、数据的合并与分割 例题:请将表2-1和表2-2进行纵向合并。 例题:请将表2-1和表2-3进行横向合并。 3、数据的函数变换 是将原始数据的每一个数值通过特定的运算方式变换成新的数值。在原有数据基本上,计算产生一些含有更丰富信息的新数据。使数据更直观、更有效。 常见的数据变换有:对数或多项式变换;时间序列的平稳化处理;利用区间变换压缩数据取值范围和标准化处理等。 包括算术表达式、条件表达式和函数三大部分。 标准化方法 SPSS软件包的数据变换 在SPSS软件包中,算术表达式:操作对象为数值型,运算符主要包括“+(加)”、“-(减)”、“*(乘)”、“/(除)”、“**(乘方)”,运算先后次序为先乘方,后乘除,最后再加减。 在SPSS软件包中,条件表达式:对条件进行判断的式子,有两种取值结果(如果判断条件成立,则结果为真;否则为假),包括简单条件表达式和复合条件表达式。 简单条件表达式 由关系运算符、常量、变量以及算术表达式等组成的式子。 关系运算符包括: (大于)、 (小于)、 =(等于) ~=(不等于)、=(大于等于)、 =(小于等于) 复合条件表达式 也称逻辑表达式,是由逻辑运算符号、圆括号和简单条件表达式等组成的式子。 逻辑运算符包括: 或and(并且)、|或or(或者)、~或not(非) 运算次序:not先行,其次是and,最后为or SPSS常见函数 例题:利用下表数据对“基本工资”变量作对数变换 4、数据的行列转换(转置) 5、数据的加权处理 例:表1-2为球迷给出的国家足球队在世界杯上的表现得分及其所占受众的比重,请利用SPSS软件对这一结果进行评价分析。 第二节 数据的分布特征 数据经过整理后,得出了频数分布的大致情况。但为了确切地表示地理数据的分布性质和在数量上的特征,需要进一步定量计算其特征值。 在数据的分布性质中,最重要的两个性质是集中性和分散性。 反映数据集中性的特征值有:平均值(均数)、中位数、众数等。 反映数据分散性的特征值有:绝对离差度(离差、离差平方和、标准差、方差等)和相对离差度(变异系数) 一、反映数据集中性的特征值 1、平均数(均数,Mean ) 可代表数据的一般水平,并可作为对比分析的指标。主要包括算

文档评论(0)

LOVE爱 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:5341224344000002

1亿VIP精品文档

相关文档