数据变换技巧.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据变换技巧

SPSS Club Peking University http://ASRA. 本学期的课程安排 4.14描述性分析及数据变换技巧 4.21相关分析及均值比较 4.28方差分析 5.19多元回归 5.26多元回归的延展 6.2聚类分析和因子分析 6.8(看情况) Lesson 2 描述性分析及数据变换 Lesson 2 目标 Lesson 2 描述性分析及数据变换 描述性分析是数据分析的基础 目前多数研究都是描述性分析 在做描述性分析时,重要的是要清楚要描述什么,描述目的是什么 简化精炼数据——抽象化,形象化过程 这涉及数据收集工具的设计(收集何种信息,达到那种测量水平)——研究设计俱乐部 这涉及到对现有数据的变换——赋予目标性意义 这涉及到怎么来描述(统计量,统计图表的选择) 均值受极端值变化的影响,均值预测定距变量最好,均值一般不用于定类与定序变量。 样本的中位数从一个样本到另外一个样本有较大的差异,但分布高度倾斜时,中位值比均值好,中位值预测定序变量的效果比较好。 众数,为次数出现最多的变量值,主要适用于定类变量,用众数来预测定类变量所犯的错误最小 Frequencies过程 Descriptives过程 Explore过程 Crosstabs过程 Stem-and-leaf:茎叶图,系统默认状态(这个图分为三个部分:频数、茎和叶,茎是整数部分,叶是小数部分,stem width表示茎宽, 每行的茎和叶组成的数字再乘以茎宽,就得到实际数据的近似值,实际数据中与这个近似值靠近的值的个数即为频数表示的个数。 GET DATA /TYPE = TXT /FILE = C:\Documents and Settings\Administrator\My Documents\mobile fee\mobile.txt /DELCASE = LINE /DELIMITERS = \t /QUALIFIER = /ARRANGEMENT = DELIMITED /FIRSTCASE = 1 /IMPORTCASE = ALL /VARIABLES = 日期 A8 时间 A10 V3 1X 通话时间 A8 呼叫 A4 号码 F15.0 呼叫地点 A4 通话类型 A4 通话费用 F6.2 长途费用 F6.2 . CACHE. EXECUTE. 文件类型 路径 一行为一个case 划分标记 文本引用符号 数据格式 第一个案例从第几行开始 倒入多少变量 变量列表 变量名1+变量类型+长度 变量名2+变量类型+长度 · 变量名+1X·(删除)| · Cache (缓冲数据) 执行 V1 DATE9 V2 DOLLAR2.0 V3 DATE11 V4 A6 V5 COMMA11.2 V6 A6 V7 A6 V8 DOT4.2 V9 F1.0 1X A 为字符型变量 F为数值型变量 DOLLAR为货币 DATE为日期(多种类型) COMMA为逗号分割数字 DOT为点号分割数 整数表示字符长 小数表示小数位数) 1X表示删除 为什么要做数据变换 怎么做数据变换 意义 变换工具 例子:mobile数据的变换 PKU SPSS CLUB. * * Basic part Data Management Descriptive Analysis SPSS skills quantitative analysis Advanced Part Multivariate Data Analysis Introduction 0 Base :基本统计系统,Report分析与Descriptive statistics分析 Professional: 专业统计系统(主要是高级统计分析――因子分析、聚类分析、判别分析) Advanced:高级统计分析―――如各类多元回归、非线性分析等 Tables 制表系统 Trends 趋势分析系统 Categories 对应分析 Lisrel 线性结构方程分析 描述性统计概论 1 基本操作练习 2 数据变换技巧 3 掌握 最常用的描述统计操作 理解 1,统计描述的目的 2,统计量的搭配 3,以意义来指导描述 入门:各种基本软件配合做数据变换 理论 操作 技巧 描述性分析中的基本统计量 1 描述性分析中的基本统计量 1 统计量搭配 统计描述 均值(定距) 众数(定类) 中位数(定序) 方差 异众比 四分位差 SPSS中的描述性统计 1 一个比较好的网上教材:/news/spss/doc3/index.htm S.E.Mean: 标准偏差/根号n,它小于标准偏差,同一分布中抽取不同的样

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档