专题1 数据分析的基础知识.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
专题1 数据分析的基础知识

专题一 数据分析的基础知识 主要内容 话题一:数据与数据类型 话题二:样本与抽样 话题一:数据与数据类型 数据与数据类型 数据来源 观察:观察者直接通过感官获得数据。 测量:按照一定规则给研究对象在某种性质的量尺上指定值。 测量工作按照一定的规则进行,这些规则被规范化乃至被物化,就体现为三种东西,即:测量工具、施测和评分(读数)的程序与要求、结果解释参照系或参照物。 数据与数据类型 测量工具(scale) 物理属性测量的工具有直尺、天平、电子测距或测时仪器等。 生理学上用的测量工具有视力表、握力器、肺活量测试仪等。 教育测量中学业成绩测评的工具有考试试卷,而心理测量的工具有各种测试项目(口头形式、文字形式或器具形式) 数据与数据类型 按照来源划分数据类型 定性数据:来自访谈、直接观察、档案记录、文字材料等。 定量数据:来自测量工具测量评定的结果。 离散数据(Discrete data) 连续数据(Continuous data) 数据与数据类型 数据的类型 称名数据(名义数据):如性别、民族 等级数据(顺序数据) :名次、等级 等距数据:摄氏温度、IQ 比率数据:金额、长度、重量、考试分数 数据的测量类型(scale type) 数据与数据类型 上述4种数据类型可以分为两大类 离散数据:包括称名数据和等级数据 连续数据:包括等距数据和比率数据 其中,称名数据和等级数据就相当于贴标签,而连续数据则都是测量工具(scale)测量的结果。 计算机所支持的数据类型 计算机所支持的数据类型(data type): 数字型 整型:23、1、100、88 浮点型:23.5、2.09、 文本型(字符型): ”男”、”女”、”一年级”、”二年级”、”23.5” 日期型: 09/3/10、2009年03月10日、二〇〇九年第一季度 …… 话题二:样本与抽样 样本与抽样 统计学中的基本概念 总体(Population) 个体(Case) 样本(Sample) 指标或变量(Variable) 指标值(变量值)(Data) 样本与抽样 总体的类型 有限总体(finite population ) 无限总体(infinite population) 样本与抽样 总体参数( population parameter)与样本统计量(sample statistic)的对照 在统计学中,凡是总体参数一律用希腊字母来代表;凡是样本统计量则一律用拉丁字母来代表。 样本与抽样 总体参数是常数(constant) 样本统计量是变量(随机变量,random variable),会随着抽样的不同而随机变化。 样本与抽样 抽样误差 研究者的目的是通过样本研究总体,因此以总体为参照物,样本与总体的差异我们称其为抽样误差(Sampling error )。 样本与抽样 样本的类型 随机样本(random sample):具有代表性的,能够被推广应用于总体的统计样本。 方便样本(convenience sample):研究者能够很容易很经济地得到的样本。 抽样的类型 概率抽样(随机取样)(probability sampling) 非概率取样(nonprobability sampling) 样本与抽样 常用的概率抽样方法: 简单随机抽样(simple random sampling) 分层随机抽样(hierarchical sampling):分两阶段进行取样——先分组,后在每个组中随机抽取若干个体。 两阶段随机取样(two-stage random sampling):分两阶段进行取样——先以区域为单位对区域进行随机抽样,再被抽取的区域内对被试个体进行抽样。 简单随机抽样的操作方法 抽签法(drawing lots) 等… 分层随机抽样例子 聚类(区域)随机取样的例子 某市有小学200所,要在该市小学生中抽取一个容量为80的随机样本。可采用分阶段抽样。首先以小学为单位,在200所小学中用简单随机抽样的方法抽取40所,然后分别在这40所学校中又用简单随机抽样的办法各抽取2名学生,最终合成全市80人的小学生样本。 * * 名义变量 Nominal 无相等单位 无绝对零 按对象的某一属性命名 顺序变量 Ordinal 无相等单位 无绝对零 按对象的某一属性排序 等距变量 Interval 有相等单位 无绝对零 可进行加减运算 比例变量 Ratio 有相等单位 有绝对零 可进行加减乘除运算 SPSS中的数据类型 EpiData所支持的数据类型 S 2 σ2 方差 Variance ρ σ μ 参数 r S X 统计量 相关系数 correlation coefficient 标准差 Standard deviation 平均数 mean 特征量数 measures 580

文档评论(0)

153****9595 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档