SPSS数据处理的部分基本概念要点.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计学 ─从数据到结论 第一章 一些基本概念 §1.1 统计是什么? 统计是人类思维的一个归纳过程 站在一个路口,看到每过去20辆小轿车时,也有100辆自行车通过 而且平均每10个轿车载有12个人 于是,你认为小汽车和自行车在这个路口的运载能力为24:100 这是一个典型的统计思维过程 §1.1 统计是什么? 一般来说,统计先从现实世界收集数据(信息),如观测路口的交通 然后,根据数据作出判断,称为模型 模型是从数据产生的 模型也需要根据新的信息来改进 不存在完美的模型 模型的最终结局都是被更能够说明现实世界的新模型所取代 统计学可以应用于几乎所有的领域: §1.1 统计是什么? 一句话, 统计学(statistics)是用以收集数据,分析数据和由数据得出结论的一组概念、原则和方法。 以归纳为主要思维方式的统计不是以演绎为主的数学 统计可应用于各个不同学科,在有些学科已经有其特有的方法和特点;如生物统计(biostatistics)、经济计量学(econometrics)以及目前很热门的生物信息(bioinformation)和数据挖掘(Data Mining)的方法主体都是统计。 §1.2 现实中的随机性和规律性,概率和机会 从中学起,我们就知道物理学的许多定律,例如v=v0+at; F=ma等等 但是在许多领域,很难用如此确定的公式或论述来描述一些现象。 §1.2 现实中的随机性和规律性,概率和机会 一些现象既有规律性又有随机性(randomness) 肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性 而绝非每个吸烟的人都会患肺癌,这体现了随机性 §1.2 现实中的随机性和规律性,概率和机会 再如,一般来说,白种人身材比黄种人要高些,这就是规律性 但对于具体的一个白人和一个黄种人,就很难说谁高谁矮了,这体现随机性 §1.2 现实中的随机性和规律性,概率和机会 什么是概率(probability)? 新闻中最常见的是“降水概率” 从某种意义说来,概率描述了某件事情发生的机会。 显然,这种概率不可能超过百分之百,也不可能少于百分之零。 概率是在0和1之间(也可能是0或1)的一个数,描述某事件发生的机会。 §1.2 现实中的随机性和规律性,概率和机会 有些概率是无法精确推断的。 比如你明天感冒的概率 有些概率是可以知道的。 比如在打桥牌时得到一手黑桃的概率为1/635013559600,大约为1.574770×10-12(条件是洗牌均匀,没有作弊)。实际上得任何特定的一手牌的概率都是一样的,对吗? §1.3 变量和数据 一节火车车厢有多少坐位是一个固定的数目,称为常数(constant)或者常量。 但是,开车后,坐在这节车厢的旅客有多少就没准了。这有随机性。该车厢的乘客数为变量(variable)。 §1.3 变量和数据 一个学校的注册在校男女生比例是固定的,为常量 但是,该校任意一群学生的男女生比例就不一定和全校的比例一样了,它为变量(variable)。 §1.3 变量和数据 当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitative variable); 因为是随机的,也称为随机变量(random variable)。 如身高体重,购买某商品的人数等等 §1.3 变量和数据 象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitative variable,或categorical variable)。 这些定性变量也可以由定量变量来描述,如男女生的数目,持有某观点的人数比例等等。 §1.3 变量和数据 定性变量只有用数量来描述时,才有可能建立数学模型,并使用计算机来分析。 数据中它们通常用哑元(dummy variable)代表,比如性别用0、1代表,三种收入用0、1、2代表(或用字母代表) §1.3 变量和数据 有了变量,何谓数据? 不同机构调查所得到的北京收入万元以上市民的比例都不一样,这是变量 而这些调查产生一些数目,这些数目就是数据(data) 数据是关于变量的观测值。 §1.3 变量和数据 通过数据可验证有关的理论或假定。 比如通过抽样调查验证美国选民对共和党候选人的支持率是否超过50% 通过抽样,可以检验某批产品是否合格等等 §1.4 变量之间的关系 现实世界紧密联系的 人们想知道投资方式和经济效益之间的关系、旅客人数和经济发展之间的关系等等 不讨论变量之间的关系,就无从谈起任何有深度的应用,统计的基本概念就仅仅是摆设而已。 §1.4.1 定量变量间的关系 例1.1.广告投入和销售之间的关系。下表(数据ads.txt)显示了某企业的广告投入和销售额之间的关系(万元)。 §1.4.1 定量变量间的关系 能否从该数据回答下面问题: 这两个变量是否有关

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档