第一讲 科学统计基础.ppt

  1. 1、本文档共61页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第一讲 科学统计基础

§1.3 变量和数据 一节火车车厢有多少坐位是一个固定的数目,称为常数(constant)或者常量。 但是,开车后,坐在这节车厢的旅客有多少就没准了。这有随机性。该车厢的乘客数为变量(variable)。 §1.3 变量和数据 一个学校的注册在校男女生比例是固定的,为常量 但是,该校任意一群学生的男女生比例就不一定和全校的比例一样了,它为变量(variable)。 §1.3 变量和数据 当变量按照随机规律所取的值是数量时该变量称为定量变量或数量变量(quantitative variable); 因为是随机的,也称为随机变量(random variable)。 如身高体重,购买某商品的人数等等 SPSS主要为Numeric §1.3 变量和数据 象性别,观点之类的取非数量值的变量就称为定性变量或属性变量或分类变量(qualitative variable,或categorical variable)。 这些定性变量也可以由定量变量来描述,如男女生的数目,持有某观点的人数比例等等。 §1.3 变量和数据 定性变量只有用数量来描述时,才有可能建立数学模型,并使用计算机来分析。 数据中它们通常用哑元(dummy variable)代表,比如性别用0、1代表,三种收入用0、1、2代表(或用字母代表) SPSS中没有特别的变量,往往用数值表示 §1.3 变量和数据 有了变量,何谓数据? 不同机构调查所得到的北京收入万元以上市民的比例都不一样,这是变量 而这些调查产生一些数目,这些数目就是数据(data) 数据是关于变量的观测值。 §1.3 变量和数据 通过数据可验证有关的理论或假定。 比如通过抽样调查验证美国选民对共和党候选人的支持率是否超过50% 通过抽样,可以检验某批产品是否合格等等 §1.4 变量之间的关系 现实世界紧密联系的 人们想知道投资方式和经济效益之间的关系、旅客人数和经济发展之间的关系等等 不讨论变量之间的关系,就无从谈起任何有深度的应用,统计的基本概念就仅仅是摆设而已。 §1.4.1 定量变量间的关系 例1.1.广告投入和销售之间的关系。下表(数据ads.sav)显示了某企业的广告投入和销售额之间的关系(万元)。 横坐标代表广告投入,而纵坐标代表销售收入。 看得出有何种关系吗? §1.4.1 定量变量间的关系 能否从该数据回答下面问题: 这两个变量是否有关系? 如果有,它们的关系是否显著? 这些关系是什么关系,能否用数学模型来描述? 这个关系是否带有普遍性? 这个关系是不是因果关系? §1.4.1 定量变量间的关系 关于因果关系 在可控制的试验中,较容易找到因果关系;比如治疗方式和疗效的关系等 但是,一般来说,变量之间有关系这个事实并不意味着一定存在明确的因果关系。 §1.4.1 定量变量间的关系 比如,中国GDP在一年中是快速增长的,而一个刚出生的巴拿马婴儿在这一年中的体重也是快速增长的 如果画出图来,它们有类似线性的关系 但它们显然没有因果关系 §1.4.1 定量变量间的关系 只要有关系,即使不是因果关系也不妨碍人们利用这种关系来进行推断。 比如利用公鸡打鸣来预报太阳升起;虽然公鸡打鸣绝对不是日出的原因(虽然打鸣发生在先) §1.4.1 定量变量间的关系 简单的办法(诸如画图)可以得到一些信息,但不一定能够给出满意的答案 需要更多的工具和手段来进行数值分析得到更加严格和精确的解答 因此,需要继续我们的课程 §1.4.2 定性变量间的关系 例1.2.下面是对123人进行关于某项政策调查所得结果的一个简单的三维表,它显示了人们的收入和性别对该项政策的观点。 计算机软件所应用的数据形式 §1.4.2 定性变量间的关系 从这个数据,希望可以看出收入、性别对观点是否有影响及如何影响 如果要得到更加精确的结论,就要进行进一步的分析和计算 这是后面列联表分析或多项分布对数线性模型的内容 §1.4.3 定性和定量变量间的混和关系 有些数据不是仅有定性变量或仅有定量变量 需要知道包括定性和定量两种变量的一些变量之间的关系 下面数据就包含两种变量 §1.4.3 定性和定量变量间的混和关系 该数据有2个定性变量(性别,污染程度)、一个定量变量(年龄)以及发生哮喘的人数 我们希望知道哮喘和这三个变量之间的关系 这将在Poisson对数线性模型中讨论 §1.5 统计、计算机与统计软件 现代生活越来越离不开计算机了 最初的计算机仅仅是为科学计算而设计和建造的。 统计是大型计算机的最早用户,现在仍然是数值计算的主要用户 §1.5 统计、计算机与统计软件 计算机的使用,从计算机语言到 “傻瓜式”地点击鼠标 输出结果也从数字输出到各种可以想象得到的形式。 输入数据,点鼠标做一些选项,就可得到漂亮结果 但其中充满了危险的陷阱? §1.5 统计、计

文档评论(0)

yanpan1 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档