- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第2章 数据分析导论 第2章(1) 数据的收集与描述 2.1 统计工作的步骤 2.2 统计学中的几个基本概念 2.3 抽样方法 2.4 数据资料的类型 2.1 统计工作的步骤 ?设计(design):制定计划,对整个过程进行安排。是整个工作的关键。如何进行设计? ?收集资料(collection of data):根据计划取得可靠、完整的资料。 ?整理资料(sorting data):原始资料的整理、清理、核实、查对,使其条理化、系统化便于计算和分析。 ?分析资料(analysis of data):统计学的关键所在。运用统计学的基本原理和方法,分析计算有关的指标和数据,揭示事物内部的规律 总体、个体与样本 总体(population):是根据研究目的性质相同的所有考察对象的全体. 个体(individual):是总体中的基本考察单位,可以是一个人、一个动物、一个家庭、一个地区、一份样品等。 样本(sample):是从总体中随机抽取的部分观察单位的集合。 样本的容量(simple size):样本中个体的数目,样本含量用 n 表示。 大样本: 小样本: 例1:为了解某地区初中二年级学生的身高情况,有关部门从初二年级中抽200名学生测量他们的身高,然后根据这一部分学生的身高去估计这一地区所有初二年级学生的平均身高. 说出总体,个体,样本和样本容量. 答: 总体是这个地区初二年级学生每人身高的全体; 每名学生的身高是个体; 从中抽取的200名学生的每人身高的集体是总体的一个样本; 样本容量是200. 例2. 为了考察某校初三年级360名学生的数学成绩,从中抽取了一个班46名学生的数学成绩进行分析,下列说法中正确的是 ( ) A.总体是360名学生 B.样本是一个班 C.样本容量是46 D.个体是每一名学生 例3. 为了考察试验地里棉花的高度,从中抽测了10株棉花植株的高度.在这个问题中,有以下四种说法: ⑴ 抽测的10株棉花,每株棉花植株的高度的集体是总体的一个样本; ⑵ 抽测的10株棉花植株的高度是样本容量; ⑶ 这块试验地里每株棉花植株的高度的全体是总体; ⑷ 每株棉花植株的高度是个体. 其中正确的说法有( ) A.1种 B.2种 C.3种 D.4种 参数与统计量(statistic and parameter) 统计量(statistic):描述样本的统计或分析指标,常用拉丁字母表示, 如 、p 、u值、t值等。 参数(parameter):描述总体的统计指标,常用希腊字母表示,如μ、? 、π等。 例要了解某地12岁健康男孩的平均身高μ(参数),今测得100名男孩身高值,求得平均数(统计量)。 变量和变量值 变量的数值表现就是变量值,也就是可变的数量标志和统计指标的不同取值。 例如,工资是一个变量,取有80元、100元、110元、130元等四个数值,要求计算其平均工资,不能说求这四个“变量”的平均数,因为这里只有“工资”这一个变量,并没有四个变量,所要平均的是“工资”这个变量的四个数值,即四个变量值。 变量、同质与变异 变量(variable): 收集资料中确定了的观察单位(Observation unit)称为个体,在统计工作中反映个体的特征称为变量。 观察指标的测定结果称变量值(Value of variance)。 如要调查某地中学生的健康状况,每一个要调查的学生称为个体,反映中学生的健康指标身高、体重、胸围、肺活量、体温、脉搏数、血压等都称作为变量。又如病人的年龄、性别、红细胞数、血红蛋白含量、患病时间等。 同质与变异(homogeneity and variation) ?统计的研究对象是由个体构成的群体,必须给个体规定一些相同的因素情况,称同质(homogeneity)。 ?变异(variation):同质个体间测定结果的差异。 变异 ?例研究儿童的身高,规定某地区、某民族、某性别、一定年龄的正常儿童,称同质,而同地区、同民族、同性别、同年龄的正常儿童的身高也有高有矮,称变异。 ?统计分析的任务就是在同质分组的基础上,通过对变异所呈现出的统计规律性的研究,透过偶然现象,揭示同质事物的本质特征和规律。 2.3 抽样的方法论sampling 2.3 抽样的方法(sampling) 简单随机抽样 (simple random sampling) 系统抽样 (systematic sampling) 分层随机抽样 (stratified random sampling) 整群抽样 (cluster sampling) 简单随机抽样Simple random sampling 简单随机抽样:在总体中以完全随机的
文档评论(0)