- 7
- 0
- 约2.43千字
- 约 22页
- 2016-04-13 发布于浙江
- 举报
SPSS中关于数据的收集
统计学 ─从数据到结论 第二章数据的收集 §2.1 数据是怎样得到的? 可从报纸、电视、互联网、年鉴等方面看到各种数据 并且从这些数据可以提取对自己有用的信息。 这些间接得到的(并非自己收集的)数据都是二手数据。 §2.1 数据是怎样得到的? 获得第一手数据要困难得多 某方便面企业每年至少花三四千万元来收集和分析数据 调查其产品及竞争者在市场中的状况、各种类型消费者对其产品的态度、收集各地方的经济交通等信息等等 §2.1 数据是怎样得到的? 他们如同间谍,收集各种情报 他们很舍得在这方面花钱。因为市场信息数据是企业生存所必需的,绝不是可有可无的。 §2.1 数据是怎样得到的? 在自然的未被控制的条件下观测到的数据,称为观测数据(observational data)。 在人工干预和操作情况下收集的数据就称为试验数据(experimental data)。 同学们自己可以举出大量的观测数据和试验数据的例子 §2.2 个体、总体和样本 需要调查北京市民对交通规则的观点;对象是所有市民, 目的是希望知道市民中对该问题的不同看法各自占有的比例 显然,不可能去问所有的北京市民,而只能够问一部分; 并且根据这一部分的观点来理解整个北京市民的总体观点。 §2.2 个体、总体和样本 在这个例子中,单个北京市民的观点称为个体(element) 所有北京市民对这个问题的观点为一个总体(population),总体是包含所有要研究的个体的集合。 §2.2 个体、总体和样本 而调查时问到的那部分市民的观点(也就是部分个体)称为该总体的一个样本(sample),是总体的一部分。 也有可能试图调查所有的人(比如人口普查),那叫做普查(census)。 §2.2 个体、总体和样本 在抽取样本时,如果总体中的每一个体都有同等机会被选到样本中,这种抽样称为简单随机抽样(simple random sampling), 而这样得到的样本则称为随机样本(random sample)。 §2.2 个体、总体和样本 如果总体是一锅八宝粥,随机样本则是充分搅拌后的八宝粥中的任意一勺 该勺中的八宝粥的成分比例应该和整个一锅粥类似 搅拌越充分,样本的代表性也越好 §2.3 收集数据时的误差 一勺八宝粥中的成分比例和整锅不尽相同,可能稍微多些或稍微少些。这是很正常的,因为样本的特征不一定和总体完全一样 这种差异不是错误,而是必然会出现的抽样误差(sampling error)。 §2.3 收集数据时的误差 抽样调查中,人们因为种种原因没有对调查做出反映,这种误差称为未响应误差(nonresponse error)。 一些人因为各种原因回答时并没有真实反映他们的观点,这称为响应误差(response error)。 §2.3 收集数据时的误差 和抽样误差不一样,未响应误差和响应误差都会影响对真实世界的了解 应该在设计调查方案时和进行调查过程中尽量避免 §2.4 抽样调查时获得数据的一些常用方法 在抽样调查时,最理想的样本是随机样本。但是实践起来不方便 在大规模调查时一般不用全部随机抽样的方式,而只是在局部采用随机抽样的方法。 §2.4 抽样调查时获得数据的一些常用方法 下面介绍的几种抽样方法没有深奥的理论;读者完全可以根据常识判断在什么情况下获取简单的随机样本不方便以及每个方法有什么好处和缺陷。 实际上,一般仅有少数人有机会来确定抽样方案。读者仅需把这些方法当成常识来了解就可以了(或者跳过这部分) §2.4 抽样调查时获得数据的一些常用方法 分层抽样(stratified sampling)。这是先把要研究的总体按照某些性质分类(stratum),再在各类中分别抽取样本。 比如,按教育程度把感兴趣的人群分成几类;再在每一类中调查和该类成比例数目的人,以确保每一类都有相应比例的代表。 §2.4 抽样调查时获得数据的一些常用方法 整群抽样(cluster sampling)先把总体划分成若干群(cluster),再(通常是随机地)从这些群中抽取几群;然后再在这些抽取的群中对个体进行简单随机抽样。 比如,在某县进行调查,首先在所有村中选取若干村子,然后只对这些选中的村子的人进行调查。如果各村情况差异不大,这种抽样还是方便的。 §2.4 抽样调查时获得数据的一些常用方法 多级抽样(multistage sampling)。 在群体很大时,往往在抽取若干群之后,再在其中抽取若干子群,甚至再在子群中抽取子群,等等。最后只对最后选定的最下面一级进行调查。 比如在全国调查时,先抽取省,再抽取市地,再抽取县区,再抽取乡、村直到户。每一级都可能采取各种抽样方法。也称为多级混和型抽样。 §2.4 抽样调查时获得数据的一些常用方法 系统抽样(systematic sampling)。这是先把总体中的每
您可能关注的文档
- google glass api 开发指南(google翻译附英文).doc
- ii采区专用回风上山(修订版)12.8.doc
- ivms-7200-sdk接口应用开发说明文档.doc
- iris数据的结果分类.doc
- iso13485ㄩ2003医疗技术规范.ppt
- james简单运行配置.doc
- gc-2010维护讲解.ppt
- java中arraylistmapobject与json互相转换.doc
- javascript计算器(包含累计与显示功能).doc
- java使用shell脚本.doc
- 全过程工程管理造价咨询工程监理项目服务方案投标方案(技术部分).doc
- 招标代理服务投标技术服务方案(技术方案).doc
- AI大模型与AIGC技术在公安领域的应用解决方案(99页 PPT).pptx
- 工业4.0智能制造数字工厂规划方案.pptx
- 树立社会主义核心价值观.docx
- 三年(2023-2025)中考历史真题分类汇编(全国)专题21 科技文化与社会生活(解析版).docx
- 2025年中考道德与法治真题完全解读(吉林卷).pdf
- 2025年中考道德与法治真题完全解读(安徽卷).pdf
- 三年(2023-2025)中考历史真题分类汇编(全国)专题14 人民解放战争(解析版).pdf
- 三年(2023-2025)广东中考历史真题分类汇编:专题03 中国近代史(八年级上册)(解析版).docx
最近下载
- Leica_TS16_UM_v2-0-0_zh-徕卡实用说明书.pdf VIP
- 医院感染暴发控制标准2025版课件.pptx VIP
- 医学免疫学(全套课件272P)ppt课件.pptx VIP
- 古建筑安全监测技术标准.pdf VIP
- A4版2023安徽省中考数学答题卡.pdf
- Vaillant威能VIH CN 水罐参数技术参数.pdf
- 喷墨打印OLED技术全球竞争格局与发展策略.docx VIP
- 2025年9月山西医科大学附属晋中医院(晋中市第一人民医院)招聘编制外人员38人笔试模拟试题及答案解析.docx VIP
- 2025年9月山西医科大学附属晋中医院(晋中市第一人民医院)招聘编制外人员38人考试参考试题及答案解析.docx VIP
- 人教版物理8年级下册全册教学课件.pptx
原创力文档

文档评论(0)