- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Charpter2 数据与数据的获得
2-1 总体、个体、特征与数据
2-2 数据类型
2-3 获得数据的调查方法
2-4 问卷设计
2-1 总体、个体、特征与数据
2.1 总体、个体、特征与数据
总体 ( Population or Universe)
所研究对象的全体,称为总体.例如,某专业同一年的考生可以构成一个总体,一条生产线上生产出来的某零件可以构成一个总体。
2.1 总体、个体、特征与数据
2. 个体( Individual Or Case) 或成分(Elements)
组成总体的元素(Element), 称为个体
有限总体:在某个总体中,若个体的数目是有限的Finite.
无限总体:总体中,个体的数目无限(Infinite)
2.1 总体、个体、特征与数据
3. 指标或变量(Variable)
研究任何总体,必然对其个体的某些特征感兴趣。
Ex:农民(总体)
附着于“个体”的信息,即个体特征
年收入
对政策的态度
受教育程度
2.1 总体、个体、特征与数据
表征个体特征(Characteristics)的量称为指标或变量. Ex:
“学生” ----------考分 身高
“零件” ----------直径 长度 耐磨损度
“药品”-----------疗效 副作用
“企业”------年销售额 年利润 资金周转率
2.1 总体、个体、特征与数据
我们对任何总体感兴趣,其实是对总体中的个体的特征感兴趣。当要联合考察总体或个体的若干个特征,我们面对的就是指标向量。
Ex: “学生” (考分 身高 年龄 性别 )
2.1 总体、个体、特征与数据
4. 指标值或数据(Data)
在研究一个总体时,所要研究的每个特征,在每个个体上,都有一个反映该特征的具体描述,被称之为指标值。
Ex:考生个体
考分(定量型Quantitative,有数值)
性别(定性型Qualitative)
受教育程度(半定量的Semi-Quantitative)
2.1 总体、个体、特征与数据
定性型的数据和半定量的数据,通常是对个体分组(分类)的依据.
一个个体的所有特征的数据,被称为一条记录或一个数据向量。
考生A(姓名,年龄,考分,成绩…)
2-2 数据类型
Scale 刻度级数据
数据的最高等级,只能用数字来表示
比率级Ratio : 有具体的实际测量值,可做+ - * / 运算.
间距级Interval: 具体有一定单位的实际测量值。例如摄氏温度。可比较变量之间的差异,作+ - 运算,不能进行* / 运算。
2.2.1 数据测度的分类
2. Ordinal 序次级数据
数据的中间级。可用数字,字母来表示
Ex: 受教育程度
小学 = 1
初中 = 2
高中 = 3
大学本科 = 4 研究生 = 5
各编码的序值,代表了受教育程度的高低差异。这一差异不能准确描述差别的大小,但可以确定其顺序,即可进行不等式运算。
研究生 大学本科 高中 …
3.(Nominal)名义级数据
数据的最低级,无次序之分,只是一种标志,用以区分变量的不同值。可用数字也可用字母。
Ex: 性别:女(0)
男(1)
女(F)
男(M)
在统计分析中,不同测度类型的数据扮演不同的角色。不同测度级别的数据,应用范围不同。 等级越高,应用范围越广泛;等级越低,应用范围越受限制。
2.2.2 不同测度类型的数据的用途
不同测度类型的数据都可以作为统计对象直接进入统计处理。
Ex: 当我们获得不同文化程度的顾客对某种数码产品的偏好数据后,我们可以用统计方法来分析两个变量(文化程度, 品牌)是否相关。
文化程度:顺序型变量
品牌:名义级变量
分类分组作用
Ex: 名义级变量Categorical Variable,“职工的性别”:将职工总体分为“男”“女”两组,统计不同组的平均工资。
顺序级变量也可作为分类得依据,“受教育程度”将职工总体分为教育程度由低到高的若干组。
刻度级数据可用于分类,如按照“考试成绩”将学生总体分类等等。
一般说来,等级高的数据,兼具等级低的数据的功能;而等级低的数据,不可能兼有等级高的数据的功能。
名义级的数据,通常是样本分类(分组)的依据。
2.2.3 观察数据与实验数据
从数据获得的角度对数据进行分类
观察数据:
在获得数据过程中,不对被调查对象数据产生的条件施加任何控制所得到的数据。观察数据通常是众多因素共同作用的结果。
Ex: 调查农民年收入情况,农业技术来源情况,受教育情况,地区差异等等通常为观察数据。
农民的年收入显然是众多因素复合作用的结果。
实验数据:在获得数
文档评论(0)