- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第一章
总体:根据研究目的的所确定的同质研究对象的全体。总体特征:同质性,大量性,差异性。
样本:从总体中随机抽取用以推测总体性质的部分对象。
参数:代表总体特征的统计指标称为参数。总体参数(在统计学中,描述总体变量特征的指标)
统计量:由样本所得关于样本特征的统计指标,称为统计量。(样本统计量:描述样本变量值特征的指标。)
3个问题
抽样目的:推测总体的性质
抽样原则(如何保证样本代表性):随机化原则。使总体每一个个体都有相同的可能性被抽到样本中。保证足够的样本含量。
参数和统计量特点; 参数:求知的,固有的,不变的。统计量:已知的,变化的,有误差的。
一个例题,指出总体样本样本含量。(举例)
1.为了检查一批零件的质量,从中抽取10件。 这个问题中的总体,个体,样本,样本容量各指什么?
总体:这批零件。个体:每件零件。样本:10件零件,HYPERLINK /search?word=%D1%F9%B1%BE%C8%DD%C1%BFfr=qb_search_expie=utf8样本容量:10
要了解灯泡厂某种灯泡的使用寿命,从中抽查了20只进行寿命试验,在此问题中,这20只灯泡使用寿命总体:某种灯泡的使用寿命。个体:每一只灯泡的使用寿命。样本:抽取的20只灯泡的寿命。样本容量:20
为了研究2008年某市15岁男少年的身高发育情况,现从该市20所中学里随机抽取300名15岁男生,测其身高数据,试描述该问题中的总体、个体、样本、样本含量。
总体:2008年该市15岁男少年的身高全体
个体:总体中的每一个15岁男少年的身高
样本:总体中被抽取的300名15岁男生的身高
样本含量:300
第二章
p17收集资料应该注意的问题:1.保证资料的科学性2.保证资料的完整性3.保证资料的持久性4.保证资料的代表性5.注意简介资料的核实与评价。
完整性:是指无论作横向的对比、归纳,还是纵向的观察,都必须掌握较完整的资料。
有效性:反映观察事物的本质特征。
可靠性:误差不能超过规定的误差范围。
代表性:①样本要有足够的样本含量。
②确保抽样的随机性。
P18 影响资料正确性的主要因素:1.测试者2.受试者3.标准化,规范化程度。
P23连续型变量频数分布表:1.制作步骤:确定分组数,极差,组距和组限。
连续型频数分布表作用:1.整理数据便于进一步计算2.可发现某些特大或特小的异常数据3.可发现数据的特征和形态。(看出形态,正态还是偏态。怎样辨别:大部分数据集中在中间的是正态,在上或下的是偏态)
分组的原则
一般来说不能分的过细或者是过于粗略,否则:
(1)不能看出数据的特征与形态。
(2)不便于进一步计算。
累计频数概念:从第一组到该组的所有频数之和。
:样本特征数
1.集中量数:反映集中趋势的统计量称为集中量数。常用的集中量数有:
(1)算术平均数
(2)中位数
(3)众数
算术平均数
定义:所有观察值之和除以总频数,简称均数。
样本均数: 总体均数:
含义:反映同质研究对象观察值的平均水平与集中趋势的统计量。
优点:
(1)均数作为反映变量的集中量数,既考虑到频次的多少,又考虑到每一个变量值的大小,故它是可靠的、灵敏的,也是对资料提供信息运用最充分的。
(2)均数适合代数运算,计算方便,因此是一个用途最广、效果最好的集中量数。
缺点:
(1)均数易受少数极端数据的影响而大大改变其数值,从而相对削弱它作为集中量数的代表性。
适应范围:
数据严重偏态分布时,一般不用均数反映它的集中趋势。一般应用于正态或近似正态的数据。
中位数
定义: 是把各个变量值按大小顺序排列后,位于序列中间的数,称为中位数,是一种位置指标,反映数据集中趋势的一个统计量。记为:
含义:反映一组观察值在位置上的平均水平。
优缺点:
(1)由于中位数只受居中变量值的影响,故它不够灵敏、充分。
(2)不会受到极端数据的影响。
适用条件:
适用于任何分布资料,特别是偏态分布、分布不明、分布末端无确定值。
众数
定义:在一次实验中出现次数(频数)最多的观察值;在频数分布表中对应于数据最集中所在位置的观察值。记作:
适应条件:适用于大样本;较粗糙
全距(极差)该组数据的最大值与最小值的差。
方差
定义: 离均差平方和除以该组数据的总频数。 其公式为:总体方差:
样本方差:
含义:表示每个观察值的平均离散程度,方差越大,说明数据的离散程度越大。
优点:
(1)灵敏性、严密确定、充分性。
(2)可以比较不同数目同质数据的各组数据资料。
缺点:
(1)容易受到极端数据影响。
(2)它的单位与观察值的单位不同,是观察值单位的平方,这给我们解释实际问题造成了一些麻烦
文档评论(0)