第五讲参数估计.ppt

第五讲 参数估计 * PPT课件 一、参数估计 参数估计就是通过样本统计量对总体的未知参数进行估计,简称参数估计。 1、要有合适的统计量作为参数估计量。 2、要有合理的允许误差范围。允许误差范围又称抽样极限误差,指样本统计量与被估计总体参数离差的绝对值可允许变动的上限或下限。抽样极限误差反映估计的准确性问题 3、要有一个可接受的置信度。估计置信度又称估计推断的概率保证程度,这是估计的可靠性问题。 4、以样本的统计值来估计总体的参数值,有两类做法,一类是点估计,另一类是区间估计。 * PPT课件 二、点估计 点估计,以一个最适当的样本统计值来代表总体的参数值。 我们用样本值作为总体均值的点估计,用样本方差作为总体方差的点估计。 对于是定类变量,X取值为(1,0),可以用样本成数作为总体成数估计值。 * PPT课件 优良估计量的三个标准 (1)无偏性。即样本统计量的期望值(平均值)等于被估计的总体参数。   虽然每一次抽样,所决定的统计量取值和总体参数的真值可能有误差,误差可正可负,可大可小,但在多次反复抽样中,所有样本统计量取值的平均数应该等于总体参数本身。 (2)一致性。即当样本的单位数充分大时,样本统计量充分靠近总体参数。 (3)有效性。即作为优良估计量的方差比其他估计量的方差小。 * PPT课件 例1、工会为了解春游期间需租用几辆公共汽车,在全厂10000名职工中随机抽取100人进行调查。结果显示,其中有20名愿意外出旅游。设每辆车可载乘客50名,问估计要预租多少辆公共汽车? 解:P=20/100=0.2 可以用P 作为愿意外出春游总体成数的点估计,因此全厂估计将有: 10000*0.2=2000(人) 参加春游。又因为每辆公共汽车可容乘客50人,因此有: 2000/50=40(辆) * PPT课件 三、区间估计 1、置信区间 区间估计又称置信区间,是用来估计参数取值范围的。它是根据给定的置信度要求,指出总体参数被估计的上限和下限。 2、置信度与显著性水平 对于总体被估计参数θ,找出样本的两个估计量θ1和θ2,(θ1θ2)使被估计参数落在区间(θ1,θ2)内的概率为1-α,其中α为介于0—1之间的已知数,即 P(θ1≤θ≤θ2)=1-α 称区间(θ1,θ2)为总体参数的估计区间,θ1为估计下限,θ2为估计上限,1-α为估计置信度(表示用置信区间估计的可靠性),α为显著性水平(表示用置信区间估计不可靠的程度)。 * PPT课件 3、置信区间与置信度的关系 置信区间指出被估计参数的可能范围,置信度为对参数落在这一范围内给定的概率保证程度。 参数的可能范围是估计的准确性,而相应的概率保证程度(置信度)是估计的可靠性。 在作估计时我们常常希望准确性尽可能提高,而且可能性也不能小,但这两个要求是矛盾的。在样本容量不变的条件下,要缩小估计区间,提高估计的准确性,势必减少置信度,降低估计的可靠性。 * PPT课件 样本变量 34 38 42 46 50 34 34 36 38 40 42 38 36 38 40 42 44 42 38 40 42 44 46 46 40 42 44 46 48 50 42 44 46 48 50 样本日平均工资 频数 频率 34 1 1/25 36 2 2/25 38 3 3/25 40 4 4/25 42 5 5/25 44 4 4/25 46 3 3/25 48 2 2/25 50 1 1/25 合计 25 1 例2、用有放回抽样的方法,从5人中间抽取2个构成样本,求样本日平均工资, 并推算总体的工资水平置信区间 * PPT课件 1、计算样本日平均工资为42, 方差为33。 2、根据以上分布资料可以写出样本日平均工资落在各种区间的概率p。例如: P(40≤ ≤44)=(4/25)+(5/25)+(4/25)=13/25 P(38≤ ≤46)=(3/25)+(4/25)+(5/25)+(4/25)+(3/25)=19/25 P(34≤ ≤50)=(1/25)+(2/25)+(19/25)+(2/25)+(1/25) =1 以上计算说明:在重复抽样中,样本日平均工资与总体日平均工资的绝对离差不超过2元的概率为13/25,即有52%的概率保证总体日平均工资落在40—44元之间。同理,抽样误差不超过4元的概率为19/25=76%,抽样误差不超过8元的概率为100%。 * PPT课件 假定我们以Z表示概率

文档评论(0)

1亿VIP精品文档

相关文档