- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
统计学主观题答案
数据采集遇到异常值?统计上与均值差异在3倍标准差范围之外的值称为异常值(离群点).一般用标准分数来判断一组数据是否是离群数据。其公式为z。例如:若z=-1.5,就知道该数值低于平均数1.5倍标准差,该点不是离群点。根据切比雪夫不等式,至少有1-1/k^2个数据落在+-k个标准差范围内。对异常值要仔细鉴别,处理方法有:如果异常值属于记录时的错误,在分析之前就应予以纠正或舍弃。如果异常值是一个正确的值,应予以保留。根据经验法则,若一组数据对称分布,一般有99%的数据落在+-3个标准差范围内。95%的数据落在+-2个标准差范围内。68%的数据+-1个标准差范围内。抽样误差?抽样误差是由抽样的随机性而引起的样本结果与总体真值之间的误差。在概率抽样中,我们依据随机原则抽取样本,抽取的样本可能不同。根据不同的样本,可以得到不同的观测结果。抽样误差并不是针对某个具体样本检测结果与真实结果的差异而言,所以抽样误差是样本可能的结果与总体真值的平均差异。抽样误差与多方面的因素有关,样本量越大,抽样误差就越小。抽样误差还与总体的变异有关。抽样平均误差的公式为。抽样误差又分为组内误差和组间误差。组内误差即为来自水平内部的数据误差,组间误差为不同水平之间的数据误差。组内误差只含随机误差,组间误差是随机误差和系统误差的总和。请举例说明统计学上所计算的抽样误差与我们平常说想象的抽样误差有什么不同? 抽样误差是由于样本随机性引起的样本结果与总体真值之间的误差。我们平时想像的抽 样误差可能是针对某个具体的样本的检测结果与总体真实结果的差异而言的。然后统计学上的抽样误差描述的是所有样本可能的结果与总体真值之间的平均性差异。例如:95%的样本结果与真值之间的差异上下不超过2%的范围。按照平常的理解,真值并不知道则无法得出这样的结论。而在统计学上,我们发现对不同样本进行检测时其分布是有规律的,于是可以通过样本的信息计算出这个误差。例如:如果真实值为10%,则样本结果95%会落在8%-12%内。那么以10%为中心,结果在2%的范围内波动,这是统计学上的抽样误差。简述影响抽样误差大小的因素。抽样误差:指由于抽样的随机性引起的样本结果与总体真值之间的误差。影响抽样误差的大小如下:①抽样单位的数目。在其他条件不变的情况下,抽样单位的数目越多,抽样误差越小;抽样单位数目越少,抽样误差越大。这是因为随着样本数目的增多,样本结构越接近总体。抽样调查也就越接近全面调查。当样本扩大到总体时,则为全面调查,也就不存在抽样误差了②总体被研究标志的变异程度。在其他条件不变的情况下,总体标志的变异程度越小,抽样误差越小。总体标志的变异程度越大,抽样误差越大。抽样误差和总体标志的变异程度成正比变化。这是因为总体的变异程度小,表示吝惜体各单位标志值之间的差异小。则样本指标与总体指标之间的差异也可能小;如果总体各单位标志值相等,则标志变动度为零,样本指标等于总体指标,此时不存在抽样误差。 ③抽样方法的选择。重复抽样和不重复抽样的抽样误差的大小不同。采用不重复抽样比采用重复抽样的抽样误差小。 ④抽样组织方式不同。采用不同的组织方式,会有不同的抽样误差,这是因为不同的抽样组织所抽中的样本,对于总体的代表性也不同。通常,我们不常利用不同的抽样误差,做出判断各种抽样组织方式的比较标准。 离散系数?方差和标准差是反映数据离散程度的绝对值,其数值大小一方面受平均数大小的影响,变量值绝对水平高的,离散程度的测度自然也就大;另一方面,他们与原变量值的计量单位相同,所用不同计量单位计量的变量值,其离散程度的测度值也就不同。对于平均水平不同和计量单位不同的不同组别的变量值,是不能用标准差直接比较其离散程度的离散系数,又称变异系数,是一组数据标准差与其平均数的比值消除了变量值水平高低和计量单位不同对离散程度测量的影响离散系数越大,说明数据的离散程度越大。举例:男生平均身高175cm,标准差10cm;女生平均身高165cm,标准差3cm。由于男生女生身高的平均数不同,无法直接比较其标准差,所以可以采用离散系数,消除了平均数不同的影响,反映其数据离散程度大小。通过计算,男生身高离散系数为0.057,女生身高离散系数为0.018,男生生身高离散系数高于女生,所以男生身高离散程度较大。 统计上的大样本和小样本?统计上的大样本和小样本并不是以样本量大小来区分的。在样本量固定的条件下进行的统计推断、问题分析,不管样本量有多大,都称为小样本问题。而样本量n趋近无穷的样本条件下进行的统计推断、问题分析则称为大样本问题。一般而言统计学中n30,即为大样本,n30,为小样本,这只是一种经验说法。样本量不同,统计计算方法也不同。假设检验,区间估计的值也会不同。一般来说,大样本情况下,根据中心极限定理,可以认为样本统计量的分布服从或接近于正态
文档评论(0)