- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
*三、方差与标准差所谓方差(Variance),观察值与其均值之差的平方和除以全部观察总数N。方差的平方根就是标准差(Standarddeviation),用或S*表示以均值作代表值时引起的偏差或错误,也就是说用均值来估计或预测各个个案的数值,所犯的错误()平均是σ标准差是用得最多,也是最重要的离散量数的统计量;方差是统计学上的一个重要概念,在以后的统计方法学习过程中会进一步了解;只适用于定距层次的变量;*总体方差和标准差:未分组数据:分组数据:方差的计算公式标准差的计算公式*样本方差和标准差
分组数据:未分组数据:分组数据:方差的计算公式标准差的计算公式注意:样本方差用自由度n-1去除!未分组数据*样本方差的
自由度(degreeoffreedom)一组数据中可以自由取值的数据的个数当样本数据的个数为n时,若样本均值?x确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值例如,样本有3个数值,即x1=2,x2=4,x3=9,则?x=5。当?x=5确定后,x1,x2和x3有两个数据可以自由取值,另一个则不能自由取值,比如x1=6,x2=7,那么x3则必然取2,而不能取其他值样本方差用自由度去除,其原因可从多方面来解释,从实际应用角度看,在抽样估计中,当用样本方差去估计总体方差σ2时,它是σ2的无偏估计量*注意:有些书中,也提到抽样的样本较大时,在样本方差和标准差的计算中,n-1和n计算出来的数值相差不大,因此有些计算中直接将样本中的个案数目用n表示,而不用n-1,如李沛良的书。*1、未分组资料标准差计算【例5】:求标准差,并进行简单比较。中文系:78,79,80,81,82(=80)数学系:65,72,80,88,95(=80)英语系:35,78,89,98,100(=80)解:根据公式σ(中文系)=1.414分σ(数学系)=10.8分σ(英语系)=23.8分结论:中文系差别最小,英语系差别最大。*2、分组资料标准差的计算公式其中Xm是每组的组中值,f是该组的次数*例6青年人阅读小说的数目*四、极差/全距(Range)1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布未分组数据R=max(Xi)-min(Xi).=组距分组数据R最高组上限-最低组下限5.计算公式为*小结1、集中趋势测量和离散趋势测量具有互补性,集中趋势反映的是资料的代表性,离散趋势反映的是资料的差异情况;2、选何种方法,要注意变量的测量层次,彼此的关系综合如下:*谢谢!*分组变量看作是一组连续的数值259435124?106103012*【例】:根据下表数据求中位值。解:Md位置=50;从累积频数cf栏找到中位数位置所在组为“300-400”引入公式:*三均值1、均值的定义:总体各单位取值之和除以总体单位数目。2、仅适用于定距变量,不适用于定类和定序;*(一)未分组数据
(1)简单原始资料求均值*【例】某班10名学生年龄分别为20、21、19、19、20、20、21、22、18、20岁,求他们的平均年龄。解:根据平均数的计算公式有:*(1)加权平均数某个变项值重复出现多次,可以先统计每个值(x)的次数(f),再求次数与相应变量值的乘积(fx),利用各乘积之和求出均值。(f也称为权数,f/n称为权重)公式:*未分组数据加权平均数【例6】调查某年120名学生的年龄,结果如下表,求平均年龄。解:根据公式得=18.9岁*(二)分组资料求均值:
根据组中值求均值先求出组中值组中值=(上限+下限)/2计算组中值的和计算分组数据的均值组中值*众值、中位数和均值的比较注:▲表示该数据类型最适合用的测度值*众数、中位数和平均值的比较众数是一组数据中出现次数最多的数值。但在社会调查中众数的代表性较小;计算平均数时用到数据中所有的数值,而求中位数时只用到数值的相对位置,平均数比中位数利用了更多的有关数据的信息;平均数容易受到极端值的影响,而中位数则不会受这种影响。当样本中数据值的分布是高度倾斜的,中位数一般比平均数更适合一些。*对随机抽样调查来说,平均数比中位数更稳定,它随样本的变化比较小;平均数比中位数更容易进行算术
文档评论(0)