变异量数与分布形状.PPTVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第3章 變異量數與分佈形狀 前言 只用集中量數來描述資料是不夠的。忽略了資料點的分散情形,可能會做出錯誤的判斷。 以下介紹幾種反映資料分散情形的量數,包括全距、四分位距、平均絕對離差、標準差等。除此之外,利用數字呈現資料的集中和分散情形,不如直接呈現資料的分佈圖。 第一節 變異量數 (1) 全距/範圍(range) 全距就是最大值減最小值。全距越大表示分數的離散程度越大。 Excel並沒提供函數直接計算全距。不過可利用MAX求得最大值,用MIN求得最小值,然後相減即得全距。除此之外,也可利用Excel提供的「敘述統計」內設功能,求得最大值和最小值。 第一節 變異量數 (2) 四分位距(interquartile range) 如果將數值由小至大排列,第N個分數就是第一個四分位數(quartile),以Q1來表示;第N個分數就是第二個四分位數(Q2),Q2也就是中位數;第N個分數就是第三個四分位數(Q3)。 所謂四分位距就是: Q = (Q3 - Q1) 第一節 變異量數 (3) 平均絕對離差(mean absolute deviation) 每個分數減去平均數,叫做離均差(deviation from the mean)。離均差取絕對值後加總,再取其平均值就是平均絕對離差。即: 第一節 變異量數 (4) 例如1, 2, 3, 4, 5等數字的平均數為3,離均差分別為-2, -1, 0, 1, 2。絕對值離均差為2, 1, 0, 1, 2。 Excel的AVEDEV函數可用以計算平均絕對離差。如鍵入「=AVEDEV(1,2,3,4,5) 」就可以得到平均絕對離差為1.2。 第一節 變異量數 (5) 變異數(variance) 如果資料是母體,變異數就是每個分數減去母體平均數(即離均差),加以平方,然後加總,最後除以個數,即為變異數(可想成:離均差平方的平均數)。 第一節 變異量數 (6) 例如有一公平骰子,令出現點數為X,數值分別為1, 2, 3, 4, 5, 6。則X的平均數為3.5,變異數為2.92。 第一節 變異量數 (7) 如果是從母體抽取少數樣本時,樣本變異數(sample variance)算法為 第一節 變異量數 (8) 例如有5個資料點為樣本,數值分別為1, 2, 3, 4, 5,則樣本平均數為3,樣本變異數為2.5。 第一節 變異量數 (9) 標準差(standard deviation) 標準差就是變異數開根號。 可分為母體標準差和樣本標準差。 第一節 變異量數 (10) Excel的VARP和VAR兩函數分別用以計算母體變異數和樣本變異數。 STDEVP和STDEV則分別用以計算母體標準差和樣本標準差(其中P代表母體population)。 「=VARP(1,2,3,4,5)」得母體變異數為2。 「=VAR(1,2,3,4,5)」得樣本變異數2.5。 「=STDEVP(1,2,3,4,5)」得母體標準差1.414。 「=STDEV(1,2,3,4,5)」得樣本標準差1.581。 第一節 變異量數 (11) 變異係數(coefficient of variation) 標準差除以平均數就是變異係數。 由於計算變異數(或標準差)時,因為每個值都要減去平均數,因此變異數必然受到平均數的影響。為了避免變異指標受到平均數的影響,將標準差除以平均數,形成變異係數。 第一節 變異量數 (12) 在一項實驗裡,實驗組接受了某種閱讀技巧訓練,控制組則無,每組各10人。 實驗組的標準差3.52約為控制組7.01的一半,控制組的變異係數0.14不到實驗組0.35的一半。 第二節 各種變異量數的比較 (1) 全距的優點在於計算容易,容易理解。缺點是只利用最大和最小值,完全漠視了其他值的存在,無法精確反應所有資料的分散情形。 四分位距將極端的前1/4和後1/4去除,而利用第三個與第一個四分位數的差距來表示分散情形,因此避免了全距受到極端值影響的缺點。不過,四分位距的計算顯然不如全距來得方便,因為必須將資料由小到大排序。和全距一樣,四分位距也沒使用到所有的資料點。 第二節 各種變異量數的比較 (2) 平均絕對離差則使用了全部的資料,這是比較恰當的作法。此外,平均絕對離差也蠻容易理解。不過,由於計算平均絕對離差必須先求絕對值,因此運算並不方便。 標準差和平均絕對離差的意義非常類似,因此不難理解。變異數及標準差還有方便四則運算,以及可用以推估母體參數(母體變異數、母體標準差)的好處,因此是推論統計的基石。 第二節 各種變異量數的比較 (3) 變異數(標準差)比平均絕對離差容

文档评论(0)

yuxiufeng + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档