第一單元統計學基本概念介紹 - HiNet.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
全距 全距(range):就是最大值減最小值(Max-Min)。 Ex : 6位個案的血壓:86、88、100、102、110、240,全距等於 和平均值的特性一樣:是常用但不穩健的統計值。(不穩健=易受極端值或特殊情形的影響而失真) Ex : 全班血壓全距等於0 (大家血壓都一樣) Ex : 全班血壓全距非常大 (全距被最大值與最小值所遮蔽) 內四分位距 內四分位距iInterquartile range (IQR):資料由小排到大,剔除左右各25%的資料後。 內四分位距(續) 四分位數Q1~Q3 (Quartile) 第一四分位數 (Q1),又稱「較小四分位數」,等於該樣本中所有數值由小到大排列後第25%的數字。 第二四分位數 (Q2),就是「中位數」,等於該樣本中所有數值由小到大排列後第50%的數字。 第三四分位數 (Q3),又稱「較大四分位數」,等於該樣本中所有數值由小到大排列後第75%的數字。 內四分位距(續) IQR優點 : 1)剔除的個案容易包含極端值,相對全距而言比較穩健。 2)Q2-Q1與Q3-Q2有差異,可用於檢驗平均值是否不適用了。 3) Q2-Q1與Q3-Q2可用於檢驗左偏(negative)或右偏(positive)。有偏態,平均值不適用了。 如何找Q1、Q3 左右夾擊法 Ex : 10、40 、 50 、 60 、 80 、 120 、 160 、 180 、 180 、 800(已由小到大排列) 會遇到多少夾擊的情況? 如何找Q1、Q3(續) 夾擊的情況 小到大 大到小 小到大 大到小 2數取平均 小到大 大到小 小到大 大到小 內四分位距的衍生概念 平均差 標準差 以上指標的計算步驟 HW1-2 例1:求樣本數據5、8、1、2、4的平均數、變異數、標準差? 平 變異係數 變異係數(續) 偏態 單峰分配有三種型態的偏態 1)對稱:平均數=中位數 2)右偏:平均數中位數 3)左偏:平均數中位數 統計圖 前面說過敘述統計=描述data型態,統計圖是資料整理後的呈現,常見的統計圖可分為以下幾種: a)直方圖 b)次數多邊圖 c)圓餅圖 d)直方圖 e) 莖葉圖 f) 盒鬚圖 直方圖 直方圖(histogram):適用於等比、等距資料,橫軸為資料數值,縱軸為資料數值出現次數。因此直條的高度或面積表示資料設值佔所有觀察次數的累積,容易觀察極端值。 30位病患之血壓分佈圖 次數多邊圖 次數多邊圖(frequency polygon) 適用於等比、等距資料,與直方圖相似,表達資料數值的分佈情形。不同的地方是此圖不以長條形狀出現,而是將直條的中點連在一起把直方圖中各組中心點用線連起來,適於做多組比較。 長條圖 長條圖(bar chart):直條的高度或面積也表示資料設值佔所有觀察次數的累積。 你能分辨直方圖(histogram)與長條圖(bar chart)的不同嗎? 長條圖用以表達類別資料的次數分配表 圓餅圖 圓餅圖(PieChart):以一圓餅圖代表資料的全部,各數值出現次數多寡佔整個圓形的百分比來表示。 圖:30位病患之血壓圓餅圖,高血壓(收縮壓140 mmHg)及正常(80 mmHg~110 mmHg) 莖葉圖 主要是可以提供差異性之間的比較,這比直方圖好的優點在於實際確實的數字仍然保留在圖中。 以資料為二位數34為例,十位數3為莖,個位數4為葉,所有數字經莖與葉的分析後,才依大小排成莖葉圖。 二位數以上的數字,莖與葉的位置可依研究當時的需求決定。 例:原始資料54 56 57 59 63 64 66 68 68 72 72 75 76 81 84 88 106 圖表形成: ?1?| ? 2 | ? 3 | ? 4 | ? 5 | 4 6 7 9 ? 6 | 3 4 6 8 8 ? 7 | 2 2 5 6 ? 8 | 1 4 8 ? 9 | 10 | 6 再把此圖繪成直方圖 莖葉圖(續) 莖葉圖優點在於除具有直方圖的優點,也可保持原有資訊(直方圖失去原始數據資訊),更可在數據遭誤植或遺漏時,可以立即追蹤檢查,不必全部重做。 缺點只適用於數量有限的資料,大量的資料會有太多莖與葉,也是數不完。 盒鬚圖 盒鬚圖不繪製實際的觀察值,而顯示分配的總計統計量(summary-statistics), 其可用以檢驗資料的極端量數及分配的型態。 盒鬚圖主要以Q1、Me、Q2、min、 max(5數綜合,five numbers summary)來表現資料的分布狀態。 盒鬚圖(續) 繪製方式: 盒子的長度即是代表內四分位數的範圍(interquartile range), 亦即是第3四分位數與第1

文档评论(0)

yingzhiguo + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5243141323000000

1亿VIP精品文档

相关文档