scm1.2.ppt.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
scm1.2.ppt

Section 1.2 Describing Distributions with Numbers 用數字描述分配 用統計數字說話 描述資料中心(center)位置的統計數字: 平均數(mean)。 中位數(median)。 描述資料分散(spread)程度的統計數字: 四分位(quartiles) 四分位間距(Interquartile range) 標準差(standard deviation)。 平均數(mean) 所有資料加總除以資料個數即為平均數。 n 筆資料分別為x1, x2, …, xn則均數為 簡記為 中位數(median) 將所有資料由小到大排序後,排在最中間的數,稱為中位數,記為M。 n 筆資料的中位數 若 n 為奇數,則排序第(n +1)/2為中位數。 若 n 為偶數,則排序第 n /2與第 n/2 +1的平均數為中位數。 平均數與中位數的比較 對稱資料 平均數與中位數的數字相當。 偏斜資料(skewed data) 左偏斜資料(skewed to the left): 中位數在平均數的右邊,即中位數大於平均數。 右偏斜資料(skewed to the right): 中位數在平均數的左邊,即中位數小於平均數。 右偏斜資料 (Figure 1.4) Skewed (to the Right) Distribution 右偏斜分佈 Figure 1.15(b) Symmetric Distribution 對稱分佈 Figure 1.15(a) 四分位數(quartiles) 將所有資料由小到大排序後, 排在前面 ? 位置的數,稱為第 1 四分位數,記為 Q1。 Q1也可視為前半資料的中位數。 排在前面 ? 位置的數,稱為第 3 四分位數,記為 Q3。 Q3也可視為後半資料的中位數。 四分位間距(inter-quartile range) 例題1.9 Mark McGwire 的全壘打數: (偶數) 9 9 22 32 33 39 39 42 49 52 58 70 Q1 M Q3 Babe Ruth 的全壘打數: (奇數) 22 25 34 35 41 41 46 46 46 47 49 54 54 59 60 Q1 M Q3 五數總結與盒形圖 五個重要敘述性統計量,最小值、第1 四分位數、中位數、第3 四分位數及最大值又稱為五數總結(five-number summary)。 軟體多可算出五數總結的資料。 盒形圖(boxplot)將資料的五數總結,以圖形呈現出來。 盒形圖實例 (Example 1.9, Figure 1.11) 標準差(Standard Deviation)與 變異數(Variance) 標準差與變異數實例 標準差與變異數演算 離差(deviation)圖示 離差值與自由度 標準差的運用 五數總結的選用 * * n 筆資料分別為 x1, x2, …, xn,則定義變異數為 簡記為 標準差 s 則為變異數 s2 的平方根 例題1.10:7位受試者的新陳代謝率,每24小時消耗卡路里數,資料如下: 1792, 1666, 1362, 1614, 1460, 1867, 1439 平均數為 1600卡路里。 變異數為 s2 = 35,811.67 。 標準差為 s = 189.24 卡路里。 1300 1400 1500 1600 1700 1800 1900 離差= -161 離差= 192 x = 1439 x = 1792 n 筆資料對均值的差稱為離差值,即 因為 n 個離差值的總和必為零, 所以第n 個離差值,可由前面 n - 1個離差值來決定。我們稱離差值有n - 1個自由度 (degrees of freedom)。 平均數 被選為度量中心時,標準差s可度量平均值的離散度。 所有的資料都一樣時,s = 0,沒有離散度。其他情形 s 都大於零。 觀測值離平均數越遠時,s 就越大。 s 與 和原有的觀察值有相同的單位。 高度偏斜或少數離群值會使s 變很大。 描述偏斜分配或是有嚴重離群值的資料時,五數總結優於平均數和標準差。 沒有離群

文档评论(0)

cynthia_h + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档