机率与统计单元四DataOrganization.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
集中趨勢 Data Organization-Central location 集中趨勢﹙Central location ﹚ 平均數﹙mean﹚ 算數平均值﹙Arithmetic mean﹚ 幾何平均值﹙Geometric mean﹚ 加權平均值﹙Weighted mean﹚ 調和平均值﹙Harmonic mean﹚ 中位數(median) 眾數(mode) 百分位數﹙percentile range﹚ 四分位數 算數平均值﹙Arithmetic mean ﹚ 樣本平均數即是樣本資料的『中心位置』 樣本平均值 =(x1+x2+x3+…+xn)/ n = Σxi / n 母群體平均值 μ =(x1+x2+x3+…+xn)/ N = Σxi / N Example: 某班甲、乙兩組學生甲組5人,乙組4人。某次統計學測驗成績如下,請問兩組成績孰優: 甲:89, 72, 55, 68, 78 乙:88, 63, 76, 69 算數平均值的優缺點 優點: 1.易被人接受。 2.每筆資料都有被計算入。 3.可用代數方法運算。 缺點: 容易受到極端值﹙extreme value﹚的影響。 算數平均值的特性 ﹙a﹚當yi = xi + c 則 ﹙b﹚yi = c xi 則 ﹙c﹚ ﹙d﹚﹙Sum of Square;SS﹚ = ﹙e﹚SS SSa 幾何平均值﹙Geometric mean﹚ 幾何平均值平通常用於為生物或血清資料。 觀測值通常是液體濃度可以轉換的資料。例如一個生物研究中,稀釋的倍數為2,4,6,8,16倍。 通常這樣的分布都是屬於「右偏斜的分布」,因此用幾何平均數可以做校正。 example: 人體血液中抗體滴定濃度為4, 8, 16, 16, 64求其平均數? Ans. 算數平均數 = ﹙4+8+16+16+64﹚/5 = 21.6 幾何平均數 μ = ﹙log4 +log8 +log16 +log64﹚/ 5 = 1.412 幾何平均數 = antilog﹙1.412﹚= 101.412 = 13.9 加權平均數﹙Weighted mean﹚ x值 =x1,x2,x3,…xn﹙觀測值﹚ 權數 =w1,w2,w3,…wn 加權平均數 = example: 某工廠中有A,B,C三個儲藏區,A區面積700平方公尺,利用了21%;B區面積400平方公尺,利用了33%;C區面積1050平方公尺,利用了47%,求該工廠儲存空間有效利用率之平均數。(0.3593 ) 調和平均數﹙Harmonic mean﹚ 各觀測值倒數之平均值,在統計上較少採用。 中位數﹙Median﹚;﹙Me﹚ 資料經由遞增或遞減的排序後,排位最中間的值。 如果n為奇數 Me為第﹙n+1﹚/2個觀測值。 如果n為偶數 Me為中間兩個值的平均數。 Me = 第n/2個 and 第﹙n/2﹚+1個觀測值,兩數的平均。 example: 12個同學的考試成績: 33,30,36,45,34,28,25,32,29,34,35,31 Ans: Me =(32+33)/ 2 = 32.5 中位數的特性: 中位數的優點: 1.簡單易了解。 2.不易受極端值的影響。 中位數的缺點: 1.只考慮居中的數值,忽略了其他數值,敏感性較低。 2.不適合代數運算。 example: 如下例資料所示, 1,3,5,7,9,2,4,6,8,100 則中位數為 5.5,但平均數卻變為 14.5,相差很大。 眾數﹙Mode﹚;﹙Mo﹚ 在觀測值中出現次數最多的值。 眾數可能不只一個。 Example: 有一組資料10,12,10,10,8,12,12,14。 Ans 出現次數為10—3次;12—3次;8與14各1次,因此眾數為10與12。 眾數的優點: 1.簡單易了解。 2.不易受極端值的影響。 眾數的缺點: 1.與中位數類似,僅考慮幾個數值,故不適合代數運算。 2.資料中的數值若皆只出現一次,則眾數不存在。若有兩個以上的眾數,則較難取捨。 百分位數﹙percentile range﹚ 第p個樣本百分位數是某一個數值dp,使得樣本中有k部分的觀察值小於或等於dp。 將資料按大小順序排列後,若至少有p%的觀測值位於某一數值底下,且至少有﹙1-p﹚%的觀測值位於該值以上,則該數值稱為該組資料的第p的百分為數﹙p-th percentile﹚。 求第p 個百分位數的程序 1. 將資料由小到大排序。 2. 計算百分為數所在位置的指標,設為 。 指標位置i=ni=觀測值個數 假如 i 不為整數,則取下一個比i 還要大的值,即為第 p個百分位數。 假如 i 為整數,則第p 個百分

文档评论(0)

wumanduo11 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档