本章介绍测量资料分散程度的统计量最常用的是标准差一组.pptVIP

本章介绍测量资料分散程度的统计量最常用的是标准差一组.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
本章介绍测量资料分散程度的统计量最常用的是标准差一组

STAT0_var 4.1 全距(range) 本章介紹測量資料分散程度的統計量,最常用的是標準差 一組資料的全距 = 該組資料內最大值 - 最小值 內四分位距 = Q3-Q1。 半內四分位距 = (Q3-Q1)/2 4.2 標準差與變異數 資料:X1, X2, …, X3 deviation from mean: 整體的離差,以絕對值之平均,或以平方和之平均代表。 數學上平方和較易運算 樣本變異數(sample variance):平方和 / (n-1) 以 n-1 代替 n,是為了估計的精度 sample standard deviation,S 計算: 平均數; 每筆數據與平均數的離差; 這些離差的平方; 離差平方的總和; 除以 n-1; 開根號。 平均數 = 9.5 Computation formula for s 標準差的特性 標準差是用來測量資料分散度的測值 標準差代表資料變化、風險 標準差的單位與資料單位相同 將資料同時加減一常數,標準差不變 將資料同時乘上一常數,標準差也同時乘上此常數 4.3 標準差的應用 謝比雪夫(Chebyshev)定理: 對任何資料,以及任何一個大於1的常數 k,該組資料落於平均數加減 k 個標準差之的比例,至少是 1- 1/k2 。 母體時,μ, σ為 mean, std. dev. P(|x-μ|kσ) 1/k2, or, P(|x-μ|kσ) 1- 1/k2 k=3。 1-1/32 =8/9,或 88.9% ,比例是 88.9%。 1-1/k2 = 0.9375,k = 4。 範圍是介於3.34與3.66之間。 鐘型分配 大約有68% 的資料,落於平均數加減一個標準差之間的範圍, 大約有95% 的資料,落於平均數加減兩個標準差之間的範圍, 大約99.7% 的資料,落於平均數加減三個標準差之間的範圍, 平均數加減三個標準差之間的範圍是35.54與121.64。 原始資料中,有兩個數據小於35.54,沒有比121.64大的數據。因此,我們有108筆數據落在這個範圍之內 , 98.2% 的資料落於平均數加減三個標準差之間的範圍內。 標準單位 z-score 變異係數 coefficient of variation 4.5 更進一步的描述 分配的形式有: 標準形式:左右對稱的鐘型分配 尾巴在左側:skew-to-left 左偏分配 (負偏斜分配) 尾巴在右側:skew-to-right 右偏分配 (正偏斜分配) Coefficient of skewness Coefficient of kurtosis 峰態係數 例: 分析老忠實噴泉的噴發間隔時間的分配型態 反J型 以及 U型 分配 * * 一定為 0 証明: Chebyshev 定理較嚴密,用於任一分配,一般鐘型資料可用上述的結果,稱為「經驗法則」(empirical rule) 標準單位告訴我們某筆數據在整組資料中,位於平均數以上或以下,多少個標準差以外的距離。 x = μ+zσ 多數資料 |z| 3 |z|1,資料位於中間部位 拉克先生的體重比平均值多了30磅, 克拉克女士的體重比平均數多了20磅。 換算成標準單位: 克拉克先生是1.67,克拉克女士則是1.82 各自的年齡層而言,克拉克女士比克拉克先生要更超重一些。 這是一相對變異的測度值,常用於比較 測量彈簧的變異程度比較小,顯示其準確度較高。 *4.4 分組資料的標準差 (1) S = 10 x 1.435 = 14.35 (2) 可不可以用一個數來分辨? sk≒0,資料近對稱分配 sk0,資料呈現右偏分配 sk0,資料呈現右偏分配 由圖中可以明顯的看到,這組資料是右偏分配; 中位數靠向長方形的左側, 而右邊的「長鬚」也比左邊的長了一些。 Q1 = me= Q3= 如果和鐘型分配比較,又有長尾(long-tail) 分配 (有極值的分配),和短尾分配(short-tail),可以峰態係數來分辨 Kur≒0,資料近鐘型分配 kur0,資料呈現長尾分配 kur0,資料呈現短尾分配 直方圖: 基本統計量: 由偏態及峰態係數估計間隔時間的分配是接近對稱,長尾型的分配,其直方圖也確實呈現此現象。 1.338 kurtosis -0.423 skewness 14.603 Std. dev 80.000 median 78.218 mean

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档