2 基础统计学.pdf

2 基础统计学

2. 基礎統計學 統計學之定義 : 乃是一門科學決策的工具,透過資料的蒐集 、整理、分析、解釋、推估 ,以利做 決策 。 在統計學中 ,研究的資料對象有二種 ,一稱之為母體 ,一稱之為樣本 。 母體(population) :欲研究對象的所有全部個體。例如,台灣所有製造廠商 。 樣本(sample) :從母體中抽樣得到的少數個體。例如 ,抽出100個廠商。 統計學之內容大致上可以分成三類 : 1. 敘述統計 :描述現有的資料的方法 。 2. 推論統計 :利用搜集到的樣本 ,來推論母體特性(抽樣 、估計、假設檢定) 。 3. 應用統計 :利用統計原理建立統計模型進行決策分析 。 2.1. 敘述統計 當你手中擁有一堆資料時,你可以先看看這些資料有什麼特徵。衡量資料特徵的 方法大致上有二類 ,一種是集中量數 ,另一種為變異量數 。 集中量數 :反映資料的集中程度 ,常用的量數有 : A. 平均數 B. 眾數 C. 中位數 D. 分位數 變異量數 :反映資料的分散(離中)程度 ,常用的量數有 : 1. 絕對差異量數 A.全距 B.平均差 C.四分位差 D.標準差與變異數 2. 相對差異量數 E.變異係數 9 F.平均差係數 G.全距係數 H.四分差係數 集中位置的量數(measures) 平均數(mean) 母體平均數 ,符號為  (衡量母體特徵的量數叫 參數 ,parameter) 樣本平均數 ,符號為 x (衡量樣本特徵的量數叫 估計量,estimator) n x i 公式 :總合 = x =f (x ,x ...,x ) = i 1 數目 1 2 n n 優點:該組資料內的所有數值接被列入計算 ,具充分性 。 可用代數方法處理 缺點 :易受極端值(extremevalue)所影響。 眾數(Mode) 符號:Mo 定義 :一組觀察值中 ,出現次數最多者 。 優點:不受極端值的影響 。 缺點 :不適合代數運算 。 可能不存在或存在多個 。 中位數(median) 符號:Me 定義 :一組由小排到大的資料 ,其中間位置的數值 。 求法 :(1)排序 (2)找出n 50 (3)找出中間位置(i) (i=n  ) 有小數就進位 ,無小數選鄰居平均 。 100 優點:不易受極端值的影響 。 缺點 :中位數不適合代數運算。 變異量數 (Dispersion Measures) (1) 全距(Range) 符號:R 10 定義 :一組資料中(x ,x ,..., x ) ,最大數-最小數 1 2 n 求法 :(1)排序 (2)R xn x1 優點:簡單。 缺點 :易受極端值的影響。 (2) 四分位距(Interquartile-range ,IQR) 符號: IQR 公式 : =Q Q IQR 3 1 (3) 四分位差(quartiledeviation ,Q.D) 符號:Q1D IQR Q3 Q1 公式 :Q1D= = 2 2 (4) 平均偏差(meanabsolutedeviation) 符號:MAD n x x i 公式 :MAD

文档评论(0)

1亿VIP精品文档

相关文档