2 基础统计学
2. 基礎統計學
統計學之定義 :
乃是一門科學決策的工具,透過資料的蒐集 、整理、分析、解釋、推估 ,以利做
決策 。
在統計學中 ,研究的資料對象有二種 ,一稱之為母體 ,一稱之為樣本 。
母體(population) :欲研究對象的所有全部個體。例如,台灣所有製造廠商 。
樣本(sample) :從母體中抽樣得到的少數個體。例如 ,抽出100個廠商。
統計學之內容大致上可以分成三類 :
1. 敘述統計 :描述現有的資料的方法 。
2. 推論統計 :利用搜集到的樣本 ,來推論母體特性(抽樣 、估計、假設檢定) 。
3. 應用統計 :利用統計原理建立統計模型進行決策分析 。
2.1. 敘述統計
當你手中擁有一堆資料時,你可以先看看這些資料有什麼特徵。衡量資料特徵的
方法大致上有二類 ,一種是集中量數 ,另一種為變異量數 。
集中量數 :反映資料的集中程度 ,常用的量數有 :
A. 平均數
B. 眾數
C. 中位數
D. 分位數
變異量數 :反映資料的分散(離中)程度 ,常用的量數有 :
1. 絕對差異量數
A.全距
B.平均差
C.四分位差
D.標準差與變異數
2. 相對差異量數
E.變異係數
9
F.平均差係數
G.全距係數
H.四分差係數
集中位置的量數(measures)
平均數(mean)
母體平均數 ,符號為 (衡量母體特徵的量數叫 參數 ,parameter)
樣本平均數 ,符號為 x (衡量樣本特徵的量數叫 估計量,estimator)
n
x
i
公式 :總合 = x =f (x ,x ...,x ) = i 1
數目 1 2 n n
優點:該組資料內的所有數值接被列入計算 ,具充分性 。
可用代數方法處理
缺點 :易受極端值(extremevalue)所影響。
眾數(Mode)
符號:Mo
定義 :一組觀察值中 ,出現次數最多者 。
優點:不受極端值的影響 。
缺點 :不適合代數運算 。
可能不存在或存在多個 。
中位數(median)
符號:Me
定義 :一組由小排到大的資料 ,其中間位置的數值 。
求法 :(1)排序
(2)找出n
50
(3)找出中間位置(i) (i=n ) 有小數就進位 ,無小數選鄰居平均 。
100
優點:不易受極端值的影響 。
缺點 :中位數不適合代數運算。
變異量數 (Dispersion Measures)
(1) 全距(Range)
符號:R
10
定義 :一組資料中(x ,x ,..., x ) ,最大數-最小數
1 2 n
求法 :(1)排序 (2)R xn x1
優點:簡單。
缺點 :易受極端值的影響。
(2) 四分位距(Interquartile-range ,IQR)
符號:
IQR
公式 : =Q Q
IQR 3 1
(3) 四分位差(quartiledeviation ,Q.D)
符號:Q1D
IQR Q3 Q1
公式 :Q1D= =
2 2
(4) 平均偏差(meanabsolutedeviation)
符號:MAD
n
x x
i
公式 :MAD
您可能关注的文档
最近下载
- 重庆市各地方周氏支族源流(1-170支族).doc VIP
- (高清版)B-T 6003.1-2022 试验筛 技术要求和检验 第1部分:金属丝编织网试验筛.pdf VIP
- (已压缩)TUCST007-2020房屋建筑与市政基础设施工程施工安全风险评估技术标准.docx VIP
- 2026年国家公务员考试申论真题及参考答案(考生回忆版).docx VIP
- 部编版语文二年级上册期中常考七大重点题型专项训练.docx VIP
- 机器人操作系统(ROS)及仿真应用 课件全套 第1--9章 Linux Ubuntu入门基础--- 基于ROS的服务机器人应用实例.ppt
- 压疮的预防及护理技术操作考核评分标准编辑.docx VIP
- 高温超导材料在量子计算中的应用前景.docx VIP
- 铺床术操作评分标准.doc VIP
- 2025年陕西高中学业水平合格性考试历史试卷真题(含答案) .pdf VIP
原创力文档

文档评论(0)