- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
選修數學 (I)1-3 機率與統計(II )-交叉分析與二維數據分析
【定義】
1. 雙向交叉表:
將同一群體的兩個變數或兩種特性( 的觀測值或分組資料) ,放入長方形的表
格裡 ,以便理解兩變數或特性( 間的關係) ,這種表格稱為雙向交叉表簡稱交(
叉表 ) 。
2. 交叉分析:
了解雙向交叉表中數值分配的特性,並由不同方向解釋之就是交叉分析。
3. 散布圖:
將兩個變數的對應數值繪製在坐標平面上 ,以表明它們分配情形的圖形 ,這
就是散布圖。
4. 樣本點:
散布圖上的點稱為樣本點。
註:
1. 單變數:次數分配表 直方圖(長條圖)求平均值與標準差。
2. 雙變數 :交叉分析表散布圖 找直線關係相關係數看關連性 找迴歸直
線。
【範例】
10
班上 位同學的數學成績與物理成績如下表:
數學成績 X 20 40 40 50 60 80 80 100 110 120
物理成績Y 20 10 40 10 20 50 65 60 85 50
將兩個變數的數值資料數對畫在坐標平面上 ,以表明它們的分布情形 ,此即散布
圖。
散布圖
90
80
70
績 60
成 50
理 40
物 30
20
10
0
0 10 20 30 40 50 60 70 80 90 100 110 120
數學成績
【意義】
1. 我們嘗試在散布圖上找一條盡可能的接近所有樣本點的直線也就是想找到,
一條直線來描述兩變數X 與Y的關係,以推測兩變數的直線關係,這種關
係用來表現這些點的變動規律 ,以衡量兩個變數的關聯性 ,並推測它們之間
的關聯程度,這就是相關的意義。
2. 散布圖中 ,若直線要盡可能的接近所有的樣本點 ,這種相關就是直線相關。
X Y
散布圖中,也可以找一曲線來描述變數 與 的關係,這種相關是曲線相
關。
3. 畫出散布圖的目的在於先觀察出資料 之間是否有一些比較明顯的關係存
在 ,若有 ,我們想要找出一條直線來推測出這兩個變數之間的變動規律 ,以
衡量這兩個變數的關聯性 ,並推測出它們之間的關聯程度 。若無顯著的一致
1
性關係時,不要硬要討論它們之間的關聯程度。
2
【範例】
通常身高與體重會成正比 ,但是給你一組資料 ,應該如何來衡量這兩個變數間的
關係呢?如何衡量相關程度的高低?可否由身高來預測體重大約多少?
10
班上 位同學的數學成績與物理成績如下表:
身高 X ( 公 155 157 163 165 168 169 172 175 178 185
分)
體重 Y (公斤) 45 50 53 55 57 59 63 75 79 83
畫出散布圖:
散布圖
100
80
文档评论(0)