- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
二項分配與常態分配 當 n 越來越大時,參數為( n , p )的二項 分配會越來越像 的常態分配 實 例 參數為 B ( 10 , 0.5 ) 的二項分配, 其成功次數 X 的期望值 , 標準差為 B ( 10 , 0.5 ) 的二項分配 與期望值 相距一個標準差的範圍為 B( 10 , 0.5 ) 的二項分配 與期望值 相距二個標準差的範圍 的機率約為 0.9785。 與期望值 相距三個標準差的範圍 的機率約為 0.9980。 上述結果和常態分配的68%-95%-99.7% 的經驗法則非常相似。 B ( 10 , 0.5 ) 和 N ( 5 , 2.5 ) 分配圖之比較 「點估計」( point estimation ) 點估計是指由一組樣本中計算出來的樣本估計量來推估母體參數的真值。 當我們要進行點估計時,首先必須抽取具代表性的樣本,並且選擇合適的樣本統計量作為估計式。並以樣本統計的值推論出母體參數值。 事件A與事件B為獨立事件,則列聯表有如下關係 分析二維數據 在統計分析上,當資料有兩個變數時,會探討同一樣本的兩個變數 X、Y 之間的關連性。 利用廻歸式找出兩個變數的關係,常利用的關係式為線性關係式:y = a + b X。 最佳直線:對一組資料 以最小平方法求得的最佳直線,稱為 y 對 x 的廻歸線。此廻歸線的方程式為 已知五名考生的數學與自然級分如下 (1)則甲、乙、丙、丁四名考生對的迴歸直線方程 式_______________﹒(2)若戊生未發生意外狀況﹐則依此迴歸關係﹐預測其自然 科成績應為___________級分。 A: (1) ;(2)15 交叉分析—看兩個變數是否有關聯 錄取 未錄取 合計 男性 x 30 女性 y 18 合計 32 16 48 若錄取與否與性別無關則 P(男性且錄取)=P(男性)*P(錄取) , x 的期望值為 (5/8)*(2/3)*48=20 y 的期望值為 (3/8)*(2/3)*48=12 P(男性)=5/8 P(女性)=3/8 P(錄取)=2/3 P(不錄取)=1/3 假設沒有association, 則應該看到….. 假設沒有association,也就是說男生與女生 喜歡的球類運動是ㄧ樣的, 則應該看到….. 籃球 桌球 排球 其他 合計 男生 x 34 女生 y 26 合計 23 19 7 11 60 x≒(23/60)*(34/60)*60, y ≒(7/60)*(26/60)*60 =13.03 =3.03 當觀測值接近期望值時?沒有association ! 當觀測值與期望差太多?有association ! 1 P ( ) P ( B ) 合 計 P ( ) P ( ) P ( ) P ( ) P ( B ) P ( A ) P ( A ) P ( ) P ( A ) P ( B ) A 合 計 B Simpson’s Paradox Men Women Dep A 250/500 9/10 Dep B 1/10 100/500 total 251/510 109/510 Men Women Dep A 250 9 未錄取 250 1 total 500 10 Men Women Dep B 1 100 未錄取 9 400 total 10 500 辛浦森詭論 辛浦森詭論(Simpson’s paradox)指出,在幾組值中都顯示出的關聯或比較,有可能在數據合併成一組時全部消失或倒轉方向。 只看藍色或只看紅色都會認為 X 越大 Y也越大, 但ㄧ起看則會 認為 X 越大 Y 越小. 近幾年的指考、學測試題 某廠商委託民調機構在甲、乙兩地調查聽過某項產品的居民佔當地居民之百分比(以下簡稱為「知名度」)。結果如下:在95%信心水準之下,該產品在甲、乙兩地的知名度之信賴區間分別為 [ 0.50 , 0.58 ]、[ 0.08 , 0.16 ]。試問下列哪些選項是正確的? 甲地本次的參訪者中,54%的人聽過該產品 此次民調在乙地的參訪人數少於在甲地的參訪人數 此次調查結果可解讀為:甲地全體居民中有一半以上 的人聽過該產品的機率大於95% (4)若在乙地以同樣
文档评论(0)