测量所有事物之〈7年奥德赛及隐藏误差改变.ppt

测量所有事物之〈7年奥德赛及隐藏误差改变.ppt

  1. 1、本文档共31页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
测量所有事物之〈7年奥德赛及隐藏误差改变

* Elizabeth Newton 博士 幻燈片由Elizabeth Newton(麻省理工學院)準備,其中部分由Roy Welsch(麻省理工學院)與Gordon Kaufman(麻省理工學院) 1 2 15.075,應用統計學 講課:M,W 10-11:30 複習課:R 4-5 教材:《統計學與數據分析》Tamhaneand Dunlop著 編程:S-Plus 考試:期中(課內)和期末 先修課程:微積分,機率論,線性代數, 3 15.075,應用統計學,課程大綱 ?收集數據 ?概括和探索數據 ?機率論複習 ?統計量的抽樣分佈 ?推斷 點估計與區間估計,假設檢驗 ?線性回歸 ?變量分析 ?非參數方法 ?專題(數據挖掘?) 4 統計學 是為了得出結論和決策而進行的數據採集及數據分析之科學。 Tamhane,AjitC.,Dorothy D,Dunlop,《統計學與數據分析進階》。Prentice Hall,2000,第1頁, 「統計學決不能取代判斷」, Henry Clay。 5 「米」如何定義? 四分之一子午線(從極點到赤道)的一千萬分之一。 但是--它不精確. 為什麼? 6 《對所有事物的測量》,Ken Alder, 描述兩個法蘭西天文學家,Delambre and Mechain,企圖確定法蘭西大革命時期地球的周長。 用三角測量法確定巴塞隆那與敦刻爾克之間的距離,需要知道每一個端點的緯度 (透過測量天體高度)。 7個月到7年。 Mechain獲得相矛盾的訊息 ,隱瞞了數據的部分訊息。 7 頁214(《所有事物的測量》): 「什麼被記為誤差?誰能斷言你將要犯錯誤? 如何近似為充分近似?Mechain和他的同事 都沒有能夠以相當程度的信心回答上述問題。 他們對統計簡直是一無所知。」 - 引自 Alder,Ken。《測量所有事物》之〈7年奧德賽及隱藏誤差改變世界〉,Free Press,2003。 8 數據:一組測量值 特性: 名義的,如顏色:紅,綠,藍 二元的,如(M,F),(H,T),(0,1) 序數的,如對待戰爭態度:支持,中立,不支持 數字的 離散的,如兒童數量 連續的,如距離,時間,溫度 也包括: 間隔,如華氏溫度 比率(絕對零),如距離,兒童數量 9 S-Plus數據集:cu.摘要 10 概念 數據集常寫成矩陣形式,行對應觀測值,列對應變量。 總體: 所有感興趣的單元的集合(有限或無限). 例如:麻省理工學院的所有學生 樣本: 實際觀察總體的一個子集. 例如:在這教室裡的學生. 變量: 每一單元的性質或屬性,例如 年齡,高度 觀察值: 獨立單元的所有變量的值 11 概念(接上) 參數: 針對每一變量定義的總體的數字特性,如反對戰爭人數的比例。 統計量: 用於估計總體參數的樣本數字函數。 精確度: 參數估計量的散佈 準確度: 與偏差對應的估計量與真值的近似程度 偏倚度: 估計量與真值的系統偏離程度 12 準確度和精確度 正確且精準 正確但精準 精準但不正確 不正確且不精準 由麻省理工學院開放式課程提供 13 研究設計與執行步驟 背景研究和文獻綜述。 定義研究目的及具體假設。 確定要測量的變量及如何測量。 制定收集數據的計畫內 抽樣設計 樣本大小 包括的範圍 人員訓練 匯集數據 分析數據 結果報告 14 倫理觀 從人類角度: 從動物角度: (見 H u lley C u m m i n gs之《臨床研究設計》) 15 統計研究 描述性的: 一組,例如調查,選舉 比較性的: 2 組以上,例如對不同教學方法效果的比較。 實驗性的: 調查人員主動介入以控制研究條件 尋找預測值(解釋變量)與回應(輸出值)之間的關係 明確因果關係,例如藥物試驗 觀察性的: 調查人員透過旁觀記錄數據 難以區分預測值干擾變量(潛變量)件間的影響。 建立聯繫,例如Framingham之《心臟研究》 16 觀察性研究: 橫截面研究 尋找某一時點的樣本 例如人口普查,樣本調查 預測研究(昂貴!) 對樣本(一群)進行時間序列跟蹤研究 。 例如Framingham之心臟研究,護士健康研究 回顧研究(案例控制) 按時間追溯 17 觀察研究中的誤差來源 抽樣誤差 樣本不同於總體 測量偏差 界定問題不清晰 自我選擇偏差 拒絕參與 回應偏差 不正確或不真實的回應 18 抽樣類型 機率抽樣(總體中的任一單元都具有非零機率) 簡單隨機抽樣 (SRS) 分層隨機抽樣 多階段分群隨機抽樣 系統抽樣

文档评论(0)

sunshaoying + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档