第六章統計假設檢定.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第六章 統計假設檢定 在日常生活中,我們常常要做決定。有些決定影響深遠,有些決定沒有太大差別,例如:一大公司要決定要不要參與一重大投資計畫,決定會影響它未來的盈虧;又今天出門時天陰,你要決定要不要帶傘,帶了卻沒下雨,只增加一點不便,若沒帶卻下雨,頂多被淋濕,這決定影響不會太嚴重。決定錯誤時所造成損失的大小,也就影響做決定時,考量的審慎程度。 作決定的過程大致是這樣:對於尚未發生的不確定性的事情,我們現在必須預做規劃,這時可能面臨二個或以上之選擇。 我們要根據一些資訊、專家意見、個人信念、作錯決定時損失的大小等考量因素,然後選擇其中之一。這種抉擇的過程就是本章所要探討的統計推理的方法—假設檢定。 6.1 統計假設檢定—基本架構 下面我們提供幾個假設檢定的例子: 例題6.1.1 (a) 一家藥廠發明了一種新藥,現在要根據臨床實驗結果決定要不要大量投資生產。 (b) 一部飲料自動裝罐機每隔一段時間會出現偏差。 現在抽驗一組樣本,根據它們容量決定要不要停機修理。 (c) 某科老師今年試驗一種新的教學法。 他要根據今年學生表現,決定明年要不要繼續採用。 傳統的統計假設檢定方法,是假設我們探討的母群體其分佈類別為已知,但其中含有一個或以上之參數為未知。 我們對這參數設定兩個互斥的假設,然後根據隨機實驗的結果所取得之樣本,來決定兩個假設哪一個較合理。 統計假設之定義如下: 定義:統計假設(statistical hypothesis)是一個有關參數的敘述(statement about the parameter)。若此假設之敘述認定參數為單一特別值,則稱之為簡單(simple)假設。若認定為兩個或兩個以上之特別值,則稱為複合(composite)假設。 如上所述,在統計假設檢定方法裡,我們設定兩個互斥的假設,然後根據樣本與統計方法選擇其一。兩個互斥假設定義如下: 定義:(1)虛無假設(null hypothesis)是我們要質疑、否定的假設。常用符號表示。 (2)對立假設(alternative hypothesis)是我們要建立、肯定的假設。常用符號表示。 虛無假設通常是待檢定之參數比較的標的。若我們檢定的對象是某產品是否合乎原先的設計,則虛無假設常選擇待檢參數為設計時該參數的標準值。若我們檢定的問題是新方法、新經驗與舊方法、舊經驗的比較,則虛無假設常常選擇為舊方法、舊經驗的結論。對立假設常選擇對立於虛無假設所設定的參數值。我們希望樣本能提供足夠的資訊,讓我們在容許錯誤機率下,判定虛無假設是否可被否定而對立假設可被肯定。 虛無假設與對立假設將參數之可能值分成兩互斥集合,它們之間不能有供同值。 例題6.1.2 承例題6.1.1,(a) 某藥廠發明一種新的減肥藥,他們聲稱5天內絕對可以達到減肥效果,於是請了自願者試用這藥。 令X為服用該藥後體重減少的量,假設X分佈為,其中μ為代表所有服用此減肥藥的人的體重減少量的平均值。 此題該藥廠為證實他們聲稱的藥效,可以設定,。 (b) 令X為某部機器所裝之飲料量。 設X之分佈為,μ是所有用此機器所裝之飲料平均量。假設若μ低於600毫升就必須調整,則我們可以設定,。 (c) 令X為學生學期分數,X之分佈為。 若學生平均成績高於70分,則明年繼續採用新教學法。此時我們可以設定,。 我們決定要或不要拒絕是根據樣本所提供的資訊。 我們選擇一個樣本統計量來歸納樣本所提供的資訊,然後根據統計量之值是否落在某一範圍內來決定要不要拒絕。 定義:(1) 檢定統計量(test statistic)為一個用來判斷要不要拒絕虛無假設的統計量。 (2) 棄卻域(critical region 或 rejection region)為一個檢定統計量可能值之子集,當檢定統計量的觀察值落在其中時,我們就決定拒絕(reject )。 針對一組假設與,我們可能選擇不同的檢定統計量來歸納樣本所提供的資訊,也可能選擇不同的拒絕的標準。 因此對於一組假設與,我們可能有很多種檢定的過程,而可能導致不同的結論,因此我們有必要探討如何建立評判檢定過程優劣之標準以及如何選擇一個好的檢定過程。 因為真正的參數值未知,所以不管我們拒絕或不拒絕,我們都有犯錯的可能。 我們犯錯的類型如下表所示: 決定 為真 為假 不拒絕 拒絕 對的決定 錯的決定 錯的決定 對的決定 以下我們給予錯誤類型正式之定義: 定義:(1) 第一型錯誤(type I error)是當為真時,我們卻拒絕。 (2) 第二型錯誤(typeⅡ error)是當(為假時,(我們卻決定不拒絕。 例題6.1.3 某君聲稱他只要用手摸撲克牌,就能猜出花色。為要測試他到底有沒有吹牛,我們從一副撲克牌用有退還方式

文档评论(0)

天马行空 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档