你不能不懂的统计常识.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
你不能不懂的统计常识.doc

你不能不懂的統計常識 班級:219班 座號:01 姓名:丁哲浩 前言 我們常聽別人說:「數字會說話。」但是,傳播媒體所說的,有時信以為真,只會讓人更為困惑。減肥中心大打廣告:「本中心的全體學員一個月『平均』減重三公斤」是不是因此讓許多女性也想一同加入呢?相撲選手從200公斤減至100公斤,可以說他的體重「縮減一倍」嗎?咖啡喝多了,會引發心臟性的疾病,真的是因為多喝咖啡,裡面的化學物質引發心臟疾病嗎?許多常常出現在報章媒體之中的「會說話數據」,或許看一看,馬上就將它拋至九霄雲外,但信以為真的聽眾,卻可能一步步被媒體牽著鼻子走。本書作者鄭惟厚教授運用淺顯易懂的敘述,引用生活中的報導,分析數據取得和實驗研究中的謬誤,讓讀著能擁有基本的統計常識。 從《你不能不懂的統計常識》裡,作者主要針對以下幾點做了說明: 平均的真面目 機率迷思 隨機抽樣 如何正確比較 有無因果關係 邏輯問題 平均的真面目 一看到平均數據,大家常常信以為真,覺得他就是該篇訊息的一切準則。但很明顯的,平均值只是一個數值,它只能說一個事物的大概,真正的樣本和其餘枝枝節節,無可避免的,只能含糊帶過。要破解平均值,就是把每個參與平均的數值一一列出,個別化的結果,才能精確掌握資訊。 作者舉一例:一家減重公司,學員只有五人,其中一人減重19公斤,其餘反而增胖1公斤,結果業者欲蓋彌彰,針對平均值的弱點,廣告「本減肥中心平均一人得減重3公斤」,其實它雖然說了實話,但消費者想知道的「其餘4者不減反增」卻並未說出。 再舉一個例子:一家小型公司宣稱員工平均月收入為57,000元,對於現今經濟不緊氣的市井小民來說,「平均」月入57,000元的確十分優渥,但看了下面的圖表,可能就打消之前的想法。一個公司有老闆、有基層員工,但運用平均數的盲點,出現57,000的數字,其實用中位數,結果為30,000元,似乎必較接近真正大家想要的數字;而眾數則是基層員工的20,000元。 針對樣本數不足,或是極端值足以抗衡整個平均值時,使用中位數、眾數、裁剪平均數(等量消去前後極端值,再除以平均)都可以讓讀者想要得到的真正資訊。其實,國中所學習的盒鬚圖(boxplot)就是一個統計學的好例子,找出四分位數(quartile)、算術平均數、最大值和最小值更可以一次讓讀著得到想要的資訊。 機率迷思 樂透彩剛發行的時候,頭六次開獎中,39號出現了4次,當時頗受大眾一番討論。 但經過了作者機率計算之後,似乎就覺得平常而非異事。 42個號碼中任一個號碼六次中中四次的機率: 接近20%的機率,由此可見在媒體吵得沸沸揚揚的時候,我們應該是保持冷靜從容的心,找出事中的端倪。另外,即使如果無法算出上面的正確機率,也應當有個概念,咱們的樣本僅有六個。在《如何用數字唬人》中則充分解釋了此奇特現象。作者投擲印幣90次,每30次為一次記錄,結果發現連續出現人頭或數字竟可高達6次,本來機率僅是顯示一個事物出現的常態,但真實生活,它們好比波浪一般,高低起伏,39號的出現好比遇到了浪的波峰,如果未來六百次中竟然還出現四百次時,那麼我們才能大膽懷疑彩球是否有錯誤。 回歸至平均數(regression to the mean)說明了當一個數字達到了至高點或最低點時,接下來他將會趨近於一個平均數,類似一地區車禍發生次數或患有癌症的人等等,常常在短時間出現層出不窮時,大眾就想要找出一個藉口(例如:道路彎曲嚴重或附近因為電磁波太多等等),填補事出原因。「事出必有因」有時未必在討論機率時適用,短暫而大量的出現可能只是個波峰的出現。 隨機抽樣 在進行任何一項統計時,我們無法得知全體人民或青少年等等大範圍的每個人的意見,唯一可做得是抽取幾個人代替全體,但如何隨機抽樣,才能使得出來的統計值最接近實際值? 把握兩大原則:隨機抽樣及在各方面許可的狀態下,人數愈多愈好。隨機選擇的結果,最大的好處是排除主觀的意見,減少數據的誤差;人數大量的情況下,個人的意見只能代表全體中的小意見,不會變成像第壹點中減肥中心所舉出的例子。另外,當此項統計想要做多次調查時,顯然一定會和前幾次有所誤差,但只要把多次得來的數據結果,在一次平均,得到的估計值都將會更加準確。 但有時調查,雖然經過隨機,仍會有明顯的誤差。常常在大選期間進行候選人民調,如果在其中顯示自己為何家媒體或候選人辦公處等等,常常受訪者會因為期望給予訪問者較為期望的答案,而左右了真心想法;此外,身心健康調查,受測者可能儘管常吃甜食和根本不運動,但卻在回答時,打個折扣,給予訪問員一個對自己較為滿意的答案,這些無形中都會影響統計出來的正確。 抽樣調查,最基本應有的態度,就如作者說的:一切要隨機。比較多的老人、年輕人、婦女、失業者、吸菸者、宗教人士等等,都可

文档评论(0)

suijiazhuang2 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档