- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
资讯的取得与分析後表达-国立高雄大学统计学研究所
資料取得、整理與分析後表達
基礎統計報告
高雄大學統計學研究所
碩一 M0974404 陳俊宇
資料取得、整理與分析後表達
陳俊宇
前言
在選舉期間我們都常聽到或看到根據某某統計資料顯示A候選人的民調高過B候選人;或者是電視上某個節目常說根據某市調公司的統計收視又創新高,而把高收視率數字拿出來講,吸引更多觀眾來收看該節目。但什麼是統計分析?這些數據資料又是怎麼得來的?可能只有調查單位自己最清楚。調查單位若不給出詳細的分析資料,那我們就只能從他們給的數據去做參考、推測,來下最後的決定。
什麼是統計?「統計是指在所要研究的問題中,對於樣本資料的蒐集、整理、呈現並解釋,再透過適當的機率模型,藉由抽取之樣本資料去推論母體中未知之特性,始能在不確定情況下,做成聰明決策的科學方法。」廣義來說,統計是資料的蒐集、整理、分析與解釋。目的在於提供管理者制定有效決策所需的資訊,使得能夠下較為正確且合理的決策並大幅降低結果之不確定性。簡單地說,統計就是將大量的資料轉化成有用的資訊。
以往在課堂上我們學習統計分析的各種方法時,都是資料拿來了就開始分析了,但這只是為了讓我們瞭解各種統計方法的教學方式,若要真的徹頭徹尾的瞭解,那就真的得連同分析前的資料取得和最後的表達都得瞭解才是。可惜在教學上並不允許,基於教學時間進度上,只好去頭去尾的直接給學生蒐集來的資料去做某個統計分析方法的教學。所以接著就針對統計資料的取得、整理及最後分析結果的表達做一個介紹。
統計資料的取得、整理
在整個統計流程的一開始當然就是要找到我們所要的資料,而這資料的取得一般我們可以從最早期個人資料蒐集方法—觀察法到現在的問卷、網路調查、街頭訪問、電話訪問及家庭訪問等等,各種在合理情況下,只要能蒐集到我們所需資料的方法都可以使用。
而所謂的合理情況下指的是,比方說我們如果要針對使用網路意見的調查,那我們選擇的調查方式就應該從網路調查這方面著手比較適當。因為通常會使用網路的人不外乎就是常用電腦的使用者,所以直接從網路取得資料會是較直覺的作法,另外也還可以到電腦相關產品的賣場去做街頭訪問,這也是較多電腦使用者會常出現的地方;而不合理指的就是,拿網路意見調查這個例子來說,就不能到傳統市場去蒐集資料,因為通常會去傳統市集買東西的不外乎就是傳統家庭主婦這一類較少使用電腦的人,如果到這地方蒐集資料也只是事倍功半。
另外,上面有提到了一個家庭訪問的蒐集資料方法,由於現在有很多社會事件造成人跟人之間產生信任上問題,住在同一棟房子的住戶都不見得全都認識了,更何況是讓一個完全陌生的人進到家中,所以想要進去人家家中做家訪是很不容易的。大概在六、七年前,那時一間市調公司(ACNielsen)和某間學校有合作,在暑期的時候學校都會有實習生到公司去實習,但暑期結束後大多數的實習生回到學校,都向學校表示公司指派給他們的家訪太過困難,受訪成功率太低,其原因就是要進入受訪者家中進行訪問太困難,不是直接被管理員檔在門外,就是要進入家中訪問時被住戶拒訪。此外,還有一個造成拒訪的原因,就是問卷內容太多,沒有耐心等訪問員一一的問完整份攏長的問卷。雖說能藉由類似的題目反覆確認受訪者是否認真回答問卷,但受訪者的受訪時間長短仍須在設計問卷的時候考慮進去。
還有就是現實面「成本」的考量,雖然說整個統計流程較花人力、金錢的部分就只有蒐集資料的部分,但若預算成本不高,也無法做大規模完善的資料蒐集。對於出版社或唱片公司而言,資料蒐集的方法可使用回寄的明信片或登入網頁填寫問卷,單就看這兩種方式或許會想說只放個明信片在產品中,或設計一個網頁來讓人上網填問卷就能蒐集到資料這樣的成本應該是不高。但人都是被動的,很少有消費者會主動的去回覆這些問題,想要消費者去做回覆的這個動作就要有誘因來吸引消費者,譬如:回寄可參加抽獎、登入可免費收到新書特報、可線上學習…等等。但增加這些誘因吸引消費者的同時,成本也跟著提高。所以成本與情資就好比一條線的兩頭在拉扯,顧慮到成本高低可能就會喪失資料的完整性,考量到資料詳不詳細齊不齊全就有可能得花上更高的成本。
緊接著資料蒐集完後,就是開始一連串的整理、分析工作。一般我們往往都是拿了數據資料,就開始依資料的內容和我們所想知道結果的方向開始分析,但有時候不曉得大家有沒有想過,平常我們看到的情況並不是一開始就是用數字的方式呈現在我們眼前,這時就沒有辦法直接取來作分析。就要透過把當下的各個情況,轉成我們所熟悉能夠加以分析的數據後再來處理。在這邊我就把它分成:可以直接分析的資料與不能直接分析的資料。舉例來說:能直接分析的像是股價、投資報酬等量化資料,這一類直接從他所表現出來的數據直接取來作分析;不能直接分析的像是男/女、滿意/普通/不滿意,這方面以類別方式來表達的質化資料資料。其中後者以社會科學領域較
文档评论(0)