- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
单元大纲: 类别资料的介绍: 类别资料的母体分配: Binomial
CDA :UNIT1
單元大綱:
類別資料的介紹:
類別資料的母體分配:
Binomial distribution
Multinomial distribution
Poisson distribution
最大概似估計法(Maximum Likelihood Estimation Method)
比例(proportion)的推論:
類別資料的介紹:
統計資料的分類:
數值資料(numerical data):資料以度量的方式或計數的方式產 生,可以做加減乘除。
√連續資料(continuous data):不同資料的間距可小至“任意小 "的程度(若度量衡
的限制不計) ,如身高、體重等。
√計數資料(count data):不同資料的間距有一定的“間隔",如每 一家的人口、每一
年高速公路的車禍數等。
√附註:
類別資料(categorical data):資料以類別 (category)分類,如性別、喜好度等,較不
可做加減乘除。
√名目尺度資料(nominal data):類別之間沒有大小程度之分,如性別、政黨屬性等。
√ 次序尺度資料(ordinal data):類別之間有大小程度之分,如喜好度、排行、名次、
教育水準。
類別資料的例子:
√ 政治理念:自由的,中庸的,保守的。
√ 老年癡呆症的診斷結果: 有症狀的,無症狀的。
√ 手術後的結果:成功的, 失敗的.
√ 心理疾病的診斷結果:精神分裂,憂鬱,機能性神經症.
√傷害嚴重的程度:無, 輕度, 中度, 重度.
√顧客對某項產品廠牌的偏好: A 廠牌, B 廠牌, C 廠牌.
√鱷魚主要的食物: 魚類,無脊椎動物,爬蟲類動物.
√是非題的答案: 是,否。
√選擇題的答案:1, 2, 3, 4 (A, B, C, D)。
1/10
CDA :UNIT1
類別資料的案例:
一個類別變數:
兩個類別變數:
三個類別變數:
以回歸模型探討類別變數:
一個類別變數:
攤位的喜好度是否不同?
√園遊會中共有10 個攤位,編號1 至10。問卷中有一題為你最喜歡的攤位為何?答案
可填1 至10。此資料為類別資料中的名目尺度資料,我們最後統計出每一攤位所被圈
選的人數,依此推論出攤位的喜好程度是否不同。
2/10
CDA :UNIT1
兩個類別變數:
台灣人民自殺的類型與性別有關嗎?
√ 收集台灣1981~2001 總自殺人數,登記其自殺的類型(ICD)與其性別(Gender)。最
後按自殺類型與性別統計出每一分類的總數,如下表:
1981-2001 (2×n data)
Frequency Table of Gender by ICD
ICD
950 951 952 953 954 955 956 957 958 959 Total
Gender
1(male) 10644 108 327 11626 623 331 665 1044 677 2 26047
2(female) 7352 37 63 5305 595 3 187 780 254 6 14582
Total 17996 145 390 16931 1218 334 852 1824 931 8 40629
ICD:International Classification of Diseases.
950~959 是ICD編排中自殺的編號,分別代表自殺方式如下:
950:吞食固體或液體自殺 951:瓦斯 952:其他氣體
文档评论(0)