- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
9分类数据分析
列联表中的相关测量(一般问题) 品质相关 对品质数据(定类和定序数据)之间相关程度的测度 列联表相关测量的指标主要有 ? 相关系数 列联相关系数 V 相关系数 女闰等翟卢孩娠碰司琵伏红烘曰钩裸倔耍誊沉欺龙巾座篆俗悠嫡屿惹民桓9分类数据分析统计学—PowerPoint ? 相关系数(要点) 测度 2?2列联表中数据相关程度的一个量 对于2?2 列联表,? 系数的值在0~1之间 ? 相关系数计算公式为 收申缎筏复勒木盟硒吉尿宣同调贬毅匠婚洞淹洲距自敝集烧撇挽袜保竞坝9分类数据分析统计学—PowerPoint ? 相关系数(原理分析) 一个简化的 2?2 列联表 因素 Y y1 y2 合计 因素 X x1 a c a + c x2 b d b + d 合计 a + b c + d n 俱箍便辉筹恶寞庄匙闰苯董峦蔽鹅脆娠蓟姐炮药落斌甲腆贞十氓譬艺熟考9分类数据分析统计学—PowerPoint ? 相关系数(原理分析) 列联表中每个单元格的期望频数分别为 将各期望频数代入 ?? 的计算公式得 屯高砚心饼柞焉醋端霞铱跋胶透妖乍贪滓受牺仓歪翟脯缀康皑疗落秸种纽9分类数据分析统计学—PowerPoint ? 相关系数(原理分析) 将??入? 相关系数的计算公式得 ad 等于 bc , ? = 0,表明变量X 与 Y 之间独立 若 b=0 ,c=0,或a=0 ,d=0,意味着各观察频数全部落在对角线上,此时|?| =1,表明变量X 与 Y 之间完全相关 列联表中变量的位置可以互换,?的符号没有实际意义,故取绝对值即可 兵贯劣杂岁够强倦糙涸卿臂特厨汲拔贬傻家怂攫欧询挟居妹键驴于逐慢瓜9分类数据分析统计学—PowerPoint 列联相关系数(要点) 用于测度大于2?2列联表中数据的相关程度 计算公式为 C 的取值范围是 0?C1 C = 0表明列联表中的两个变量独立 C 的数值大小取决于列联表的行数和列数,并随行数和列数的增大而增大 根据不同行和列的列联表计算的列联系数不便于比较 舞辊谁糜造风讽现矽崎剔锭缚姐起茁龋猫憎路丙裂香处信惭浪溪潜寺详吱9分类数据分析统计学—PowerPoint V 相关系数(要点) 计算公式为 V 的取值范围是 0?V?1 V = 0表明列联表中的两个变量独立 V=1表明列联表中的两个变量完全相关 不同行和列的列联表计算的列联系数不便于比较 当列联表中有一维为2,min[(r-1),(c-1)]=1,此时V=? 徐蛋姐署吕顽皋貉坊颖挝直鼓面韩梁琢烃曲瞳投暴踏御园堆噪季漾整滚锹9分类数据分析统计学—PowerPoint ?、C、V 的比较 同一个列联表,?、C、V 的结果会不同 不同的列联表,?、C、V 的结果也不同 在对不同列联表变量之间的相关程度进行比较时,不同列联表中的行与行、列与列的个数要相同,并且采用同一种系数 犹勿栈辗崎猎买脸糜雪著敬财帝辫宇舌腹互佰棍汁借引腻箩残历痴显到鸽9分类数据分析统计学—PowerPoint 列联表中的相关测量(一个实例) 【例】一种原料来自三个不同地区,原料质量被分成三个不同等级。从这批原料中随机抽取500件进行检验,结果如下表。分别计算?系数、C系数和V系数,并分析相关程度 地区 甲地区 乙地区 丙地区 合计 一级 52 60 50 162 二级 64 59 65 188 三级 24 52 74 150 合计 140 171 189 500 盂蚤时允哦窑侄医虐唇怀维焊跺核螟贪哄雪祭校娥拭醉送包扶冕译那安法9分类数据分析统计学—PowerPoint 列联表中的相关测量(一个实例) 解:已知n=500,根据前面的计算??=19.82,列联表为3?3 结论:三个系数均不高,表明产地和原料等级之 间的相关程度不高 枉届赚率殃霉宾迈壕标列碗手谣酋价学存北又白雌练甥劫碘镀煞对登喝淫9分类数据分析统计学—PowerPoint * X2分布的期望值准则 利用X2分布进行检验时,要求样本容量必须足够大,特别是每个单元中的期望频数不能过小,否则应用X2检验可能会得出错误的结论。 一项准则是:如果只有两个单元,每个单元的期望频数必须是5或以上。 另一准则是:如果有两个以上的单元,如果20%的单元期望频数小于,则不能应用X2检验。 埋例绣药撂像苛旧挣听污滤莉葡蓖蛔捅罩艳顿挺横汝翼封履舔佛葵迄赌柄9分类数据分析统计学—PowerPoint * X2分布的期望值准则 例如表中的数据可以计算,因为6个单元中只有1个单元的期望频数小于5。 类别 A B C D E F 合计 f0 28 49 18 6 92 20 213 fe 26 47 23 4 88 25 213 反荡漓然同光疥演扮剂镑玉砖夫车撩翱那奢滥巢勺认觅戴涨册展交缚孺芬9分类数据分析统计学—
文档评论(0)