统计学方法教案.ppt

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
FDR校正 ? p.adjust p.adjust(p, method = p.adjust.methods, n = length(p)) p.adjust.methods # c(holm, hochberg, hommel, bonferroni, BH, BY, fdr, none) 例p-c(0.0003,0.0001,0.02) p.adjust(p,method=fdr,n=length(p)); 采用的阈值足够大(如10),我们对鉴定出的差异表达就更加确信,但许多表达差异不是很大的基因就会漏掉。反过来,如果设定的阈值较小,虽然能够鉴定出更多的差异表达,却会以较高概率引入假阳性。 * * Y:a numeric vector; ignored if x is a matrix. Correct:No correction is done if simulate.p.value = TRUE. simulate.p.value: a logical indicating whether to compute p-values by Monte Carlo simulation. B:an integer specifying the number of replicates used in the Monte Carlo test. * 例如,研究两组个体,可用的患者数目可能相当小,并可能存在其他未知的遗传和健康水平的差异。在这样一组患者里,若是假定任何特定的基因或者蛋白质的表达水平服从正态分布就不符合实际。 * 为了比较两种方法的任务完成时间是否有显著差异,假设检验为:H0:任务完成时间的两个总体是相同的.H1:任务完成时间的两个总体是不相同的。?使用Wilcoxon符号秩检验方法的主要步骤:先求出每对数据的差值D,按差值绝对值|D|由小到大排列并给秩R,从秩1开始到秩10,注意工人编号为8的配对数据,由于差值为0,在排秩中丢弃,样本数目修正为n=11-1=10。在给秩值时,遇到相等|D|,也称为结值(tied),使用平均秩,如工人编号3和5具有相同的绝对差值0.4,所以平分秩3和秩4,各为秩3.5。一旦绝对差值的秩值R给出后,然后将R分成正和负差值的两个部分秩值R+和R-,最后求符号秩和T+、T-,如T-=2+3.5=5.5。 * 统计学方法 冯陈晨 Fold change 最简单的差异表达基因检测方法 利用两类样本基因表达平均值的比值是否达到一定阈值来判断差异表达基因 缺点:1.检测本身所必需的阈值难以准确判定;2.基于比值的方法对表达水平普遍偏低的基因效果很差。 为了更有效的鉴定出真实的表达差异,需要采用统计检验方法。 好处是能够为差异的显著性提供一个量化的描述。 我们描述的统计检验,实际上是估算两组表达水平测量值来自同一个分布的概率,也就是先认定没有差异表达。如果该概率值足够小,如小于0.01,则视为存在显著的差异,也就是这两组测得的表达值实际上来自两个不同分布的抽样。 卡方检验 卡方检验 例 比较试验组和对照组降低颅内压的疗效。将200例颅内压增高症患者随机分为两组,结果见表。问两组降低颅内压的总体有效率有无差别? 卡方检验 卡方检验 卡方检验 v=(2-1)(2-1)=1 卡方检验 卡方检验 注意: 1.当n≥40且所有的T≥5时,用χ2检验的基本公式;或用四格表资料的Fisher确切概率法。 卡方检验 注意: 2.当n≥40 但有1≤T<5时,用四格表资料χ2检验的校正公式;或改用四格表资料的Fisher确切概率法。 卡方检验 注意: 3.当n40,或T1时,用四格表资料的Fisher确切概率法。 在四格表周边合计数不变的条件下,利用超几何分布直接计算样本事件及比样本事件更极端情形发生的概率。 卡方检验 ? chisq.test chisq.test(x, y = NULL, correct = TRUE, p = rep(1/length(x), length(x)), rescale.p = FALSE, simulate.p.value = FALSE, B = 2000) 例x = matrix(c(100-10,10,200-30,30),nc = 2 , byrow = T) chisq.test(x) chisq.test(x,correct = TRUE) chisq.test(x,correct = FALSE) chisq.test(x,simulate.p.value = TRUE, B = 2000) T-test 通常对每个基因或蛋白质的表达水平,都会在每个样本中进行几次独立的测定。 这些测量

文档评论(0)

南非的朋友 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档