网站大量收购独家精品文档,联系QQ:2885784924

大规模假设检验 - 贝叶斯之道.pdf

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大规模假设检验 - 贝叶斯之道

大规模假设检验 大规模推断讨论班 统计学的发展进步要归功于我们的科学同仁们,他们从我们的工作中获得的数据更加“原始”。 二十世纪早期费舍尔对农业试验的研究推动了方差分析的发展。在 21 世纪伊始,类似的事情正在 上演。一类新的“高产量”的生物医学装置,典型例子是微阵列,这种装置可以例行般地马上产生 几千次实例的假设检验数据。这一点不是典型频率检验理论(以纽曼、皮尔森、费舍尔为代表)所 预想的情形。这一章开始讨论大规模联立假设理论,这一理论正在统计文献中不断发展。 2.1 一个微阵列的例子 图2.1 是一个前列腺数据的微阵列。这些数据是从 202 个测试者(其中 50 个健康正常人,52 个前列腺癌病患者)中各提取 6033 个基因的基因表达水平获得的。我们姑且不深究这些基因表达 的生物学细节,而是把发现少量的“令我们感兴趣”的基因作为我们研究的主要目标。这些我们要 寻找的基因的表达水平介于正常的和癌变的前列腺细胞基因表达水平之间。因而一旦确定识别了这 些基因,我们便会进行进一步的调查研究以确定这些基因是否和前列腺癌病的发展具有因果关系。 基于上面对前列腺数据的描述,我们可以了解到,前列腺数据是一个 6033 行 102 列的矩阵(记作 X ), 它的元素为 xij = j 病人第i 个基因的基因表达, (2.1) 其中 i=1,2,...,N;j=1,2,...,n 。并且,j=1,2,...,50 表示健康人;j=51,52,...,102 表示癌症患者。令 x (1) i 和x (2) 分别表示健康人群和癌症患者人群中x 的平均值。那么两样本基因检测的t 统计量为: i ij x (2) x (1) i i ti = (2.2) Si 其中 si 是分子标准差的一个估计量 ∑ (xij x(1)) + ∑ (xij x(2)) 1 1 si = ( + ) (2.3) 100 50 52 如何只考虑基因i 的数据,通常我们可以用ti 来检验原假设 Hi : gene i is “null”, (2.4) i e 对没患癌症的和患癌症的人来说,x 有相同的分布. 如果 t 比较大则拒绝H . 基于标准的 . .. ij i i 理论假设下,拒绝的标准通常取5%,如果t 1.98 则拒绝原假设, 对于自由度为 100 的学生t 分 i 布双侧拒绝标准为 5%. 这里我们用“z 值”代替“t 值”,讨论会比较简便;就是说,把ti 转化为如下形式: z = Φ (F (t ))

您可能关注的文档

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档