组学研究样本量的综合评估与计算及在线工具开发.pdfVIP

组学研究样本量的综合评估与计算及在线工具开发.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中文摘要 摘 要 通过高通量技术的应用,组学研究已经可以同时测量成百上千特征表达值的 改变。然而,虽然组学研究在生物医药、疾病等领域取得了一系列的成功,但是 也出现了一些问题严重阻碍着组学的进一步发展与进步。这些问题包括研究的统 计功效过低、结果重现性较差等问题。这些问题的出现得到了极大的关注,并且 被认为是多种原因的结果。有研究人员提出,在这些原因当中,样本量是解决问 题的关键。 在组学研究中,样本量是一个关键因素,它意味着该项研究科学性与伦理性 的平衡。如果一个研究的样本量过小,则会影响该研究发现真正的科学问题,最 终导致时间和成本的浪费;而相反,如果研究的样本量过大,则意味着在实验中 投入了过多的样本,提高了研究的成本,特别当研究有潜在危害性时,还会引起 伦理问题。因此,在组学研究中有必要进行样本量的评估与计算。 统计功效、分类准确率及结果稳定性分别从不同角度对组学研究的样本量进 行评估。统计功效能够反映该项研究的灵敏度,它是指一项研究发现组间差异的 能力。分类准确率是指通过组学发现的生物标志物所建立预测模型的预测准确率, 一般用AUC 、ACC 等来表示。结果稳定性表示发现标志物的可重复性,即针对同 一疾病所建立标志物的一个性能评估,可以通过Overlap,Concordance ,Weighted Consistency 等标准来进行评估。考虑到这三项指标之间相互补充,缺一不可,能 够对组学的样本量进行综合的评估与计算,满足组学研究的需要,我们开展了以 下工作: 首先,对不同数据在相同样本量下的指标数值进行对比研究,结果表明,在 样本量评估时,不同数据之间相互独立,这一结论通过对不同数据达到相同指标 阈值所需要的样本量进行对比得到了进一步验证,因此,我们认为在进行样本量 的评估计算时,不存在一个数值对组学研究的样本量进行笼统的概括,而应该针 对不同的数据进行相应的研究。 然后,我们对同一数据达到不同指标阈值所需要的样本量进行比对,发现结 果会随着指标的不同而不同,而且数值之间不存在相关性,指标之间相互独立。 同时,我们对18 组来源于不同组学数据的样本量进行计算,发现满足不同指标阈 值所需要的样本量的大小顺序之间不存在一定的规律,因此无法简单的将某一指 标作为最宽松或最严格标准来看待。因此,在进行样本量的评估与计算时,我们 建议应该采用多指标、综合的研究。 最后,我们借助 R ‘shiny’ 包构建相应的在线工具——SSizer ,用于进行组学 I 重庆大学硕士学位论文 样本量的综合评估与计算。SSizer 整合了三种指标(统计功效、分类准确率、结果 稳定性)共六项标准(Power ,AUC ,ACC ,Overlap ,Concordance ,CW ),以及 多种数据预处理、分析算法,为满足不同研究的需求。同时,通过准确的数据模 拟算法的引入,SSizer 能够基于上述三项标准对相应研究的样本量进行计算,从而 帮助后续研究更好地开展,使研究在拥有足够样本量的前提下进行。 综上所述,本次研究从组学样本量出发,基于三种常见指标,对组学样本量 进行综合地评估与计算,并在此基础上,建立相应的在线工具,帮助科学家们更 好地从研究中发现生物学问题,促进生命科学、生物医药领域的进一步发展与进 步。 关键词:样本量;统计功效;分类准确率;结果稳定性;在线工具 II 英文摘要 Abstract Through the application of high-throughput techniques, omics study can measure the expression

您可能关注的文档

文档评论(0)

136****6583 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:7043055023000005

1亿VIP精品文档

相关文档