- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
摘要
摘要
论文题目:基因表达数据的荟萃分析方法研究
硕士研究生姓名:盛梦颖
导师姓名:顾万君
学校名称:东南大学
随着生物芯片以及高通量测序技术的发展和广泛应用,生物组学数据爆炸性增长。其中,伴随着转录
组数据的积累和相关公共数据库的建立,基因表达数据的研究日益增多。然而,基于转录组的研究通常存
在样本量小、维数高等问题,使得结果的统计意义不足。为了提高研究结果的可重复性,研究者通常收集
不同研究的原始数据进行整合荟萃分析 (meta-analysis )。研究表明,通过基因表达数据的荟萃分析得到的
生物标志物 (尤其是癌症诊断和预后的基因标志物)具有很好的临床转化潜力。但是,现有荟萃分析方法
并没有充分考虑基因表达数据的生物学信息,因此所发现的生物标志物在独立验证数据中的预测效果不佳。
为了克服现有荟萃分析方法用于生物标志物发现中存在的缺点,本课题对基因表达数据的荟萃分析方
法展开研究,在荟萃分析中充分考虑基因表达数据的内在生物学信息。论文以肺癌基因表达数据的荟萃分
析为例,整合来自多个研究的肺癌组织的基因表达数据,开发新的荟萃分析方法从肺癌基因表达数据中寻
找用于肺癌分型和预后预测的生物标志物。首先,论文构建了基于生物通路(Biological pathway )的荟萃
分析方法并应用于肺癌基因表达数据,寻找用于肺癌分型和预后预测的基因标志物。其次,论文探索基于
降噪自编码器 (Denoising autoencoder )的基因表达荟萃分析方法,同样应用于肺癌基因表达数据发现肺癌
分型和预后预测的生物标志物。最后,论文比较了新的荟萃分析方法与现有的基于组合效应量和机器学习
方法分析策略的荟萃分析方法的优劣。
本课题探索并建立了新的基因表达数据荟萃分析的方法和流程,通过对肺癌组织基因表达数据的分析
得到了相对可靠的肺癌分型和预后预测的基因签名,为肺癌分子标志物的寻找提供了新思路,也为基因表
达数据荟萃分析提供了新策略。
关键词:基因表达数据,荟萃分析,生物通路,基因标志物,降噪自编码器
I
Abstract
Abstract
Title:Study of meta-analysis methods on gene expression data
Graduate Name:SHENG Meng-ying
Supervisor:GU Wan-jun
Name of the University :Southeast University
With the development and wide application of microarray and high-throughput sequencing technology, the
amount of biological omics data is growing rapidly, including transcriptome. However, due to relatively small
sample size, transcriptome studies usually have limited ability to obtain statistically effective results. To increase
the reproducibility of transcriptome studies, meta-analysis has been performed to integrate gene expression data
from multiple studies. Meta-analysis on gene expression data has great potential in clinical practice of disease
management, especially discovering genetic markers for cancer diagnosis
文档评论(0)