多概率模型人类遗传疾病基因预测.docVIP

下载本文档

15
0
约1.8万字
约 19页
2017-09-03 发布于安徽
举报
版权申诉

多概率模型人类遗传疾病基因预测.doc

1、本文档共19页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

哈尔滨工业大学硕士学位论文开题报告题目：多概率模型的人类遗传疾病基因预测院、系、部计算机科学与技术学院学科、专业计算机科学与技术导师王亚东研究生王宗尧年级 2008硕开题报告日期 2009.9 研究生院培养处 2009年9月目录 1 课题的来源和研究目的及意义 1 1.1 课题的来源 1 1.2 研究的目的及意义 1 2 国内外研究现状与分析 2 2.1国内外研究现状 2 2.2 目前面临的主要问题 4 2.2.1 构建疾病表型相似度网络问题 4 2.2.2 建立致病基因预测的数学模型问题 4 2.2.3 构建概率空间问题 4 3 主要研究内容 5 3.1 疾病表型的文本挖掘和高信度蛋白质相互作用集合 5 3.2 概率空间模型 5 3.3 致病基因预测问题的数学模型 6 3.4 系统优化与评测方案研究 6 4 研究方案 6 4.1 构建疾病表型相似性网络和蛋白质相互作用网络 6 4.2 预测致病基因的数学模型及其概率空间 8 4.2.1 基本概念 8 4.2.2 相互关联概率空间 9 4.2.3 中心概率空间 10 4.2.4 外形概率空间 11 4.2.5 综合估计策略 12 5 系统开发设计进度安排，预期达到的目标 13 6 预计可能遇到的困难以及解决措施 13 6.1 原始数据的处理 13 6.2 概率模型的选择和参数的估计 14 6.3 系统性能评测和优化 14 7 主要参考文献 15 1 课题的来源和研究目的及意义 1.1 课题的来源本课题来源于国家自然科学基金面上项目“基于表型相似性的人类遗传疾病基因预测方法研究”。 1.2 研究的目的及意义人类基因组计划（Human Genome Project，HGP）启动于1990年，结束于2003年4月14日。疾病基因。传统的基因定位方法，如连锁分析和关联研究，在这领域显成。大，数百个基因，HPRD数据库等数据源把这些数据进行了整理与集成。这些数据蕴含着具有巨大潜在价值的信息，从这些海量的数据中通过已知基因与疾病显型之间的关联、蛋白质相互作用，利用生物信息学方法，对疾病的候选诱发基因进行排序，从而为具体的生物学实验提供精简的候选基因列表，具有广泛的科研价值和迫切的市场需求，是近年来生物信息学方面研究的热点和难点之一。 2 国内外研究现状与分析 2.1国内外研究现状候选基因方法的研究主要包括：1）基于位置映射的方法[ 6-8 ]，根据遗传学知识把诱发基因锁定在染色体的某一区间内，再对该区域用实验的方法一一认定；2）比较基因组学的方法[ 9-10 ]，利用跨物种的办法来评估候选基因的影响；3）基因功能的方法，利用疾病基因特征来评估基因与疾病之间的关联性[11-18]；4）生物信息学方法。表型相似的疾病往往由功能相关的基因引起，被称为遗传疾病的模块性[19-20]，这表明导致相同或类似表型疾病的基因，一般在同一个生物模块内，或者在同一个蛋白质的复合体内[21]，或者在同一个通路上[22]，或在蛋白质相互作用的同一个子网络上[23]。由此可见，模块性意味着基因之间的关联和显型之间的相似性两者之间存在正向关联，这为疾病基因预测方面利用基因与显型之间二元关系提供了生物学依据，基于这一原理人们进行了大量有成效的研究工作[24-40]。传统上这些方法的测评是通过测量位置浓缩的平均概率倍数来进行即便这项测量并没有考虑到严格意义上方法之间的比较。如果一种方法能够在％的连锁区间中的所有候选项中％真正的排在最前段，那么在成功预测间隔内有十倍的浓缩，并且五倍的平均浓缩。1 国内外研究方法成果比较方法在所有区间内的浓缩率在成功预测区间上的浓缩率 Lage et al. 23.1 108.8 Perez-Iratxeta et al. 19.4 31.2 Freudenberg et al. 13.3 17 Aerts et al. - 15.4 Oti et al 10.0 10.0 van Driel et al. - 10.0 Adie et al 5.6 6,0 Turner et al. 5.2 27.7 Franke et al. 3.6 15.0 Xuebing Wu et al. 53.5 - 在国外，Lage等人在21.2％的中108.8倍对所有连锁23.1倍。Perez-Iratxeta等人功平均率为31.2倍，对所有平均浓缩19.4倍。van Driel等人平