- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
mRNA可变剪接问题并行化研究
mRNA可变剪接问题并行化研究
摘要:对mRNA可变剪接问题进行了并行化分析和研究,解决了原AltSplice程序中Nbest参数选取欠合理的问题,结合实验实现了基于MPI平台的并行AltSplice版本MPI_AltSplice,并在5万亿次的联想深腾6800高性能计算机上获得了较好的运行性能。
关键词:可变剪接; AltSplice; 并行化; 表达序列标签(EST)序列库; 消息传送接口
中图分类号:TP311.52文献标志码:A
文章编号:1001-3695(2008)03-0705-04
面对人类基因组计划产生的海量分子生物学数据,生物信息学的重要性越来越突出,它无疑将会为生命科学的研究带来革命性变革[1]。随着测序技术的发展与成熟,对海量生物信息数据进行分析和处理已经演变为当前或未来生物信息学的中心任务,从而也促进了高性能计算技术在生物信息领域的应用与发展。人类的基因数目只有3万多个,这甚至比一些植物还少。那么,如何理解人比其他生物高得多的进化程度?一个重要原因是高等动物的很多基因(如人的基因有一半以上)都涉及mRNA可变剪接。mRNA可变剪接使一个基因能表达出多个不同的蛋白质,这使得人在蛋白质组水平上表现出极高的复杂性。mRNA可变剪接涉及生命现象的很多方面,如细胞分化、个体发育、免疫机理、某些遗传病的发生等[2]。例如,最新研究表明人类14号染色体上一个基因是neurexin 3,该基因的跨度达到170万个碱基对,是14号染色体上最大的基因,其大小是所有基因平均的30倍。由于可变剪接,这个基因可能存在上千个不同的微小变化,该基因与脑中的突触连接有重要作用。利用高性能计算技术进行这方面的研究有极其重要的科学和现实意义。
1可变剪接
基因转录时,先是产生与基因整体序列完全相同的RNA序列,称为前体mRNA;接着前体mRNA中一些称为内含子(introns)的片段被剪掉,剩下的称为外显子(exons)的片段被顺序连接在一起;再经过对头尾两端的一定处理,就成为成熟mRNA,这个过程叫做剪接[3]。一般地,一个基因的外显子和内含子的数目及所在位置是固定的,但是也可能出现外显子和内含子数目及所在位置不固定的情况。这时,一个基因可以转录成多个不同的成熟mRNA,称mRNA可变剪接,其直接后果是一个基因产生多个不同功能的蛋白质[4]。由于EST序列是成熟mRNA的一些镜像片段,如果某个基因在转录时存在可变剪接,而且相应的EST测序是充分的,就能通过EST与EST、EST与基因组序列间的比较找出各种mRNA可变剪接形式[5]。现有的实验证实,在mRNA剪接过程中会有四种规则的可变剪接形式,如图1所示。
1.1生物信息学方法研究可变剪接的可行性
用生物信息学方法研究可变剪接的可行性源于高通量的基因组测序和EST测序。EST来源于完全加工的mRNA,它们提供了一个广泛的mRNA多样性的样品库。计算机为这种多样性分析提供了更为便捷的工具。最近两年,多个研究小组通过不同的生物信息学方法从整个人基因组的水平进行分析,结果一致显示,约35%~60%的人基因有可变剪接形式。对大多数基因来说,每个基因只测了很少几个EST甚至没有EST;EST不是全长的mRNA,多位于mRNA的5’和3’端;EST来源于有限的组织和发育阶段;很有可能存在更多的可变剪接,而现在的EST库中没有显示。因此,实际可变剪接的频率可能比预测的更高。将高性能计算技术应用于充分测序的大容量EST序列库进行可变剪接分析,将有助于得到更多的可变剪接位点,从而对所表达的蛋白质以及相应物种的结构和功能分析提供便利。
1.2可变剪接的生物信息学分析方法
在生物信息学中,分析可变剪接的常用方法有两种:EST序列间相互比较;EST序列和基因组序列间比较。通过序列间相互比较来分析两条序列间相互匹配的部分。根据匹配部分的长度和位置来决定是不是存在可变剪接以及可变剪接的形式[6]。
如图2所示,通过ID为AA054824的EST序列和ID为AV730044的EST序列的匹配情况,可认为这种类型属于图1中的optional exon类型的可变剪接形式。说明在剪接过程中存在剪接变体。
2AltSplice简介
mRNA可变剪接分析软件程序AltSplice是由中国科学院生物物理研究所自主开发的。它通过EST序列之间的相互比较,找出那些涉及mRNA可变剪接的EST序列。该软件的核心算法是利用BLAST(basic local alignment search tool,基本局部比对搜索工具)相识性比对确定EST序列间或EST序列与基因组序列间相识性比对的长度和区域。BLAST由
您可能关注的文档
最近下载
- 深发展银行黄金td业务开户流程 深发展银行贵金属递延业务开户流程_.ppt VIP
- 中国国家标准 GB/T 40344.3-2024真空技术 真空泵性能测量标准方法 第3部分:机械增压泵的特定参数.pdf
- 固定资产盘点流程和方案.docx VIP
- 第6章细菌的感染与免疫.ppt VIP
- 【医脉通•指南】左卡尼汀在男性不育中临床应用专家共识(2014版).pdf VIP
- 高考英语语法新视角(中级英语测试指导).doc VIP
- 2020年最新版下肢静脉曲张临床路径.docx VIP
- 教育行为模式识别-洞察及研究.docx VIP
- 第12课《鱼纹话吉祥》教学课件-2024-2025学年岭南美版(2024)初中美术七年级上册.pptx VIP
- 特种设备安全总监职责.doc VIP
文档评论(0)