- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
赤拟谷盗基因组中microRNA的生物信息学预测与进化分析.doc
赤拟谷盗基因组中microRNA的生物信息学预测与进化分析
摘要:本文通过计算机编程技术以及预测miRNA的RNAfold和Triplet-SVM软件在赤拟谷盗基因组中预测了43个miRNA。进一步对预测的miRNA进行长度统计以及保守性分析。
Abstract: As a result 43 miRNA have been predicted. These miRNAs were further validated by statistical and phylogenetic analyses. Some miRNAs are found to cluster in scaffold by genome location analysis.
关键词: 赤拟谷盗;基因组;microRNA;生物信息学; 进化分析
Key words: tribolium castaneum;genome;microRNA;bioinformatics;evolution analysis
中图分类号:Q752文献标识码:A文章编号:1006-4311(2010)11-0207-02
0引言
昆虫是地球上种类最多,分布最广的动物类群。不但对于生物学基础研究非常重要,而且昆虫对于人类健康和农业经济也有重要意义。然而昆虫microRNA的研究却远远落后于哺乳动物、线虫和植物[1]。随着许多昆虫全基因组测序的进行及完成,昆虫microRNA研究迎来了一个新的发展阶段。正在从生物信息学预测、高通量克隆、特定microRNA的功能研究等几个方面迅速展开。而这也将为揭示microRNA在昆虫生长发育中的作用奠定基础。赤拟谷盗作为一个新的模式昆虫,对它们的研究有利于进行农业害虫防治以及人类疾病治疗。本研究工作利用计算机技术以及RNAfold和Triple-SVM算法预测赤拟谷盗基因组中的miRNA,结果总计预测了43个miRNA。在所预测的miRNA中,发现其中有14个miRNA成簇存在,有些miRNA存在于基因间区或内含子中。根据NCBI数据库中提供的编码基因的注释信息,利用计算机编程技术提取了赤拟谷盗基因的3′ UTR序列,并构建了本地的UTR数据库,通过miRanda软件预测这些miRNA基因作用的靶标。同时进一步对这些预测的miRNA基因做了家族进化分析。
1材料和方法
1.1 数据来源从UCSC数据库下载了赤拟谷盗的基因组数据(/)。 同时从miRBase数据库(版本11.0)中下载了果蝇中已报导的152条miRNA成熟体序列(BDGP5.0)(http://microrna.sanger.ac.uk /cgi-bin/ sequences/ browse.pl)。从NCBI的GenBank数据库下载了赤拟谷盗的mRNA序列,并利用自编的Perl程序根据基因组注释信息提取了mRNA的3′ UTR序列,并构建本地数据库。
1.2 赤拟谷盗基因组中miRNA的预测流程总体实验分析流程利用自己编写的Perl程序提取已公布的152个果蝇miRNA基因的2-8位的种子序列,并利用这些种子序列扫描赤拟谷盗基因组,扫描过程中允许种子序列完全匹配,并向两边延伸截取长度为22个核苷酸的候选序列做下一步分析。接下来利用PatScan软件对从赤拟谷盗基因组中截取到的22个核苷酸的候选序列与果蝇中已知的miRNA序列做同源比对,参数设置为允许二个错配(mismatch)、一个插入(insertion)、一个缺失(deletion)。将符合条件的22nt同源序列利用Perl程序将其完全匹配到基因组上,接下来采用以下方法截取可能的miRNA前体序列:分别截取该序列两侧的75个碱基的序列 (60+15 bp 或 65+10 bp)。然后利用RNAfold软件分别计算其二级结构的自由能[2],这里将自由能界限设为ΔGfolding ≤ -18kcal/mol,如果每个序列所对应的四个前体都符合条件,保留自由能最低的那条前体做下步分析。接下来进行miRNA的初步预测,利用本地版的Triplet-SVM 软件[3],其原理是根据已公布的miRNA的特征,对要分析的miRNA进行特征识别,从而确定可能的miRNA。最后筛选出43个可能的miRNA。
1.3 赤拟谷盗基因组定位和成簇分析利用自己编写的Perl程序,对miRNA在赤拟谷盗每个Scaffold上的分布进行统计。miRNA在赤拟谷盗的基因组上并非均匀分布,而是存在很多热点(hot spot),本研究工作对一个miRNA分布较多的ChLG3进行分析。结果发现有11个miRNA存在于这个Scaffold上,并且发现了三个miRNA簇。此外,还对所有miRNA
文档评论(0)