- 35
- 0
- 约3.42千字
- 约 11页
- 2017-06-03 发布于湖北
- 举报
主流可变剪切软件识别原理剖析
总结 随着多物种的基因组测序结果公布,人们发现蛋白质编码基因的数量并没有随着生物复杂性的增加而增加,进而发现了可变剪切的机制。可变剪切是指mRNA前体中的外显子以不同的组合方式进行剪切和拼接,从而产生不同结构及功能的mRNA和蛋白质。这种由同一基因产生不同结构的mRNA和蛋白质称作可变剪切。目前已发现的可变剪切共有五种类型:外显子跳读(图1A)即在进行序列剪切时会跳过一个外显子。互斥外显子(图1B)即进行序列剪切时存在两个外显子,二者选一进行剪切。3.内含子保留(图1C)即剪切时不剪切内含子。4.可变5’供体(图1D)即剪切上游长度不定的外显子。5.可变3’受体(图1E)即剪切下游长度不定的外显子。图1 可变剪切类型单末端和双末端测序结果均可用于检测可变剪切事件 ,但二者的原理不尽相同。单末端测序是将测序得到的reads比对到参考基因组中,如果特定的外显子没有对比到参考基因组,则标记为在转录本中可能为选择性剪切事件。而双末端测序产生的是成对的reads,将成对的reads匹配到参考基因组上,然后对每对reads之间的实际距离与理论距离进行计算,推测转录本的结构。以下为几种较为常用的可变剪切识别工具,接下来将对以下几种不同可变剪切机制识别软件的功能特点进行简单的介绍: AStalavisa原理:与其它软件都是相同的标记代码不同,AStalavisa计数系统将每一个未映射成功的reads相对应的位置标记唯一的代码。首先将reads与转录本进行映射,并将未在重叠转录本覆盖的reads作为拼接结构进行检测,然后根据基因组坐标系,将剪切位点的变化生成AS代码描述相应的可变剪切事件。AStalavisa会将相同类型的可变剪切归类到相同的分类结构组中,无论使用多少转录本进行比对它都会过滤去除冗余的数据来确定唯一的可变剪切事件。AStalavisa功能主要集中于拼接结构的变化,而非外显子或内含子的属性选择,它克服了复杂剪切事件预测的难题。AStalavisa适用于所有物种的基因组或自定义基因的一部分。AStalavisa是一种预测方法而非固定的数据,所以预测准确度依赖于不同的注释文件,种特异性和编码活动制约性。图2 AStalavisa示例结果DiffSplice:是RNA-seq全基因组水平不同剪切机制的检测软件,尤其适用于比较不同细胞之间转录租的基因差异表达分析,同一细胞不同状态下或不同发展阶段之间的基因差异表达分析。DiffSplice采用从头计算的方法,它不需要完整的转录注释文件,而是使用ASMs局部化搜寻可变剪切位点,这种局部化能够减少样品间相应的ASMs模块比较复杂度。DiffSplice首先会融合所有样品的RNA-seq序列进行图谱拼接重组,预测所有类型的转录及可变剪切事件。软件将外显子使用节点代替,若两个外显子节点间有reads覆盖则连接这两个节点。然后会自动识别基因组区域相应的ASMs,每一条拼接序列都相当于单入口单出口的子图,不同的子图会产生分歧,这种分歧在不同子图进行比对时就会被识别为可变剪切位点。转录组图谱拼接有两种方法,一种是根据基因组比对进行拼接,另一种是根据RNA-seq进行从头拼接。接下来会使用ESG(表达权重拼接图谱)对ASMs进行识别,其中每个ASMs被定义为单条子图拼接图谱,其中小的ASMs会嵌入更大的ASMs子图谱中。图3 DiffSplice原理DSGseq:采用负二项式(NB)模型化阅读外显子,并且提出NB统计数值来检测两组样品基因中的全部外显子的不同剪切方式,这种方法是基于外显子而开发的新途径。其他大部分的检测可变剪切的软件第一步都会将所有可变剪切类型进行评估,然后进行可变剪切类型的比例计算 ,这种机制往往会检测到许多额外的假阳性的可变剪切。而DSGseq直接使用外显子来检测可变剪切类型,它不需要剪切类型组成的信息,也不需要剪切类型的表达量。当两组样品进行比对时,外显子出现中部缺失的现象判定为内含子保留,两个外显子之间增加单一位置外显子为外显子跳跃,两个外显子之间增加多个位置外显子为外显子互斥,外显子5’或3’长度不同为可变供体或可变受体。图4 DSG seq原理RNAexpress:是一款界面友好、计算效率较高和计算方式灵活的新型注释软件,它不依赖其他主流的注释文件,能够有效的识别转录本与基因组及转录特征。相较于其他只关注识别可变剪切的软件,RNAexpress功能更加强大,它能够识别一些非编码的长短链RNA、新的转录起始位点、可变启动子、RNA编辑位点和编码转录本的过程。RNAexpress可识别BAM格式文件,输出GTF格式文件。该软件简单易懂,允许用户添加新的类模块来建立新的识别算法。RNAexpress分析过程分为以下6个阶段,每个阶段都有独立的输出文件。数据的输入及转化样
您可能关注的文档
- 蛋白质组学与分析技术第二讲课件.ppt
- 蜂包坡岩子崩塌调查报告课件.doc
- 蛋的结构与形成课件.ppt
- 蜂窝纸包缓冲包装综述课件.ppt
- 蜂--唐-罗隐-课件课件.ppt
- 蜂针疗法在风湿病课件.ppt
- 蜂窝纸板的培训讲义课件.ppt
- 主墩桩基施工QC剖析.doc
- 蜈支洲岛旅游景区生态保护调查研究课件.doc
- 主成份因子分析剖析.ppt
- 2025-2026学年科普版七年级下册英语Unit7 Being a Smart Shopper素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit10 Lending a Helping Hand素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit11 Rules Matter素养测评卷(含答案).docx
- 2025-2026学年科普版七年级下册英语Unit12 Better Together素养测评卷(含答案).docx
- 2026年中考英语语法选择专题训练(含答案).docx
- 2026中考语文二轮学思并重,涵养君子之德论语十二章、虽有佳肴、大道之行也.docx
- 中考文言文常见文化常识梳理.docx
- 中考语文二轮:内修君子德外尽忠臣心诚子书出师表修身立德主题学习.docx
- 中考语文二轮:不一样的求学路一样的成长梦送东阳马生序劝学主题学习.docx
- 中考语文二轮:《陋室铭》《爱莲说》托物寓意主题学习.docx
最近下载
- 质量检验员培训课件.ppt VIP
- 一种预制装配式风机基础、风机及施工方法.pdf VIP
- 2023年岳阳市初中学业水平考试数学试卷参考答案 .pdf VIP
- 2026年大庆医学高等专科学校单招职业技能考试题库及答案详解(全优).docx VIP
- 《养老机构智慧运营与管理》教学设计——项目8 养老机构的风险管理与安全管理.docx VIP
- 2025年国际注册内部审计师(CIA)资格考试(内部审计基础)历年参考题库含答案详解.docx VIP
- 北师大版高一下学期数学(必修二)《1.2 任意角》同步练习题及答案.docx VIP
- 健美操教学计划与教案.docx VIP
- 新闻学西方媒介理论.pptx VIP
- 公消(2016)113号-关于加强超大城市综合体消防安全工作的指导意见标准.pdf VIP
原创力文档

文档评论(0)