网站大量收购独家精品文档,联系QQ:2885784924

要怎么证明LncRNA是LncRNA?!.doc

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
要怎么证明LncRNA是LncRNA?! 我叫骨头,是万事屋的大腿挂件。最近的课题是LncRNA,LncRNA,LncRNA,重要的事情说三遍,但是我的LncRNA到底是不是LncRNA呢?我怎么陷入到了这样一个漩涡里呢!? 先不要靠师兄师姐,我就自己找找看吧,有一篇这样的Cell上的文献: 这篇文献里提到:“The non-coding nature of lncARSR was confirmed by coding-potential analysis (Figure S1M).”然后我看了一下Supplement Figure。 Fig. legend是这样写的:(M) Upper: Prediction of putative proteins encoded by lncARSR using ORF Finder. Lower: The codon substitution frequency scores (CSF) of lncARSR.? 首先我明白一件事,就是要先分析这个lncRNA的ORF,也就是开放式阅读框。但是接下去要做什么呢?CSF又是啥?师姐,我要怎么办??? 莫愁:这个啊,其实不是很复杂啦,我们就拿这篇文献来做例子吧。首先,我们找到这篇文献描述的这个lncRNA是啥。 就是上面这个编号的lncRNA。接着我们,登陆到NONCODE(/)上去,把这LncRNA序列调出来: 得到这个序列: 那接下来,验证这个RNA到底是不是lncRNA呢?首先我们要了解的,就是lncRNA是不能编码的,那就没有足够的ORF,也就是开放式阅读框。那我们就登陆到PubMed的ORFfinder(/orffinder/)上去。 调整一下,看看到底有多少个氨基酸(aa),我就调到了最低30个氨基酸的选项: 搜索获得的结果发现,没有一个ORF是超过200nt的,这就说明可能是非编码的RNA。接着,我们把所有正义链(标识+的ORF)进行BLAST。 BLAST结果发现这些短肽都没有同源性的蛋白质,这就更进一步说明了,这RNA可能不表达蛋白。 接着我们来看CSF,CSF到底是啥?CSF其实就是密码子的突变率。理论上编码区的密码子相对来说是保守的,也就是在物种中或者物种间是不容易产生突变,而非编码的就有点乱来了。我找到了这篇文献: 这是一篇在果蝇中用CSF来验证非编码与编码RNA间CSF差异的文献。其中显示,非编码的RNA突变率更高。 这篇文献用的是两个指标,一个是CSF(密码子替换频率,Y轴),另一个是RFC(阅读框保守性,X轴),见下图: 可以看到ncRNA的CSF值都小于0。由于序列保守性的问题,所以在这个CSF值的基础上,Michael又延伸出了一个新的,引入进化模型的值PhyloCSF。现在用于验证lncRNA的大多数是PhyloCSF值,详见下面这篇文献哈: 那问题来了,我们要怎么分析序列的PhyloCSF值呢?首先,要登录到强大到不要不要的UCSC上,随便进一个序列,我选了一个LncRNA——HOTAIR。然后点击“Track hubs”按钮。 进去之后,选择“My Hubs”。 在里面添加这个网址,我知道你们懒,所以不能惯着你们: 接着点击确认(上面看不清就看下面): 然后会弹出UCSC的封面,输入HOTAIR后进入: 结果会直接显示HOTAIR的PhyloCSF值,可以明显地看到,在HOTAIR的外显子上所有的值都是小于0的,也就是没有保守型。 那我们把那篇Cell中的lncRNA的序列位置输入进去,然后…… 可以看到,也没什么保守性。以此我们可以初步判断,这个RNA极有可能不能编码蛋白质,也就是lncRNA。 …华丽丽的分割线… 李莫愁博士:我估计好多人不会来看这个帖子呢,因为太长了,但这是一个LncRNA确认的基本步骤。最实际的,就比如通过二代测序后获得有差异的,可能不能编码蛋白的RNA,那要用什么来验证呢?这篇Cell告诉我们要用ORF和CSF来验证是否是LncRNA。 其实验证ORF之前,其实还有一个问题大家可能也不会去注意,那就是Kozak序列,Kozak序列是核糖体结合位点,没有这个,其实再怎么样的阅读框也没办法翻译成蛋白。然而有一些LncRNA是具有翻译短肽功能的,还有一些假基因,这就很难用这样的方法来确认了。好了,今天就策到这里吧。

文档评论(0)

南江月 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档