- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
要怎么证明LncRNA是LncRNA?!
我叫骨头,是万事屋的大腿挂件。最近的课题是LncRNA,LncRNA,LncRNA,重要的事情说三遍,但是我的LncRNA到底是不是LncRNA呢?我怎么陷入到了这样一个漩涡里呢!?
先不要靠师兄师姐,我就自己找找看吧,有一篇这样的Cell上的文献:
这篇文献里提到:“The non-coding nature of lncARSR was confirmed by coding-potential analysis (Figure S1M).”然后我看了一下Supplement Figure。
Fig. legend是这样写的:(M) Upper: Prediction of putative proteins encoded by lncARSR using ORF Finder. Lower: The codon substitution frequency scores (CSF) of lncARSR.?
首先我明白一件事,就是要先分析这个lncRNA的ORF,也就是开放式阅读框。但是接下去要做什么呢?CSF又是啥?师姐,我要怎么办???
莫愁:这个啊,其实不是很复杂啦,我们就拿这篇文献来做例子吧。首先,我们找到这篇文献描述的这个lncRNA是啥。
就是上面这个编号的lncRNA。接着我们,登陆到NONCODE(/)上去,把这LncRNA序列调出来:
得到这个序列:
那接下来,验证这个RNA到底是不是lncRNA呢?首先我们要了解的,就是lncRNA是不能编码的,那就没有足够的ORF,也就是开放式阅读框。那我们就登陆到PubMed的ORFfinder(/orffinder/)上去。
调整一下,看看到底有多少个氨基酸(aa),我就调到了最低30个氨基酸的选项:
搜索获得的结果发现,没有一个ORF是超过200nt的,这就说明可能是非编码的RNA。接着,我们把所有正义链(标识+的ORF)进行BLAST。
BLAST结果发现这些短肽都没有同源性的蛋白质,这就更进一步说明了,这RNA可能不表达蛋白。
接着我们来看CSF,CSF到底是啥?CSF其实就是密码子的突变率。理论上编码区的密码子相对来说是保守的,也就是在物种中或者物种间是不容易产生突变,而非编码的就有点乱来了。我找到了这篇文献:
这是一篇在果蝇中用CSF来验证非编码与编码RNA间CSF差异的文献。其中显示,非编码的RNA突变率更高。
这篇文献用的是两个指标,一个是CSF(密码子替换频率,Y轴),另一个是RFC(阅读框保守性,X轴),见下图:
可以看到ncRNA的CSF值都小于0。由于序列保守性的问题,所以在这个CSF值的基础上,Michael又延伸出了一个新的,引入进化模型的值PhyloCSF。现在用于验证lncRNA的大多数是PhyloCSF值,详见下面这篇文献哈:
那问题来了,我们要怎么分析序列的PhyloCSF值呢?首先,要登录到强大到不要不要的UCSC上,随便进一个序列,我选了一个LncRNA——HOTAIR。然后点击“Track hubs”按钮。
进去之后,选择“My Hubs”。
在里面添加这个网址,我知道你们懒,所以不能惯着你们:
接着点击确认(上面看不清就看下面):
然后会弹出UCSC的封面,输入HOTAIR后进入:
结果会直接显示HOTAIR的PhyloCSF值,可以明显地看到,在HOTAIR的外显子上所有的值都是小于0的,也就是没有保守型。
那我们把那篇Cell中的lncRNA的序列位置输入进去,然后……
可以看到,也没什么保守性。以此我们可以初步判断,这个RNA极有可能不能编码蛋白质,也就是lncRNA。
…华丽丽的分割线…
李莫愁博士:我估计好多人不会来看这个帖子呢,因为太长了,但这是一个LncRNA确认的基本步骤。最实际的,就比如通过二代测序后获得有差异的,可能不能编码蛋白的RNA,那要用什么来验证呢?这篇Cell告诉我们要用ORF和CSF来验证是否是LncRNA。
其实验证ORF之前,其实还有一个问题大家可能也不会去注意,那就是Kozak序列,Kozak序列是核糖体结合位点,没有这个,其实再怎么样的阅读框也没办法翻译成蛋白。然而有一些LncRNA是具有翻译短肽功能的,还有一些假基因,这就很难用这样的方法来确认了。好了,今天就策到这里吧。
您可能关注的文档
- 履历表范本完整版.doc
- 体积弹性模量计算公式.doc
- 摔落测试报告范本.doc
- 《糖尿病足》PPT课件.ppt
- 岗位职责范本.doc
- 技术标范本完整版.doc
- 酒店内部联络单表格范本.doc
- 解决技术问题的单位考核推荐意见(范本).doc
- (范本)延期申报申请核准表.doc
- 模流分析报告解读范例.ppt
- 森林群落发育及演替.ppt
- 2025届江苏省苏州市工业园区中考一模数学卷(含解析).pdf
- 高中历史选择题考试技术(四)考试技巧之逻辑判断 用“全面”的观点 高考历史做题方法指导.pptx
- 10,2酸和碱的中和反应课件--九年级化学人教版下册.pptx
- 2025届江苏省泰州市兴化市中考一模数学试卷(附解析).docx
- 2025届江苏省扬州市中考一模数学试卷.docx
- 2025届江苏省泰州市靖江市中考一模数学试卷(附解析).docx
- 9.3 力与运动的关系 -八年级物理下册课件(苏科版).pptx
- 2025届江苏省中考数学一模试卷(附解析).docx
- 2025年江苏省常熟市中考第一次适应性考试数学试卷(附解析).docx
最近下载
- 丧葬礼仪《丧帖诸称呼总目列论.docx
- 中南标准11ZJ901室外装修及配件.pdf
- 湖南省“一起考”大联考2024-2025学年高三下学期第一次模拟考试 物理试卷(含解析).docx VIP
- 药师考试《历年真题》测试试卷(附答案).pdf VIP
- pH值分析原始记录表.doc
- 主题班会:上课睡觉的危害.ppt VIP
- 2023年四川省南充市中考数学真题含参考答案及评分标准.pdf
- DB34_T5069-2017:屈曲约束支撑结构技术规程.pdf VIP
- 赣州市章贡区传统武术的发展现状调查与分析.docx VIP
- 2025年落实“大学习、 大培训、 大考试”培训题库(含答案) .pdf VIP
文档评论(0)