链特异性测序介绍.docx

下载文档 降价啦

87
0
约5.67千字
约 17页
2017-12-14 发布于河南
举报
版权申诉
保障服务

链特异性测序介绍.docx

1、本文档共17页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

链特异性测序介绍

链特异性测序（ssRNA-Seq）链特异性建库，mRNA-Seq library(Strand-Specific) construction。与之相应的测序称为链特异性测序(ssRNA-Seq)，是转录组测序新增的一项个性化服务内容。使用ssRNA-Seq可以确定转录本来自正链还是负链。以便更加准确的获得基因的结构以及基因表达信息。并且，可以更好的发现新的基因。（研究表明：很多基因组区域具有正负链的转录本，反义转录是真核基因的一个特征，是一种重要的调控方式。对于原核以及低等真核生物的compact基因组，常常具有重叠基因。）建库技术路线对常规的RNA-Seq建库方法进行一个简单处理。重点是在合成第二条cDNA链时，替换dTTP为dUTP，加上接头后降解第二条链。Figure 1. Flowchart of the ssRNA-Seq procedure. RNA is shown in red, DNA in green. Arrows are in the 5’ to 3’ direction.信息分析结果（华大）总结链特异性结果与非链特异性结果相比，在与基因组和参考基因的比对结果中链特异的结果均相近或稍高于非链特异结果，显示非链特异测序的结果也是比较准确的。HBRR链特异数据比对到基因组上的比例为72.3%，非链特异的为71.3%.UHRR链特异数据比对到基因组上的比例为70.2%，非链特异的为68.1%。HBRR链特异比对到参考基因的比例42.5%，非链特异为40.4%。UHRR链特异比对到参考基因的比例61.8%，非链特异为51.4%。从目前的结果看链特异建库所得的read的随机分布情况稍差于正常建库，但仍处于可接受的水平。检测到的基因数方面来说链特异的结果检测得到的基因稍少，但是从理论上说更准确。定量分析方面，链特异结果与qPCR和非链特异结果相比相关性都很高，说明链特异的结果是准确可信的。在基因结构优化方面链特异的结果描述更加吻合已知的基因注释结果。在可变剪切位点发现上，链特异发现的位点数目稍少，但是发现已知位点所占比例的更大。HBRR样品链特异方法发现135840个junction，已知占73.5%，非链特异发现146257 个junction，已知占72.3%。UHRR样品链特异方法发现152183个junction，已知占69.3%。非链特异发现168462个junction，已知占68.1%。综上所述，从本次测序数据来看，链特异建库虽然在read的随机性分布上略差，但是其所得结果其他指标都是比较优秀的，其结果是准确可信的。信息分析结果详见附页附链特异转录组分析小结1. 原始数据概括：表一原始数据基本信息SampleTotal ReadsTotal Nucleotides（nt）Q20 percentageN percentageGC percentageHBRR(Raw)30447827548060886089.05%0.01%48.5%HBRR(Clean)29740560535330080089.01%0.01%48.54%UHRR(Raw)34917301628511418088.57%0.01%49.92%UHRR(Clean)34298181617367258088.56%0.01%49.95%2. 测序随机性评价：图一A HBRR样品链特异结果的read分布情况图一B HBRR样品非链特异结果的read分布情况图二A UHRR样品链特异结果的read分布情况图二B UHRR样品非链特异结果的read分布情况从上图可以看出，链特异5’端reads数较少，随机性不够好(采用的是参考序列hg18中的转录本序列)，结合两样品正常转录组随机性分布图，随机性分布可能与样品有关。比对基本情况：在hg18的转录本序列中位于正链的转录本有15998个占51%，位于负链的转录本有15401个占49%。总体gene 20690个，其中正链10636个，负链10261个，在正链负链中均存在的基因有207个。样品的read具体匹配状况如下：表二 HBRR链特异分析及非链特异分析比对基本情况MethodClean reads numberMapped Reads(Gene)Mapped Reads(Genome)Strand specific(+ota (42% (52.7%)Perfect matc (29.2% (34.9%)=2bp mismatch7636002 (12.8% (17.9%)Strand specific(-otal324973 (0.5%)17