数据提交NCBI科普文件.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据提交NCBI科普文件

数据提交NCBI近些年来,随着测序技术的发展和成本的降低,高通量测序技术日益普及,更多的科研工作者可以使用这种通量高、效率高、性价比高的科研手段对研究样本开展平行大规模的研究。与高通量迅猛发展伴随的,是海量测序数据的产生,NCBI是一个很好的测序数据管理和共享平台,通常科研工作者在发表paper的时候,需要提前向NCBI提交序列获得登录号。然而,如何向NCBI提交这些序列,提交什么序列?这一系列的数据提交问题则成为了科研工作者不得不面对的一个棘手难题。在此,上海翰宇生物将对目前高通量测序数据的提交做一个简单概述,并着重对提交原始数据进行讲解,以期为科研工作者提供稍许的帮助,希望对大家有用。目前高通量数据提交分为哪些种类?就数据类型而言,上传的数据可归纳为两大类:测序原始数据和分析数据。原始数据(Raw data)指测序下机的最初文件,未经任何处理和分析,常见的是illumina机器产生的fastq文件,454机器产生的sff文件等。这一类型的文件需要向NCBI的SRA数据库进行提交,提交操作步骤相对比较简单。分析数据提交则根据不同的项目类型需要向不同的数据库提交不同的分析结果。目前的高通量测序就项目类型而言可概括分类为:基因组测序、转录组测序和meta测序(如16S测序等)。基因组测序数据可以提交组装结果和注释信息到WGS数据库,转录组测序数据可以提交组装结果到TSA数据库。提交用到的软件也不尽相同,包括Sequin、BankIt等。分析结果提交相对步骤繁琐,还需借助一些特定的程序和命令对数据进行处理修改,难度较高。How to submit sequence data to NCBI,详细可以参见如下链接:/guide/howto/submit-sequence-data/ ;/guide/howto/submit-data/ 。什么数据应当提交到什么对应的数据库?NCBI的sequence data包括GenBank、Genomes(WGS)、 TSA、SRA、GEO,用于收录不同的测序类型数据。测序数据需要提交到正确对应的数据库,在此上海翰宇生物为大家做简单介绍:Meta的测序分析数据,如16S/18S/ITS测序的OTU序列,需要使用BankIt、Sequin、tbl2asn等软件提交到GenBank数据库。How to submit to GenBank详细见/genbank/submit/。基因组的组装结果和注释信息需要提交到WGS或者Complete Genomes,而基因组草图draft只能提交到WGS数据库,可以借助Sequin、tbl2asn软件。Genome Submission Guide 详细见/genbank/genomesubmit 。TSA是收录转录组测序组装结果EST的数据库,SRA是收录各种测序原始数据的数据库,而表观遗传学等数据则需要提交到GEO数据库。详细见/。三、提交数据到NCBI需要做什么前期准备工作?首先,我们需要建立一个属于自己的NCBI的登陆账户,用以提交数据。其次,不管我们提交什么数据到NCBI,都需要对这份数据进行一个描述,包括前期项目情况、样本属性及制备情况等,即在提交数据前,我们需要先申请BioProject号和BioSample号描述样本及背景。然后就是准备好我们的数据,进入对应的数据库界面开始提交数据了。四、测序原始数据提交流程上海翰宇生物将以Metagenome测序原始数据提交为例,和大家一起分享原始数据提交的详细流程。首先要建立BioSample账号,登陆如下链接:/subs/biosample//subs/biosample/,在界面选择new submission。鼠标放到蓝色“?”区可以显示每个选项的描述。带*选项为必填选项,需留意email选项中,两个邮箱里一定要留一个该测序项目负责人的常用邮箱,因为后期如果想要修改数据信息或者释放时间,都需要该邮箱地址发送邮件到NCBI,NCBI才会受理。在如上界面上可以选择立即释放,或者选定一个特定的释放时期,最长可以选择延时四年释放。如果中途需要修改释放时间,可以写信给NCBI要求修改。然后需要建立BioProject账号,登陆如下链接:/subs/bioproject//subs/bioproject/,在界面上选择new submission填取项目描述信息建立账号。在如上步骤完成后,NCBI会生成两个登录号给我们,通常BioSample号以SAMN开头,如SAMN*****;BioProject号以PRJNA开头,如PRJNA*****。这两个号需要在后续SRA提交过程中使用。登陆如下链接/Traces/sra_sub/sub.cgi,选择NCBI PDA入口,NIH为NIH内部人员登陆入口。登陆后creat

文档评论(0)

159****0071 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档