生物信息学ppt-.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
生物信息学ppt-

GenBank数据库介绍 主要内容: 基因组数据库的相关背景。 主要的基因组数据库资源。 GenBank序列数据库。 -- GenBank序列格式。 举例介绍基因数据库的使用。 基因组数据库的发展历史 从历史上来看,蛋白质数据库是先于核苷酸数据库出现的。早在60年代初,Dayhoff和他的同事们收集了所有当时已知的氨基酸序列,这就是“蛋白质序列与结构图册”(Dayhoff et al.,1965)。这一蛋白质数据库后来成为PIR(George et al., 1997)。 基因组数据库的发展历史(续) DNA序列数据库最早于1982年在欧洲分子生物学实验室诞生,随即就开始了一个数据库爆炸的时代。 此后不久因一项NIH与洛斯阿拉莫斯国家实验室的合同而诞生了GenBank。 日本的DNA数据库(DDBJ),在几年后加入了数据收集的合作。 基因组数据库的发展历史(续) 1988年一次三方会议之后(现在称之为“国际DNA序列数据库合作计划”)达成了一项协议,对数据库的记录采用共同的格式,并且每个数据库只负责更新提交到这一数据库的那些数据。 现在三个中心都收集直接提交的数据,并在三者之间发布。 基因组数据库的发展历史(续) GenBank简介 GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。 GenBank数据库的数据来源有三种: 1、直接来源于测序工作者提交的序列; 2、与其它数据机构协作交换的数据; 3、美国专利局提供的专利数据。 核苷酸序列数据库分为三个子数据库: EST :表达序列标记数据库 GSS :基因组测序序列数据库 CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列 认识GenBank文件格式(特性表) FEATURES Location/Qualifiers source 1..539 /organism=Rattus norvegicus /strain=OLETF, LETO and Zucker /dev_stage=differentiated /sequenced_mol=cDNA to mRNA /tissue_type=adipose CDS 30..533 /partial /note=NCBI gi: 995615 /codon_start=1 /product=obese /translation=MCWRPLCRFLWLWSYLSYVQAVPIHKVQDDTKTLIKTIVTRIND ISHTQSVSARQRVTGLDFIPGLHPILSLSKMDQTLAVYQQILTSLPSQNVLQIAHDLE NLRDLLHLLAFSKSCSLPQTRGLQKPESLDGVLEASLYSTEVVALSRLQGSLQDILQQ LDLSPEC 来源(source)是唯一一个必须在所有GenBank记录中出现的特性 包含属和种的科学名称 存在的或者潜在的编码区 编码序列的翻译产物 编码序列的gi号 认识GenBank文件格式(序列) BASE COUNT 121 a 167 c 133 g 118 t ORIGIN 1 ccaagaagaa gaagacccca gcgaggaaaa tgtgctggag acccctgtgc cggttcctgt 61 ggctttggtc ctatctgtcc tatgttcaag ctgtgcctat ccacaaagtc caggatgaca 121 ccaaaaccct catcaagacc attgtcacca ggatcaatga catttcacac acgcagtcgg 181 tatccgccag gcagagggtc accggtttgg acttcattcc cgggcttcac cccattctga 241 gtttgtccaa ga

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档