生物信息数据库教案资料.pptVIP

下载本文档

5
0
约3.02千字
约 61页
2019-09-21 发布于天津
举报
版权申诉

生物信息数据库教案资料.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

生物信息学数据库;数据库是指以一定方式储存在一起、能为多个用户共享、具有尽可能小的冗余度、与应用程序彼此独立的数据集合生物信息数据库分类： ①根据数据的来源和数据整理的不同：一级数据库和二级数据库 ②根据数据库存储的内容不同：核酸序列数据库、基因组数据库、核酸/ 蛋白质结构数据库等;数据库的更新速度不断加快数据量呈指数增长趋势数据库使用频率增长迅速数据库复杂程度不断增加数据库网络化数据库功能面向应用拥有先进的软硬件配置等;第一节核酸序列数据库; GenBank数据库由Los Alamos National Lab于1982年4月创建，属于一级数据库。包含了目前所有已知的核苷酸序列和蛋白质序列及其相关的文献著作和生物学注释。其数据来源于约10万个物种，其中56% 是人类的基因组序列。数据库来源有３种：直接来源于测序工作者提交的序列、INSDC 交换和共享数据、美国专利局提供的专利数据。目前世界上的权威期刊在作者发表论文时都要求提供GenBank 数据库的序列号;GenBank数据库使用; ; ;;EMBL数据库1980年由德国科隆大学收集整理,是世界上第一个核酸序列数据库,数据主要来源于基因组计划、序列中心、科研工作者提交的序列和专利局提供的专利数据等 EMBL数据库的三种数据类型包括EST(表达序列标签)、HTG（高通量序列）和GSS(基因组序列) EMBL重要特征：核苷酸的蛋白质编码区（CDS）;http://www.ebi.ac.uk/ena/ 查询形式： ①Text Search（文本查询），输入已知基因编号、名字等 ②Sequence Search（序列查询），可输入待查询的核苷酸序列或序列编号;获取m-RNA信息，在页面最下端是全序列信息，在页面的上端提供序列不同格式的序列信息，包括TEXT、FASTA、XML;日本DNA数据库DDBJ（DNA Data Bank of Japan），建于1984，主要向研究者收集DNA序列信息并赋予其数据存取号网址：http://www.ddbj.nig.ac.jp/;蛋白质序列不仅可以来自实验测序结果，也可以根据基因组序列预测新基因，预测编码区域，并推测其蛋白质的序列蛋白质数据库UniProt（Universal Protein Resource）,网址：;UniProt包括：①UniProt Knowledgebase（UniProt）蛋白质序列、功能、分类、交叉引用等信息存取中心???UniProt Non-redundant Reference(UniRef)数据库，该数据库将密切相关的蛋白质序列结合到一个记录中，提高搜索速度③UniProt Archive(UniParc),一个资源库，记录所有蛋白质序列的历史;由美国生物医学基金会NBRF在1984年组建，目的是鉴别和解释蛋白质序列信息，研究分子进化、功能基因组学，并进行生物信息学分析。可快速了解蛋白质信息，发掘蛋白质家族中其他成员，并比较蛋白质的序列，获取蛋白质相关信息。数据库中除含有蛋白质序列信息外，还储存有蛋白质名称、分类、来源、功能等信息。与其他重要数据库如GenBank、EMBL、DDBJ、GDB等数据库有链接索引;提供三种类型的检索服务：基于文本的交互式查询，标准的序列相似性搜索，结合序列相似性、注释信息、蛋白质家族信息的高级检索主页：/ ; ;该蛋白质在UniProKB中的信息;该蛋白质在PIR数据库中的原始信息;1986年由日内瓦大学和欧洲生物信息学研究所（EBI）联合建立，数据来源包括：从核酸数据库经过翻译推导产生，从PIR 中挑选合适的数据,研究人员直接提交,科学文献中摘录网址：http:// /html/swiss-prot.html ;是SWISS-PROT数据库的补充，是计算机注释的蛋白质数据库，主要包括含从三大核酸数据库中根据编码序列（CDS）翻译得到的蛋白质序列。;四、UniProt数据库;人类基因组计划被誉为生命科学“Appolo登月计划”，由美国科学家于1985 年率先提出，于1990年正式启动，美国、中国、英国、法国、德国、日本科学家共同参与了这一预算达30亿美元的人类基因组计划. 基因组数据库的主体模式是生物基因组数据库，其中最重要的是人类基因组数据库?如GDB、GenBank等;由约翰·霍普金斯大学在1990年建立，现由加拿大多伦多儿童医学生物信息及计算机中心负责维护，国际上许多生物信息中心建有镜像方便地观察染色体上不同区域或考察标记间的顺序和距离包括:染色体形态图谱、叠边群图谱、基因连锁图谱、放射杂交图谱、序列特性图谱等;UCSC 由美国加州大学克鲁兹分校的生物信息研究人员建立,收集了高分辨物理图、mRNA和EST比对、基因预测、物种序列同源性