- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ZHOU Shuai - 生物信息学
美国国立生物技术信息中心GenBank核酸序列数据库以外,美国生物技术信息中心GenBank中数据的分析,检索资源,另外还通过其网站提供一系列的有价值的生物数据及信息。NCBI 数据的检索资源包括Entrez, PubMed, LocusLink 以及Taxonomy浏览器。数据分析资源包括BLAST,电子PCR,开放阅读框寻觅器,序列提交工具,唯一人类基因序列集合,基因同源物数据库,单核苷酸多态性数据库(dbSNP), 异常癌症基因组计划(CCAP),Entrez 基因组,垂直同源基因簇(COGs)数据库,反转录病毒基因分类工具,癌症基因组剖析计划(CGAP),基因表达连续分析图谱(SAGEmap),综合性基因表达 (GEO),在线孟德尔人类遗传(OMIM),三维蛋白质结构的分子模型数据库(MMDB)以及保守序列数据库(CDD)。BLAST程序通过增加一些网站的应用程序实现搜索某些特殊数据的最优化方式。所有的资源可以通过NCBI的首页得到:。
引言
作为美国国家卫生研究院(NIH)的国立医学图书馆(NLM)的一个分支,美国生物技术信息中心GenBank 核酸序列数据库以外,NCBI还提供对于GenBank中数据检索系统和计算工具以帮助分析GenBank的数据以及其他的NCBI提供的可利用的生物信息数据。
NCBI首页()所提供的可用数据涵盖了部分基因的代表性短序列、完整的基因组、蛋白质结构以及一些遗传疾病的临床描述。NCBI提供了一系列的计算工具以帮助分析各种类型的数据。总体来说,NCBI的整套数据库资源分为7大类:数据库检索系统,相似序列检索程序,基因序列分析数据库,染色体序列数据库,基因组分析数据库,基因表达与显型分析数据库,以及蛋白质结构和建模数据库。
数据库检索工具
Entrez
Entrez是一个综合的数据库检索系统,可以通过三维蛋白质结构的分子模型数据库(MMDB)搜索到DNA和蛋白质序列、基因组图谱、人类数据以及蛋白质结构并通过深入链接到NCBI的分类中的PubMed以及在线孟德尔人类遗传(OMIM)搜索生物医学文献。Entrez中的序列数据,尤其是蛋白质序列,是通过各种数据库资源(包括GenBank蛋白质翻译, 蛋白质鉴别数据库 (4), SWISS-PROT(文本术语) (5),蛋白质研究基础,蛋白质数据库 (6) 以及数据库参考序列 (7))获得的,并且因此比单独的GenBank拥有更多的序列数据。PubMed主要包括联机医学文献分析和检索系统(MEDLINE)中的107,000,000多篇参考文献及其摘要,它们链接了多于1100种网络中的可用刊物的论文全文。
Entrez可通过简单的检索条目进行序列文本或著书目录的搜索,加之大量的相关信息。某些链接是简单对照,例如从一个序列到报道它的文章的摘要,从一个蛋白质序列到它的相应DNA序列,或是从某一序列去其它序列。其余的链接则是基于序列或MEDLINE摘要中的相似性进行搜索。这些预先计算的“邻居”使得快速浏览相关记录成为可能。一个名为LinkOut的服务将单独数据库的记录延伸至相关的外界服务,包括特定生物体基因组的数据库。
分类浏览器
NCBI的分类数据库包括大于7000个物种的名字和种系,这些物种都至少在遗传数据库中有一条核酸或蛋白序列。检索一个特定种或者更高分类如属科)的核酸,蛋白,和结构记录NCBI新的分类数据库的目的是为序列数据库建立一个一致的种系发生分类学。位点链接提供一个单一查询界面来找到某一个遗传位点的序列和描述性信息它展现官方命名,别名,序列登录,表型,EC号码,MIM号码,UniGene聚类,同源,图谱位点,和相关的信息。生物基因数据库系统GenBank的最高频分析类型——相似性序列搜索而提供。NCBI对于标准2.1BLAST程序的网络界面允许一个或多个序列并且使用同一矩阵搜索核酸或是一个PAM或BLOSUM氨基酸置换矩阵搜索蛋白质。BLAST允许在它产生的(alignments)中存在缺口Entrez数据库的无冗余的核酸及蛋白质数据库。个别的特殊数据库也可被检索,而且检索可以被限制在某一特定生物体的序列。所查询序列可因为低复杂度或者人为重复而被过滤掉。用户定制的BLAST网页允许与已测出的人类遗传数据相冲突的序列,微生物基因组或一些疾病关联的基因组存在。
BLAST的专门版本被提供用于相似蛋白质的搜索。特定位点重复的BLAST最初执行传统的BLAST检索以找出构建PSSM的序列。后来的BLAST利用PSSM去寻找数据库中的相似性序列。PHI-BLAST指定了搜索序列以及其中的模式。这个模式详细列明了阵列与数据库序列的匹配情况,并建立最佳阵列。另外一个变量,“BLAST2Sequences”,比对两个DNA或蛋白质序列并产生一个它所检出的阵列
您可能关注的文档
- TANet VoIP交换中心提供的服务 - 桃园区网.PPT
- T01A03 串联电阻电路(二) - 练习 - Tripod.PDF
- TENTEL 锐星通信讯息整合系统人工总机 - 国洋通信.PPT
- TCL-CRT 背投电视介绍下.PDF
- T76520-Y02 (306840200095 765 866净水器说明书) - 美的.PDF
- TFT LCD数据驱动电路五.PDF
- TD5A-WS台式低速离心机使用说明书.DOC
- TFTGLCD制程中SandMura的失效模式分析及改善研究.PDF
- TFTGLCD边角漏光不良机理分析及改善研究.PDF
- TFT-LCD平面液晶显示器工作原理简介.PDF
- ZJU400 离心机研制及其振动台性能评价 - 岩土工程学报.PDF
- zbs - 滁州银兴电气有限公司.DOC
- ZrC对TiC基金属陶瓷力学性能的影响 - 矿冶工程.PDF
- Zr-Ce-Co-Cu难混溶合金的液-液相分离和双非晶相形成 - 金属学报.PDF
- YZF-2A型压蒸釜 - 烟台建邦化工机械.DOC
- znw04单晶衬底制备zno薄膜的发光性能 - 中国管理科学.PDF
- ZZ-2017003“光伏发电系统安装与调试”赛项规程 - 全国职业院校 .DOC
- ZT-WTG-8654C金属电子标签 - 明佳制卡.DOC
- WKI28××S-20 系列单路高可靠DC-DC 电源模块 - 伟健电子.PDF
- [12]发明专利申请公开说明书.PDF
文档评论(0)