生物信息数据库文库.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
计算机应用生物信息数据库与生物信息中心王禄山授课大纲生命信息学——生命科学与计算机技术的交叉。生物信息学的研究内容: (1)生物信息中心(2)生物信息数据库及格式。生物信息数据的检索工具——Entrez文献的检索与管理软件——Reference manager序列同源搜索分析工具——Blast核酸、蛋白质序列比对分析软件——DS gene\DNASIS生物大分子空间三维结构显示与分析软件——Rasmol生物图像对比分析软件——Scion Image (NIH image)生物科学数据处理软件——Origin生物信息研究内容重要生物信息中心重要生物信息数据库数据库检索工具生物分析相关软件一、重要生物信息中心 Bioinformatics Centres二、重要生物信息数据库生物信息学数据的表示形式关系数据库 (relational DB)基于实体联系模型 (E-R模型)表中的记录(record/tuple)键唯一确定表之间通过外键建立联系生物信息学数据的表示形式平面文件 (flat-file)信息在文件中顺序存放且具有特定格式记录(Entry)通过“获得号”(accession #)唯一确定同一文件间和不同文件间信息的联系均通过accession #实现语义映射和处理过程结果查询信息表示:关系数据库语义匹配semanticmappingRelationsAttributes数据集成Data Integration生物信息学数据存在的问题信息源分布在世界各地不同的站点上涉及多个数据源的全局问题无法立刻得到答案Painfully collecting unstructured information around the sitesManually putting pieces togetherHopefully getting the right picture...总之,信息源的特点是:自治的 (autonomous)分布式的 (distributed)异构的 (heterogeneous)数据集成Data IntegrationXMLXMLSite BSite A生物信息学最重要的任务是从海量数据中提取新知识生物数据库的种类生物数据库的种类序列数据库 核酸序列数据库 (EMBL、GenBank、DDBJ)常用蛋白质序列数据库(Swissprot,PIR)结构数据库 蛋白质结构数据库(PDB) 蛋白质分类数据库(SCOP、CATH )其它数据库 序列数据库主要核酸序列数据库: GenBank、EMBL、 DDBJ主要蛋白质序列数据库:Swissprot, PIR核酸序列数据库 美国的核酸数据库GenBank〖Banson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7〗从1979年开始建设,1982年正式运行;欧洲分子生物学实验室的EMBL数据库也于1982年开始服务日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。 从那个时候以来,DNA序列的数据已经从80年代初期的百把条序列,几十万碱基上升至现在的110亿碱基!这就是说,在短短的约18年间,数据量增长了近十万倍。核酸序列核酸序列是由4种核苷酸的单字母(ATGC)符号排成的序列。蛋白质序列数据库SWISS-PROT和PIR是国际上二个主要的蛋白质序列数据库,目前这二个数据库在EMBL和GenBank数据库上均建立了镜像 (mirror) 站点。SWISS-PROT数据库包括了从EMBL翻译而来的蛋白质序列,这些序列经过检验和注释。PIR数据库的数据由美国家生物技术信息中心(NCBI)翻译自GenBank的DNA序列。 蛋白质序列MNIQQLALQNIKGNWRNYKVFFLSSCFAIFASFAYMSVIVHPYMKETMWYQNVRWGLIICNIIIISFFIIFILYSTSIFIEARKKELGLYMLMGATKSNVIGVIMTEQMLIGVFANIFGIGLGIIFLKLFFMVFSMLLGLPKELPIIFDVRAIGGTFIAYMVVFVVLSFISALRIWNIKIIRLLKEFRTDKKEKKTSMRLCIFGLICLGIGYALALQTTMPTIAFYFFPVSILVFFGTYFSFTHGTAQILELIKRNKKIMYTYPYLFIVNQLSHRMKENGRFFFLMSMATTFVVTATGTVFLYFSGMQDMWRGGGVHSFSYIEKGTSSHEVFAEGMVEQLLHQYGYDDFQSMSFVGVYASFQSSKGETEIATLMKESEYNQEARKQGQKTYHPKKGSVTLVYYNKYNHPNMYDQKEIQLQVMNQTYSFVFNGQKEGIQFNYHPSQING

文档评论(0)

老师驿站 + 关注
官方认证
文档贡献者

专业做教案,有问题私聊我

认证主体莲池区卓方网络服务部
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0GFXTU34

1亿VIP精品文档

相关文档