- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第二节序列数据库检索
基因组记录情况(不包括台湾、香港) 本文统计了截止1996年12月31日和2001年12月31日由我国大学和其他研究机构直接递交GenBank国际公共数据库的DNA和基因组序列数量,有关统计方法说明如下: 利用NCBI提供的ENTREZ搜索系统进行初步的检索和统计: (1)??? 先将只要含有中国、台湾、香港和澳门字样的非EST记录均下载: (CHINA OR TAIWAN OR “HONG KONG”) NOT gbdiv est[Properties] Limits: Modification Date to 2001/12/31,共获得24701个记录 (CHINA OR TAIWAN OR “HONG KONG”) NOT gbdiv est[Properties] Limits: Modification Date to 1996/12/31,共获得915个记录 自编程序并对上述记录分别在记录的“JOURNAL”字段后(“SUBMMIED:….”)进行中国大陆、台湾和香港数据库记录的统计和国内一些主要城市及高校数据库记录的统计等。 (2)EST记录数据是通过ENTREZ 检索GenBank数据库gbdiv est子库获得的。 统计方法说明 (3)用于检索的各高校英文名称均通过各高校的主页上查找得来,通过我国教育部网站获得了我国所有院校合并的信息。检索中对我国主要的高校均进行了统计,然后进行排名。 (4)除了特别说明外,文中的记录均指核苷酸序列记录。 其他几点说明:(1)如果递交给GenBank数据库的记录中没有“China”、“Taiwan”、“Hong Kong”和“Macao”等字样,而仅注明“PROC”、“PRC”等则不包括在本研究统计范围;(2)在进行高校检索时,仅包括记录中直接出现“University”一词的记录。本研究的原则是不对记录进行任何修订,如果记录中“University”一词输入错误或没有写明具体大学(而实际是由某一大学完成的),将均被排除在外。以上两种情况在本研究的记录中均存在,但仅涉及极少数记录;(3)对中国大陆的检索策略是在有“China”字样的记录中剔除含有“Taiwan”、“Hong Kong”字样的记录来实现的。统计中注意了台湾和香港递交的记录中对“China”一词使用不规范的一些情况。 * 3、SRS系统的特点 SRS系统是一个功能强大的数据库查询功能,其主要特点作有以下几个方面 1)统一的用户界面 SRS具有为统一的Web用户界面,用户只需安装Netscape等网络浏览器即可通过Internet查询世界各地SRS服务器上的300多个数据库。SRS支持以文本文件形式存放的各种数据库,包括序列数据库EMBL、SwissProt,结构数据库PDB,资料数据库AAIndex、Biocat、dbcat,文献数据库MedLine等 生物信息数据库种类繁多,结构各异。如何快速、高效地对各种数据库进行查询,是数据库查询系统必须解决的问题。SRS系统采用了建立数据库索引文件的手段,较好地解决了这一问题。即使是含几百万个序列的EMBL数据库,只需几分钟即可实现整库查询,得到所需结果。此外,SRS系统具有查询结果相关处理功能,每次查询结果可作为进一步查询的子数据库,并可对其进行并、交等操作,对查询结果进行组合或筛选。 2)、高效的查询功能 3)、灵活的指针链接 通过超文本指针链接实现信息资源的有机联系,是目前Internet信息服务的主要趋势。许多生物信息数据库均包含与其它相关数据库的代码,如SwissProt数据库中的蛋白质序列包含了该序列在EMBL、PDB、Prosite、Medline等其它数据库的代码。利用超文本链接,可将这些相关数据库联系在一起。SRS采用实时方式,根据查询结果产生链接指针,而不是在原始数据库中增加超文本标记,既节省了存储空间,也便于数据库管理。 4)、方便的程序接口 将序列分析等常用程序整合到基本查询系统中,是SRS的另一个重要特点。用户可以对查询结果直接进行进一步分析处理。例如,查询所得的蛋白质序列,可立即用BLAST和FASTA查询程序进行数据库搜索,找出其同源序列;也可以用PrositeSearch程序,寻找功能位点;用ClustalW程序进行多序列比较 5)、开放的管理模式 在管理模式上,SRS采用了开放的方式。无论是数据库还是应用程序,均可进行扩充和更新。用户可在本地机上安装自己的SRS系统,并将自己的数据库添加到SRS系统中,并可与其它数据库实现超文本链接。也可自行编写应用程序,整合到SRS系统中。 6)、统一的开发平台 SRS系统中所有数据库均以文件系统方式存放,通过预先建立索引文件实现数据库查询。因此它不依赖于Oracle、Sybas
您可能关注的文档
最近下载
- 数学中考总复习.doc VIP
- 限制型心肌病超声诊断与评估.pptx
- _【课件】第四章 三角形 +问题解决策略:特殊化课件北师大版七年级数学下册.pptx VIP
- 中考数学总复习第一轮考点复习(重庆专版).pptx VIP
- 2025在线网课《信息检索与科技写作( 理大)》单元测试考核答案.pdf VIP
- 高频精选:京东快递员ai面试题及答案.doc VIP
- 新北师大版初中七年级数学下册《第四章三角形问题解决策略:特殊化(1)》教学课件.pptx VIP
- 河北 2023年农信社储蓄知识考试真题模拟汇编(共213题).doc VIP
- 河北 2023年农信社基础知识考试真题模拟汇编(共672题).doc VIP
- 四川省宜宾市2023-2024学年高一下学期期末学业质量监测语文试卷(原卷版+解析版).docx VIP
文档评论(0)