- 1、本文档共27页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第4讲:基于生物质谱数据的互联网数据库搜索 母昭德 硕士生学位课程:蛋白质组学 本讲所要介绍的内容提要 Ⅰ、生物信息学的一般情况 Ⅱ、有关数据库的基础知识 Ⅲ、由双向聚丙烯酰胺凝胶电泳鉴别的蛋白质数据库 Ⅳ、目前利用生物质谱数据进行搜索时相关的主要数据库 Ⅴ、搜索引擎-ExPASy Ⅵ、以生物质谱数据从互联网数据库进行搜索 Ⅰ、生物信息学的一般情况 生物信息学( Bioinformatics)是一门新兴的交叉学科,它包括了生物信息的获取、处理、存取、发布、分析、和解释等在内的所有方面。 生物信息学综合运用生物学、数学、计算机科学的各种工具,来阐明和理解大量数据所包含的生物学意义。 生物信息学在蛋白质组学中的应用概况 生物信息学已经成为蛋白组学研究中必不可少的组成部分,其应用包括: 编码的DNA序列的寻找与分析 蛋白质序列信息的获取 蛋白质鉴定和性质预测 蛋白质结构和功能预测 蛋白质序列分析 数据的分析与整合 Ⅱ、有关数据库的基础知识 生物信息学数据库:是长期存放在计算机内,有组织的、可共享的、表明了一些事实性的信息的数据集合。 数据库系统:是一个可实际运行的存储、维护和应用系统,是提供数据的软件系统,是存储介质、处理对象和管理系统的集合体。 数据库是生物信息学的基础。 Alberto Labarga, Franck Valentin, Mikael Anderson, and Rodrigo Lopez. Web Services at the European Bioinformatics Institute. Nucleic Acids Res., 2007; 35: W6~W11 Nucleic Acids Research》杂志在其每年的第一期中详细介绍最新版本的各种数据库。 在2000年1月1日出版的28卷第一期115种通用和专用数据库,包括其详尽描述和访问网址。 至2006年,生物信息学数据库总数已达858个。 至2009年,生物信息学数据库总数已达1170个。 《Nucleic Acids Research》杂志/ 所介绍的相关数据库及其主要分类 1 核酸序列数据库 2. RNA 序列数据库 3. 蛋白质序列数据库 4. 结构数据库 5. 基因组数据库(非脊椎动物) 6. 代谢酶相关产物 7. 人类和其他脊椎动物基因组 8. 人类基因和疾病 9. 其他数据和其他基因表达数据库 10. 蛋白组资源 11. 其他分子生物学数据库 12.细胞器官数据库 13.植物数据库 14.免疫学数据库 生物信息学的基本构架 染色体 基因组图谱 基因组数据库 核酸 DNA序列 核酸序列数据库 蛋白质序列 蛋白质序列数据库 蛋白质结构 蛋白质结构数据库 蛋白质 基因组作图 序列测定 结构测定 生物信息学 数据库工具 生物信息学 数据库工具 二次数据库;复合数据库 生物信息数据库的类别 以建库的方式而论,大致可分为四类: 一级数据库(primary database) 二级数据库(secondary database) 专家库 整合数据库 基于肽质量指纹谱(PMF)信息的数据库搜索 A set of peptide molecular weights from an enzyme digest of a protein 蛋白质 酶解 肽的混合物 PMF Protein/DNA 数据库 搜索引擎 Search engine 数据库 搜索结果 肽质量指纹图数据的检索 … 1503.604970 1504.603515 1505.606080 1506.635344 1548.614729 1549.635883 1550.628364 … Import mass list into protein database search program Set search parameters Submit search and look for peptides matches in database Mass list from spectrum 现行的PMF软件工具 名 称 网 址 特 点 第一类 PepSea PeptIdent/MultIdent http://www.ch/tools/peptident.html 根据谱图中m/z值与数据库中给定误差范围内m/z值相匹配的数目给出得分 第二类 MOWSE MS-Fit http://srs.hgmp.mrc.ac.uk / cgibn / mowse http:// 使用的得分算法考虑到蛋白质大小和肽片段长度对匹配几率的影响 第
文档评论(0)