- 7
- 0
- 约1.28万字
- 约 12页
- 2016-11-07 发布于江苏
- 举报
第三章 结构数据库
本章将集中介绍生物信息学中生物分子结构的有关内容,并将研究重点放在三维结构实际存在的氨基酸序列上,力图使读者了解结构数据库记录的内容及如何合理应用各类通用软件程序处理这类记录。本章不涉及结构生物学家们建立三维分子结构的计算程序,也不讨论相似蛋白质构象的精细结构。在本章参考书目后列出了一些优秀的讨论蛋白质构象的有关专著和蛋白质结构决定方法。
用图象直观表示蛋白质和核酸结构在生物化学教科书和研究论文中屡屡出现。这些图象是美丽迷人的反而使我们忽视了图象背后所反映的实验细节#0;#0;#0;实验中应用的生物物理方法,X射线晶体衍射学家和核磁共振波谱分析学家们努力工作的成效.在结构数据库中记录的数据是实用化的实验数据。
三维分子结构数据的一些概念
首先做一个关于如何记录生物高聚物的三维数据的思想实验。考虑一下如何在纸上记录如肌球素这类蛋白质的三维球棒模型的所有细节和尺度关系。一条开始的途径是从由三维模型主干描绘出的氨基酸序列入手。从N’端开始,我们通过将每个残基的化学结构与20种普通氨基酸化学结构(其结构的图解可以从教科书中找到)比较,以识别每个氨基酸侧链。
#0;棒结构中每个原子“球”的x,y,z坐标距离数据。
x,y,z)坐标信息。最简单的方法是在生物高聚物的二维草图上,每个原子的右侧,标出(x,y,z)三元坐标值。
坐标、序列、化学图像
典型的三维结构记录中与使用的文件格式无关的最明显的数据是坐标数据,它表征了分子中原子的空间位置,用沿着每个坐标轴到某特定原点的距离(x,y,z)表示。每个原子的坐标数据归属于结构记录中的标注信息列表:空间中的每一点代表了记录中的元素、残基和分子。对于生物多聚体,这标注信息来源于序列。每个序列固含的是重要的化学数据。我们能够直接从序列中推断出完整的包含所有原子和化学键的生物高聚物分子化学联接,能够恰如早先所描述的仅从序列信息出发描绘出草图。我们把这分子“草图”称作三维结构的化学图像。序列是生物高聚物分子完整化学图谱的固有表示。
原子、化学键和完整性
分子图像可视化软件完成了精细的“点联接”过程,而绘制出如我们在生物分子结构教科书中所见到的完美的蛋白质结构图像,例如图3.1所示的胰岛素3INS结构(Isaacs,Agarwal,1978)。显然,原子间联接依靠化学键。在目前的应用中,三维分子结构数据库记录使用了两种不同的键数据信息优化存储方法。
1.5埃。应用这些来源于化学键的规则,意味着空间中两个1.5埃距离的碳原子总形成单键。有了这些化学准则,我们可完全简化化学键信息存储。倘若结构本身未违背任何化学规则,则能够被完整记录而不带任何附加键信息。
Brookhaven蛋白质数据库(Bernstein等,1977)的PDB格式皆以化学准则方法为基础。一般而言,这些记录没有生物高聚物的完整键信息。无需“残基词典”,而仅用可能成键原子对的键长与键类型匹配表即可解译用“化学准则方法”编码的数据。
PDB数据文件读入软件包必须能基于这类规则重构化学键。对于程序员,如何解释PDB文件中的键信息尚未形成明确统一的规则,而导致了各类软件绘制化学键连接时的不一致,尤其应用了不同的算法和距离容差,这类情况更为严重。虽然PDB文件组织方案在记录数据存储方面的要求最低,但比较连键信息和化学图像描述已在记录中详细说明的情况,则对存储信息进行恰当解释所需算法也相应更复杂。这将迫使程序开发者做更多的工作。基于事件的编程中,考虑连键规则中的种种例外情况,更需要复杂的逻辑说明。
PDB衍生而来的分子建模数据库(MMDB)的数据库记录中得到应用。MMDB运用标准的“残基词典”,其中记录了氨基酸、核酸残基这样以聚合体形式存在,具有末端多样性的分子中所有原子、化学键信息。在结构科学家解决分子结构而使用的专用软件中,这类数据词典是很普遍的。读入MMDB数据的软件能利用词典所提供的键信息将原子连为一体,而无须力图满足化学准则的要求。最终,用软件获得准确的三维坐标数据。这种方法使软件开发简单化,因为连键规则中的例外情况在数据库文件中已被记录,而无须附加逻辑控制代码即可将之读入。
在结构数据库中,完整的记录是不多见的。大多数由X射线衍射获得的结构缺少氢原子坐标,因为氢原子的空间位置不能用实验手段决定。但一些建模软件可用于估计氢原子位置,并用其重建结构记录。在结构数据库中识别由模型构造的分子是容易的。它们常常有过于复杂的坐标数据和所有用实验手段无法确认的氢原子可能表达形式。
PDB:Brookhaven国家实验室蛋白质数据库
概述
计算机在生物学中的运用起源于生物物理方法的应用,如X射线结晶衍射。于是最初的“生物信息学”数据库被用于存储复杂的三维数据不足为怪。现代的蛋白质数据库以收集的蛋白质三维结构公共数
您可能关注的文档
- 课内生物化学考试大纲53624.doc
- 课内生物化学专业英语单词.doc
- 课内生物信息学序及附录.doc
- 课内棕榈壳生物质燃料分析.doc
- 课内生物信息学分析实验报告.doc
- 课内外国文学史复习.doc
- 课内湿地与全球自然资源.doc
- 课内生物信息学习题.doc
- 课内生化55146.doc
- 课内生物化学50161.doc
- 2023年度十大热点人物的素材解读与运用-2024年高考语文作文热点素材积累运用与(全国通用).pdf
- 格力室外机中央空调价格表.pdf
- 2026上半年贵州事业单位联考贵州省交通运输厅招聘84人备考题库完整答案详解.docx
- 2026上半年贵州事业单位联考贵州传媒职业学院招聘12人备考题库附参考答案详解(达标题).docx
- 2026上半年贵州事业单位联考贵州省住房和城乡建设厅招聘16人备考题库含答案详解(培优).docx
- 2026上半年贵州事业单位联考玉屏侗族自治县招聘41人备考题库及答案详解(夺冠系列).docx
- 通信原理实验2数字频带传输系统实验.pdf
- 2026上半年贵州事业单位联考贵州医科大学第二附属医院招聘22人备考题库含答案详解(能力提升).docx
- 2026上海复旦大学计算力学与人工智能交叉研究院(筹)招聘专任研究员2人备考题库完整答案详解.docx
- 2026上半年贵州事业单位联考贵州民族大学招聘52人备考题库附参考答案详解(研优卷).docx
最近下载
- ATW-R3210ATW-T3201盒式发射机ATW-T3202手持式发.PDF VIP
- CoDeSys编程手册范本.doc VIP
- T_SCNA 0001—2024(成人体外膜肺氧合(ECMO)技术护理规范).pdf VIP
- 2024版危重症患儿管饲喂养护理TCNAS 45─2024图文解读学习课件.pptx
- 包裹卡提效策略与实操路径白皮书 - 【私域运营】.pdf VIP
- 汽车制造工艺基础 教学课件 王永伦 汽车制造工艺基础课程教学大纲.pdf VIP
- 2025年无人机驾驶员执照飞行器运行术语术语考试实战演练专题试卷及解析.pdf VIP
- 大学生毕业论文写作教程PPT全套教学课件.pptx VIP
- 《生态环境材料》全套教学课件.ppt
- 2026年吞咽障碍考试题含答案解析.docx VIP
原创力文档

文档评论(0)