- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二节化学信息处理
第二节 化学信息处理 化学信息学 产生的背景 组合化学和高通量筛选,出现了巨大的信息,需要快速收集、存储、分析和处理,随着信息技术向化学领域的渗透,形成了新的交叉学科——化学信息学。 研究内容 化合物信息在计算机中的表示 化合物数据库的建立、使用和管理 化合物相似性、多样性及分子类药性分析 化合物定量构效关系 化学信息学 Chemoinformatics,chemical informatics,Cheminformatics,chemi-informatics 利用计算机信息处理技术对化学分子结构和相关信息进行管理的一种综合性技术和学科 应用化学信息学可促进化学信息的获取、转化与共享 一、化学信息的表示方法 (一)一维结构表示 SMILES(简化分子线性输入系统)编码的基本原则 原子通常以大写元素符号表示(省略氢原子),芳香结构原子则以小写表示。 相邻原子依次排放在一起,单键通常省略,双键和三键分别以“=”和“#”表示,芳香键以“:”表示,也可省略。 分支部分放在括号内,环则打开,并赋予断开键两端的原子以相同的数值。 双键“/”表示顺式,“\”表示反式。 原子顺时针排列用@表示,逆时针排列用@@表示。 举例说明 苯丙氨酸 SLN编码(Sybyl线性标记法)的规则 原子以其元素符号表示,氢原子也要显示; 单键省略,双键、三键和芳香键分别以“=” “#”和“:”表示; 分支也采用括号表示;环也打开,依靠环上一个预先定义好的具有唯一编号的原子及@符号来识别,如环己烷表示为C[15]H2CH2CH2CH2CH2CH2@15; 原子和键的属性(如电荷、立体化学性质等)可通过方括号[ ]或尖括号 在该原子后标记出; 对大分子的原子,可使用缩写,如氨基酸可以用其三个字母缩写形式表示。 (二)二维结构表示 1、图论基础和图的矩阵表示 一个简单的图由顶点(V)和边(E)组成,因此图被定义为一个三元组V,E,φ, φ为映射函数。在下面一个简单的无向图中, V={1,2,3,4}, E={e1,e2,e3,e4, e5, e6}。 图也可用矩阵表示:设G=V,E为无向图,令mij等于顶点vi与边ej的关联次数,则称(mij)n*m为G的关联矩阵,记为M(G)。 2、化合物结构的矩阵表示 (1)邻接矩阵(以乙醛为例) (三)三维结构表示 1、直接坐标法 用迪卡尔坐标直接存储每个原子的三维坐标(x,y,z) 2、内坐标法 每个原子位置以与其他原子间的3个相对位置关系表示——相对距离、键角、二面角 基本存储 分子的元素组成、原子坐标、原子连接关系 其他存储 分子子结构信息,适用于生物大分子 原子电荷信息,调用时不必再计算 确定特定原子化学环境的原子类型信息 二、化合物数据库的生产和管理 MDL ISIS化学数据库管理系统 ISIS系统提供了基于Oracle 数据库系统的各类化学信息系统的管理和开发工具,可以同时管理化学结构、化学反应、生物活性及谱图等多种化学信息。 ISIS已应用于全球超过80%的化学与制药企业,已成为事实上的化学信息管理系统的工业标准。 ISIS (Integrated Scientific Information Management System)——MDL的综合性结构和反应管理软件 由三个主要模块组成: (1) 化学信息管理系统:ISIS/HOST——主服务器应用程序,进行通讯连接,集中数据库数据并作处理 (2) 化学信息生成和管理软件:ISIS/BASE——用于生成局部数据库及处理信息 (3) 化学画图软件:ISIS/DRAW——用于输入结构式和搜寻询问条件 2D结构输入 ——计算机绘制化学结构式 首先输入原子和键的骨架结构,原子数、电荷会自动变为上下标 软件的模板中收集大量分子片段 可智能分析结构式,处理结构式的编码和变换 还可有附加功能,如自动命名、化学计算、光谱分析等 三维结构的转化 3D结晶结构参数转入3D数据库 三、分子相似性和多样性分析 分子相似性和多样性分析方法的原则:结构相似的分子有着相似的性质或活性。 作用:在识别新的具有与已知化合物相同性质或活性的化合物时具有十分重要的作用。 数据库的化学多样性(chemical diversity): 数量巨大的、结构不同的贮藏和检索系统——适用于先导化合物发现 数据库的化学相似性(chemical similarity) 适用于先导化合物优化 评价方法:通过计算分子的描述符,并比较化合物描述符的近似程度。 分子描述符 概念:在相似性和多样性分析中,需要建立化合物结构和它们生
您可能关注的文档
- PIM-SM协议原理.ppt
- 总复习1-3.ppt
- 3工程项目施工质量评定表.doc
- 责任单元考核方案.ppt
- LabVIEW文件操作介绍.ppt
- MLA_体例.ppt
- 协议存款合同范本-2013.7.15-clean.doc
- 从格式塔到建构主义.pptx
- 如何写英文请假条、留言条.ppt
- 工艺管道安装质量检验评定表.doc
- 人教版数学六年级上册 第一单元 第5课时 分数乘小数.pptx
- 人教版数学六年级上册 第四单元 第3课时 比的应用.pptx
- 人教版数学六年级上册 第五单元 第5课时 圆的面积-2.pptx
- 人教版数学六年级上册 第一单元 第7课时 解决问题-1.pptx
- 人教版数学六年级下册 第二单元 第4课时 利率.pptx
- 人教版数学六年级上册 第一单元 第8课时 解决问题-2.pptx
- 人教版数学六年级下册 第五单元 第2课时 鸽巢问题的一般形式.pptx
- 人教版数学六年级下册 第四单元 整理和复习.pptx
- 人教版数学六年级上册 第一单元 第3课时 分数乘分数-1.pptx
- 人教版数学六年级下册 第六单元复习第2课时 可能性.pptx
最近下载
- 初中课外文言文100篇.doc
- 期中模拟测试卷(试题)-2024-2025学年一年级上册语文统编版(2024).docx VIP
- 高中英语_阅读课U2 Mother of Ten Thousand Babies教学设计学情分析教材分析课后反思.doc
- 《小学语文课程与教学论》课件——第七章 口语交际教学.pptx VIP
- 2024 ESC慢性冠脉综合征指南解读(全).pptx
- 国家与人口基础信息库建设项目建议书.doc
- 期中试题-2024-2025学年一年级上册语文统编版(2024).docx VIP
- 第十七章分子标记辅助选择育种习题及答案.docx
- 2013年通用安装工程计量规范.pdf
- 2024年全国各地中考试题分类汇编(一):现代文阅读含答案.docx
文档评论(0)