网站大量收购闲置独家精品文档,联系QQ:2885784924

化学信息学2-1.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
化学信息学2-1

第二章 化学结构信息的计算机表示与应用 第二章 化学结构信息的计算机表示与应用 2.1 结构信息的计算机表示 2.1.1 有机化合物连接信息的计算机表示 * —测量得到的物质的物理、化 学性质和结构信息,以及分子间的相互作用信息 (包括化学反应信息) 化学信息可分为两大部分: 化学物质的化学信息 媒体形式的化学信息 —化学信息的记录形式,如图 书、期刊、专利、数据库及音像资料等 按化学信息的内容及表达形式,可分为四大类: 数字信息 结构信息 化学知识 可视化信息 —科学测量结果(性质数据、谱数据等) —原子或分子在空间上的分布与联结情况 —化合物性质规律 —计算机对化学信息的可视化表示 ※ 化合物的结构信息是化学信息中具有独特性质的 部分,需要表示的不仅是数字和符号,更多的是 组成分子的原子数目和种类,以及各原子间的相 对位置和联结性(化学键) ※ 化学结构的表示应具有“唯一性”和“无二义性” 象俗称和系统命名法(用文字和数字串)来表示结 构的方法都不利于计算机操作 —化学家在计算机交互界面上的表达方式 —分子结构在计算机内部的存储方式 ※ 结构信息的计算机表示包括: 外部表示 内部表示 ※ 结构信息的计算机表示必须满足的条件: a. 简洁、易学,符合化学家的工作习惯; b. 能够转换为正确、无二义的计算机内部表示; 并能无二义地转换成化学家可以理解的形式, 即二维或三维结构图; c. 内部表示要便于执行化学变换操作; d. 结构信息表示系统应具有存储、处理、检索及 显示功能。 ※ 有机化合物连接信息的计算机表示常用方法: 1. 图论表示 2. 线性编码(Linear Notation,LN) 3. 矩阵表达 4. 连接表 1. 连接信息的图论表示 ※ 结构图与拓扑图之间的相似性是用图论算法处理 化合物结构信息的基础 ※ 一般以原子为点(顶点),以键为边作图,两个点 之间用多边相连表示多键, 如双键和三键; 只有连接是重要的,边的长度和角度都不重要。 ※ 表示原子之间的连接和键类型的图称为拓扑图,它 不包含任何三维结构的信息 COOH NH2 C C C C C C C C C O O N 2. 连接信息的线性编码表示 ※ 指用具有一定语法规则的字母和数字的线性序列来 表示化合物的结构 ※ 线性编码表示法一般应具有“唯一性”和“无二义性” 的特征 ※ 较为著名的线性编码(LN)方法有: Wiswesser LN(WLN) ROSDAL LN SMILES LN Sybyl LN —基本上已被废弃 —广泛应用的重要的表示方法 COOH NH2 系统命名:苯丙氨酸 IUPAC命名: 2-氨基-3-苯基丙酸 Wiswesser: VQYZ1R ROSDAL: 1O-2=3O,2-4-5N,4-6-7=-12-7 SMILES: NC(Cc1ccccc1)C(O)=O Sybyl : C[1]H:CH:CH:CH:CH:C(:@1)CH2CH(NH2)C(=O)OH (1) Wiswesser 线性编码(WLN) ※ 1946年,英国ICI公司为了用简化法有组织、系统 地描述大量的化合物而提出 ※ 有利于特定官能团或者分子碎片的搜索 ※ 因此,可用于具有部分特征的分子的机器检索 ※ 用字母和数字的序列来表达化合物的结构 ※ 基本的WLN规则 (b) 一般情况下,采用化学元素的标准符号; (c) 大写字母A~Z代表元素、原子团、支链和环的 位置; (d) 数字0~9表示脂肪链的长度和环的数目; (e) 官能团、环系统、取代环的位置和稠合环的位置 由单个的字母或符号表示;例如下表 (a) 按化合物结构原子联结的基本顺序,注意突出 官能团,即从最接近官能团的一端开始,依次 进行描述; VQ;VO -COOH;-CO-O- V;VH -CO-;-CHO Q;O -OH;-O- F, G, E, I 烷基卤化物-X(X=F,Cl,Br,I) R RB,RC,RD,RE,RF Y 支链

文档评论(0)

asd522513656 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档