CADD药物信息学基本知识.docVIP

下载本文档

37
0
约3.97千字
约 3页
2017-08-07 发布于重庆
举报
版权申诉

CADD药物信息学基本知识.doc

1、本文档共3页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

CADD药物信息学基本知识.doc

药物信息学初步 1药物信息学： a药物信息学是有关药物研究和开发过程中所涉及的大量小分子、大分子及其相互作用信息的学科。 b药物信息学，简单说来就是化学信息学和生物信息学的加和。 c也包括类药性、药物代谢动力学性质和毒性预测、药靶预测、高内涵筛选及代谢模型等综合信息在新药发现和发展中的整合、分析和应用。 2化学信息学与生物信息学化学信息学（Chemoinformatics，Chemical Informatics），简而言之，一切与小分子化合物有关的计算机操作和运算都属于化学信息学的研究范畴，包括小分子的结构、构象、能量、性质等，也包括小分子与大分子的相互作用，还包括小分子的设计。化学信息学的研究已有较长的历史，比如1960年代出现的QSAR，但作为学科名词1998年才首次出现。与之相对的是生物信息学（Bioinformatics或Biological Informatics）。生物信息学是随着人类基因组计划的实施而出现的，最初仅是指对基因组序列的比较分析。但现在已发展到既对生物大分子的序列、也对生物大分子的结构、构象进行研究。针对生物大分子结构、功能等的计算研究，叫做计算生物学（Computational Biology）。 3 化学信息学在药物设计中的主要应用虚拟组合化学库的设计；化合物数据库的相似性分析与多样性分析；化合物数据库的类药性分析、ADMET性质预测；化合物数据库的虚拟筛选；。。。 4 为什么要进行ADMET预测 ADMET是候选药物临床研究失败的主要原因（占60%）。 ADMET评估已成药物研发的关键，需尽早进行。由于ADMET涉及药物体内过程，因此评估非常困难。实验评价ADMET缺点：代价大、周期长，一般在临床前研究阶段才开始进行，且动物数据与人体数据并不完全一致。计算机预测ADMET优点：代价低、速度快，可以在化合物合成之前进行，也可以与先导物优化一起进行，这样可将理论上具有不良ADMET性质的分子尽早排除，从而降低失败率。 5 ADMET预测的基本要求要有大量可靠的实验数据供使用；要有合适的方式对分子结构进行表达；要有合适的建模方法及评价指标。 6 常规ADMET预测方法分子结构采用分子描述符进行表达；分子描述符与性质之间采用统计回归分析方法建立预测模型。存在的问题：分子描述符是间接描述分子，具有计算繁杂、数据可能不准确，数量众多而难以取舍，模型可解释性差等问题。 7 基于子结构模式识别的ADMET预测方法新方法：分子结构采用分子指纹进行表达；分子指纹与性质之间采用机器学习方法建立预测模型。优点：跳过分子描述符而直接从分子结构出发来预测分子性质，提高了预测精度；采用信息增益技术识别关键子结构，建立的模型具有可解释性；等等。 8生物信息学在药物设计中的应用药物作用新靶标的发现与确证：人体内靶标病原体内靶标蛋白质序列比较、分析；蛋白质结构相似性比较、同源蛋白的识别。蛋白质二级结构与三维结构的预测。 9 序列比对(sequence alignment) 序列比对指将两个或多个序列排列在一起，标明其相似之处。序列中可以插入间隔（通常用短横线“-”表示）。对应的相同或相似的符号排列在同一列上。这一方法常用于研究由共同祖先进化而来的序列，特别是如蛋白质序列或DNA序列等生物序列。将未知序列同数据库中的已知序列进行比较分析，可以预测未知序列的结构、性质或功能，已成为生物学家一个强有力的研究手段。 10 序列比对同一性（Identity）：两个蛋白质有一定数量的氨基酸在比对的位点上是相同的，例如：如果100个氨基酸残基的蛋白质中50个位点相同，我们说它们50%相同。相似性（Similarity）：通常在某些位点上有一些氨基酸被另外一些化学物理特性相近的氨基酸所代替，这种突变可称为保守突变。将保守突变的因素考虑在内，就可以定义各种打分方案(scoring schemes)对两序列的相似程度打分，所得分值即代表其相似的程度。同源性（Homology）：只有当两个蛋白质在进化关系上具有共同的祖先，才可称它们为同源的。 11 蛋白质结构的实验测定 X-ray 晶体衍射需要生长蛋白质晶体（这对一部分蛋白质几乎是不可能的，总之，不容易）衍射图样能进行反傅立叶变换来表征电子密度（这有“相”的问题）核磁共振谱（NMR）能提供距离约束，但很难发现对应的结构只适用于相对较小的蛋白质 12 蛋白质二级结构预测由蛋白质二级结构统计分析得到的规则可用于全新蛋白质设计或者蛋白质突变体的设计；当序列同源性较低时，二级结构的确认有助于确定蛋白质间结构和功能的关系；在同源蛋白质模建中，二级结构预测有助于建立正确的序列比对关系；在基于二级结