- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
一步之遥的指纹,巨大的飞跃:从质谱生成
从头开始分子
NengKaiNigelNeonnengkai@.sg
LimJingljing2@.sg
NgouiYongZhauPrestonnyongzha@.sg
KohXueTingSereneKXueTin2@.sg
ShenBingquanSBingqua@.sg
本DSONationalLaboratories
译Singapore
中
2
vAbstract
0
8
1处理从质谱图生成从头开始分子的问题的常见方法涉及一个两阶段管道:(1)将质谱编码为
4
0分子指纹,然后是(2)将这些指纹解码为分子结构。在我们的工作中,我们采用迷雾(Goldman
.
8etal.,2023)作为编码器和分子锻造(Ucaketal.,2023)作为解码器,并利用预训练来提升
0性能。值得注意的是,对分子锻造进行预训练特别有效,使其能够作为一个稳健的指纹到结
5
2构解码器发挥作用。此外,与传递指纹中每个位的概率不同,将概率视为阶跃函数有助于使
:
v解码器专注于子结构的存在,即使由迷雾预测出的指纹仅在Tanimoto相似性方面适度地类
i
x似于真实值时,也能提高准确分子结构的恢复。这种编码器和解码器的组合比以前最先进的
r
a方法提高了十倍,从质谱图中正确生成了前1名28%/前10名36%的分子结构。我们将此
管道定位为从质谱中阐明从头开始分子的未来研究的强大基线。
1介绍
质谱(MS)是分析化学中的一项基础技
术,广泛用于有机分子的结构表征(Nor-
iegaetal.,2022)。通过提供高分辨率的
质量测量(精确到小数点后四位),MS
能够准确推断分子式。此外,离子化过程
产生的碎片模式编码了丰富的结构信息,
提供了对分子底层功能基团和键连接性图1:使用质量谱编码器和指纹解码器来解决从头开始分子生成
的洞察。这些特性使MS成为代谢组学问题的管道。
(Alseekhetal.,2021)和环境化学(Lebe-
dev,2013)等领域不可或缺的工具,在这些领域中识别前所未见的化合物至关重要。传统基于检索的方法与
1
精心整理的光谱数据库相结合,已显著提高了从MS数据中识别结构的能力(Bushuievetal.,2024)。然而,
在处理数据库中不可用的新化合物问题时还需要做更多的工作。这为机器学习方法在从头开始分子生成中发
挥核心作用奠定了舞台。
从头开始分子的生成问题多年来一直难以解决,但近期的研究工作显示了解决该问题的进步。机器学习方面
的进展也得益于经过整理的数据集和基准测试,这些有助于稳定地整合并比较方法。解决从质谱中生成从头
开始分子的问题的方法之一是采用两阶段流程:(1)将质谱编码为分子指纹(FP),然后(2)解码这些指纹为
分子结构(Bohdeetal.,2025)。示例流程如图1所示。因此,生成从头开始分子的问题可以归结为选择合适
的编码器和解码器。
之前使用此管道的方法由于指纹解码器依赖于由质谱编码器生成的指纹而性能不
您可能关注的文档
- 面向序列的 SAC 控制在电气化动力总成中用于发动机燃油消耗优化.pdf
- 基于线性规划的非线性自治系统稳定性条件.pdf
- 用于交通运输应用中的对象检测的双流注意力与多模态查询.pdf
- VER-Bench: 在细粒度视觉证据上的推理评估中对 MLLMs 的评价.pdf
- 多阶段知识蒸馏 VGAE 和 GAT 的鲁棒控制器区域网络入侵检测.pdf
- 数据驱动的 FCC 高熵合金成分-性能关系洞察.pdf
- 关于情感影响和协调的人机反应之间的因果关系.pdf
- 基于事件的深度学习眼动追踪方法.pdf
- CoMAD: 一个多教师自监督蒸馏框架.pdf
- 重音检测提升预训练自动语音识别.pdf
- SSEmb: 一种结合结构和语义嵌入的数学公式检索框架.pdf
- 探测和增强基于 GNN 的 QEC 解码器的鲁棒性与强化学习鸡尾酒会效应.pdf
- 模块化变压器架构用于精准农业成像.pdf
- 通过 AI 驱动的交互式叙事促进视障和低视力用户探索视觉媒体.pdf
- 博学者:具有动态分层工作流的自我优化代理.pdf
- 大陪审团:用于动态质量评估标准的协作机器学习模型评估协议.pdf
- 可调腿部刚度在单足跳跃机器人中用于跨越不同地面轮廓的节能垂直跳跃.pdf
- CRYSTALS-Kyber(ML-KEM)作为后量子时代替代 RSA 和 ECC 的性能与存储分析.pdf
- GPS 卫星的姿态确定与控制:稳定化、轨道插入和运行控制机制.pdf
- 专业Latex文档翻译 + 关注
-
实名认证服务提供商
专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。
文档评论(0)