Scikit-fingerprints: 在 Python 中轻松高效地计算分子指纹.pdfVIP

  • 0
  • 0
  • 约4.11万字
  • 约 28页
  • 2026-03-06 发布于北京
  • 举报

Scikit-fingerprints: 在 Python 中轻松高效地计算分子指纹.pdf

Scikit-fingerprints:在Python中轻松高效地计算分子

指纹

JakubAdamczyk1,,PiotrLudynia2

AGHUniversityofKrakow,DepartmentofComputerScience,Cracow,Poland

Abstract

在此工作中,我们介绍了scikit-指纹,一个用于计算分子指纹以应用于化学

本生物信息学的Python包。我们的库提供了工业标准的scikit-learn接口,允

译许直观使用并轻松集成到机器学习流水线中。它也经过高度优化,具备并

中行计算功能,能够高效处理大规模分子数据集。目前,scikit-指纹站在开源

5

vPython生态系统中最丰富的特性库之列,提供超过30种分子指纹。我们

1

9的库简化了基于分子指纹的化学生物信息学任务,包括分子属性预测和虚

2

3拟筛选。它还具有灵活性、高效率并且完全开源。

1

.Keywords:分子指纹,化学信息学,分子性质预测,Python,机器学习,

7

0scikit-learn

4

22000MSC:92-04,92-08,92E10,68N01

:

v

i

x

r元数据

a

1.动机和意义

分子是计算化学中处理的基本结构。它们最常被表示为分子图,这些图形需

要转换成多维向量以供大多数处理算法使用,尤其是机器学习(ML)应用。

这通常是通过分子指纹来完成的,这是一种特征提取算法,将关于分子的结

构信息编码为向量[1]。它们在化学信息学中被广泛使用,例如用于化学空

Correspondingauthor

Emailaddress:jadamczy@.pl(JakubAdamczyk)

1ORCID0000-0003-4336-4288

2ORCID0009-0004-0749-9569

编号代码元数据描述请填写此栏

C1Currentcodeversion1.6.1

C2Permanentlinktocode/repository/

usedforthiscodeversionscikit-fingerprints/

scikit-fingerprints/tree/

SoftwareX_submission_v1.6.1

C3PermanentlinktoReproducibleN/A

Capsule

C4LegalCodeLicenseMIT

C5Codeversioningsystemusedgit

C6Softwarecodelanguages,tools,andPython3.9ornewer,RDKit

servicesused

C7Compilationrequirements,operat-Linux,Windows,macOS

ingenvironmentsdependencies

C8IfavailableLinkto

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档