NeFut Logo NeFut
EN 管理员登录

[AI学术] 量子框架下的pKa数据增强:从有限真实数据到全面预测

发布于:2026-06-18 22:00 最后更新:2026-06-20 13:47
#Machine Learning #Open Source #Quantum

在功能分子发现与分子建模中,质子解离常数(pKa)至关重要。基于iBonD,最大实验pKa数据库,我们与其他研究者开发了多种方法,包括基于机器学习的经验预测和高精度能量计算。尽管已有基础,快速增强高质量pKa数据依然受到限制。我们对未标记的分子数据集进行了大规模回归pKa预测,使用了一系列经过广泛优化的机器学习模型。结果表明,未标记分子数据集的特征分布近似正态分布,但尾部样本极其稀缺。虽然这种数据增强对提高整体数据可用性和预测建模极具价值,但对于有效发现具有广谱pKa特性的分子仍显不足。为此,我们探索从广阔的化学空间中有针对性地生成具有稀疏pKa特性的分子。考虑到传统的连续潜在空间VAE-RNN方法在分子生成中存在稳定性不足的问题,且未能在补充稀疏数据方面展示明显优势,我们设计并实施了一种量子辅助的稀疏pKa分子生成。我们的可行性在模拟量子退火器上得到了验证,并在物理相干伊辛机器(CIMs)上实现了更优的极值采样。

博主点评: 本文通过量子计算探索分子生成的新领域,尤其是在数据稀缺的情况下。量子辅助的方法可能会为化学和材料科学带来革命性进展,值得关注其后续研究与应用潜力。

原文链接: https://arxiv.org/abs/2606.17077

[h] 返回首页