Place your ads here email us at info@blockchain.news
联邦AI模型增强蛋白质定位预测 - Blockchain.News

联邦AI模型增强蛋白质定位预测

realtime news Oct 08, 2025 19:40

NVIDIA的联邦AI模型使用FLARE和BioNeMo改善了蛋白质定位预测,对于生物学和药物发现至关重要,同时保持数据隐私。

联邦AI模型增强蛋白质定位预测

在生物学和药物发现方面,NVIDIA推出了一种通过联邦AI模型预测蛋白质性质的方法,这一重要进展由Holger Roth详细介绍。该方法利用NVIDIA FLARE和BioNeMo Framework预测蛋白质的亚细胞定位,这对于理解细胞过程和识别治疗靶点至关重要。

联邦学习方法

联邦学习允许研究人员在不需要在机构之间传输敏感数据的情况下协作训练AI模型。NVIDIA FLARE教程展示了如何微调ESM-2nv模型,以根据亚细胞定位对蛋白质进行分类。该模型利用蛋白质序列的嵌入,来自如《Light Attention Predicts Protein Location from the Language of Life》研究中的数据集。

数据和训练过程

所用数据遵循biotrainer标准,格式为FASTA文件,包括序列、训练/验证拆分和十个位置类之一,例如细胞核或细胞膜。这种设置为联邦学习应用提供了现实世界的分类挑战。

研究人员可以在Docker中使用BioNeMo Framework在Jupyter Lab环境中运行联邦蛋白质性质预测教程。NVIDIA FLARE通过仅共享模型更新而进行本地训练,以确保隐私。FedAvg方法将这些更新汇总形成全局模型。

训练和结果

团队对ESM-2nv模型进行了微调,平衡了预测准确性和计算效率。关键步骤包括数据拆分、联邦平均和使用TensorBoard进行可视化。该设置允许实时监控本地和联邦训练。

结果显示,联邦训练优于本地训练模型,将站点间的平均准确率从78.8%提高到81.7%。这表明联邦学习在通过利用多个机构的数据增强模型性能方面的有效性。

BioNeMo和FLARE的优势

BioNeMo和FLARE的整合除了蛋白质定位之外还提供了其他多种益处,因为它在支持科学界的AI发展同时保持数据隐私。这种方法促进了协作,使每个站点都能为更稳健的模型做出贡献。

随着这些进步,NVIDIA在生命科学领域的协作AI方面处于领先地位。该领域AI的未来是协作的,NVIDIA FLARE和BioNeMo提供的工具正在为医疗和生物技术领域的新发现铺平道路。

欲了解更多详情,请访问官方的 NVIDIA博客

Image source: Shutterstock