Neo-1是什么
Neo-1 是 VantAI 推出的全球首个将从头分子生成与原子级结构预测统一的AI模型。能预测生物分子结构,生成全新的分子,在设计分子胶等新型治疗药物方面表现出色。Neo-1 的多模态输入功能能接受部分序列、部分结构和实验数据等多种信息,显著提高药物设计的效率和准确性。Neo-1 与 VantAI 的 NeoLink 平台相结合,通过交联质谱法生成稀疏的结构约束,再将其组装成完整的原子级分辨率结构,推动了结构生物学的发展。
Neo-1的主要功能
- 统一生成与预测:Neo-1 是首个将从头分子生成与原子级结构预测统一起来的模型。通过生成分子的潜在表示,不是预测原子坐标,能预测生物分子结构并生成全新的分子。
- 多模态输入:Neo-1 接受多种模态的输入,包括部分序列、部分结构和实验数据等。多模态输入方式显著提高了模型的灵活性和适用性。
- 大规模训练:Neo-1 是生物学中最大的基于扩散的模型之一,使用数百个 NVIDIA H100 GPU 在结构和合成数据集上进行训练。
- 定制数据集和工具:Neo-1 结合了 VantAI 自有的 NeoLink 数据集以及与 NVIDIA 共同开发的 PINDER & PLINDER 工具。
Neo-1的技术原理
- 潜在空间中的扩散过程:Neo-1 将扩散过程从传统的坐标空间转移到潜在空间。这种转变使模型能在更平滑的序列和结构景观中进行推理,能生成全新的分子,包括蛋白质、肽和小分子,同时以原子级精度预测它们的结构。
- 大规模训练与定制数据集:Neo-1 是生物学中最大的基于扩散的模型之一,使用数百个 NVIDIA H100 GPU 在结构和合成数据集上进行训练。结合了 VantAI 自有的 NeoLink 数据集以及与 NVIDIA 共同开发的 PINDER & PLINDER 工具,提升了模型的性能。
- 精准的分子生成与结构预测:Neo-1 采用“粗到细”的生成方式,能根据整个分子结构施加中间奖励,将分子生成导向任何目标。与传统的自回归模型不同,后者在生成过程中缺乏灵活性。
Neo-1的项目地址
Neo-1的应用场景
- 分子胶设计:Neo-1 能针对复杂的靶点设计分子胶等新型治疗药物,将传统上需要数年的时间缩短为数周。
- 蛋白质复合物结构预测:Neo-1 能预测多种生物分子复合物的结构,包括三元复合物、抗体 – 抗原相互作用和蛋白质 – 肽复合物。
- NeoLink 数据平台的应用:Neo-1 与 VantAI 的 NeoLink 数据平台相结合,能基于交联质谱法生成的稀疏结构约束,组装成完整的原子级分辨率结构。
- 抗体发现:Neo-1 能实现从头到尾的理性抗体发现。可以将部分抗体序列和抗原结构作为输入,同时折叠 VH 抗体片段并生成部分 CDRH3 序列。