近期,Arc Institute 与 Nvidia 共同研发的生物AI模型Evo2正式对外发布。该模型基于超过10万种生物的DNA数据,致力于深入解析生物学中的复杂现象。Evo2能够在众多生物体的基因序列中迅速识别出研究者们通常需要数年才能发现的模式,显著提高了疾病相关突变的识别效率,并能够设计出与简单细菌相似的全新基因组。
Evo2的训练处理了超过93万亿个核苷酸,远超其前代Evo1。其研发团队由Nvidia和位于加州帕洛阿尔托的非营利生物医学研究机构Arc Institute组成,并与斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员紧密合作。Evo2不仅拥有强大的计算能力,还在透明性和可解释性方面进行了深入探索。为了使科学研究更加开放,研究团队还公开发布了Evo2的训练数据、代码和模型权重,使其成为迄今为止规模最大的完全开源生物AI模型。
Patrick Hsu,Arc Institute的共同创始人及UC Berkeley的助理教授指出,Evo2的开发是生成生物学领域的一项重大突破。这项技术使得机器能够“阅读”、“写作”和“思考”核苷酸的语言,推动了生物研究的进步。Evo2的训练能力与大规模语言模型相当,展现出在预测疾病突变及设计潜在人工生命方面的巨大潜力。
此外,Evo2还能为生物疗法的设计提供新的思路,例如针对特定细胞类型激活的基因治疗,以降低副作用并提高治疗精度。Evo2的开发不仅在技术上取得了突破,也深刻影响了生物学的研究。
在确保模型负责任开发的前提下,研究人员特意排除了可能感染人类及其他复杂生物的病原体数据。Nvidia的数字生物学总监Anthony Costa表示,Evo2突破了生物基础模型的限制,为全球科学家提供了强大的合作工具,以应对人类面临的重大健康和疾病挑战。
暂无评论