Evo2:全球最大生物AI模型,基因研究新突破

Arc Institute 与 NVIDIA 联手,携手斯坦福大学、加州大学伯克利分校及加州大学旧金山分校的研究者,共同打造了全球规模最大的生物学人工智能模型——Evo2。Evo2基于超过128,000个基因组的数据,训练了达9.3万亿个核苷酸,其规模可与目前最强大的生成性AI语言模型相媲美。

QQ_1740017835097.png

Evo2的深度学习能力使得它能够迅速识别各种生物体基因序列中的模式,大幅缩短了研究时间。它能够准确识别引发人类疾病的突变,并能够设计出与简单细菌基因组长度相近的新基因组。Evo2的开发团队宣布,将于2025年2月19日发布该模型的详细资料,并推出用户友好的界面Evo Designer。Evo2的代码已在Arc的GitHub上公开发布,并集成至NVIDIA的BioNeMo框架,以助力科学研究的发展。

与前辈Evo1相比,Evo2的数据范围更加广泛,不仅覆盖了细菌、古菌、病毒,还包括人类、植物等真核生物。Evo2的开发标志着生成生物学领域的一个重要进展,使得机器能够“读、写、思考”核苷酸的语言。

在技术层面,Evo2在NVIDIA DGX Cloud AI平台上使用2000多块NVIDIA H100GPU进行训练,能一次处理高达100万个核苷酸的基因序列,从而理解基因组的远程部分之间的关系。新的AI架构“StripedHyena2”使得Evo2能够处理比Evo1多30倍的数据。

Evo2的应用前景十分广泛,如在分析与蛋白质功能和生物体适应性相关的遗传变化方面表现出色。在乳腺癌相关基因BRCA1的变体测试中,Evo2预测突变的准确率超过90%。这些发现能够显著减少实验室的时间和资金,推动新药的研发。

此外,Evo2还可助力设计新的生物工具或治疗方案。例如,科学家可以设计针对特定细胞的基因疗法,避免副作用。研究团队认为,未来可在Evo2的基础上构建更具体的AI模型,为基因组研究和生物工程提供更多可能性。

在伦理和安全风险方面,研究人员确保Evo2的数据集不包含对人类和其他复杂生物有害的病原体,以确保这一技术的负责任开发和部署。

Evo2详细介绍:[点击查看](https://arcinstitute.org/news/blog/evo2)

🌱 Evo2是全球最大的生物学AI模型,训练数据涵盖128,000个基因组。

🔍 该模型能快速识别疾病突变并设计新基因组,大幅提升科研效率。

💡 Evo2为未来的生物工程和基因疗法设计提供了新的可能性。

相关推荐

5招SEO优化技巧提升网站排名

文章摘要:本文探讨了人工智能在医疗领域的应用,包括疾病诊断、药物研发和患者护理,分析了其带来的机遇与挑战,并提出了相应的解决方案。

暂无评论

发表评论