近期,随着人工智能版权案件Kadrey诉Meta案的发展,Meta公司内部信息被法庭公开,揭示了在开发Llama3模型过程中,公司高层致力于超越OpenAI的GPT-4模型。

在2023年10月的一条信息中,Meta生成AI副总裁Ahmad Al-Dahle表示:“坦白说,我们的目标必须是GPT-4。我们拥有64000个GPU!我们必须学会如何构建前沿技术,赢得这场竞争。”

Meta,元宇宙,Facebook

尽管Meta发布了开源AI模型,但公司高层显然更关注那些不公开模型权重的竞争对手,如Anthropic和OpenAI,并将它们的Claude和GPT-4作为工作基准。尽管法国AI初创公司Mistral多次被提及,但Meta高层对其评价并不高。Al-Dahle在信息中表示:“Mistral对我们来说不过是小菜一碟,我们应该能够做得更好。”

在AI领域,各家公司竞相推出先进的AI模型,而这些法庭文件揭示了Meta在竞争中的紧张氛围。在多条信息中,Meta的AI领导者提到他们在获取训练Llama所需数据方面“非常积极”。一位高管甚至表示:“Llama3是我唯一关心的事情。” 他们讨论了如何改进数据集,以提升Llama3的表现。

然而,案件的检察官指控Meta高层在急于推出AI模型的过程中,可能在使用数据上存在疏漏,涉及了一些受版权保护的书籍。Touvron提到,Llama2的数据集组合“效果不佳”,并探讨了如何使用更好的数据源来提升Llama3。Al-Dahle询问道:“我们有合适的数据集吗?有没有什么因为愚蠢的原因无法使用的内容?”

Meta首席执行官马克·扎克伯格此前曾表示,努力缩小Llama模型与OpenAI、谷歌等公司闭源模型之间的性能差距。这些内部消息显示,Meta在追求这一目标上承受着巨大的压力。扎克伯格在2024年7月的一封信中提到:“今年,Llama3在最新的模型中具备竞争力,并在某些领域领先。”

2024年4月,Meta最终发布了Llama3,这一开源AI模型在竞争中表现出色,超过了来自Mistral的开源选项,但其训练模型使用的数据——这些数据据称得到了扎克伯格的批准,正面临多个诉讼的审查。

重点:

🌟 Meta高层在开发Llama3过程中专注于超越OpenAI的GPT-4模型。

💡 该公司在获取数据方面表现积极,但面临使用版权受限数据的指控。

📈 扎克伯格期待未来的Llama模型能够成为行业中领先的选择。