Teuken-7B 语言模型发布：打破英语垄断，支持 24 种欧盟官方语言

Teuken-7B 是一款具备 70 亿参数的语言模型，刚刚在 Hugging Face 上正式发布，支持欧盟的所有 24 种官方语言。这款模型由欧盟的 OpenGPT-X 研究项目团队开发，并作为开源项目提供给用户使用。与大多数侧重英语的 AI 语言模型不同，Teuken-7B 从零开始构建，大约有一半的训练数据来自于非英语的欧洲语言。

大脑大模型

图源备注：图片由AI生成，图片授权服务商Midjourney

开发团队指出，Teuken-7B 在所有训练的语言中都展现了优异的性能，尤其是在处理非英语语言时，其可靠性让人印象深刻。为了评估语言模型在欧洲语言的表现，项目团队还特意创建了一个新的欧洲 LLM 排行榜，超越了以往主要基于英语的标准测试方法。

这一发布为欧洲在推广多语言人工智能模型方面带来了重大突破，同时也为开发者提供了一个强大而多样化的工具，以助力跨语言的应用和研究。

Teuken-7B 语言模型发布：打破英语垄断，支持 24 种欧盟官方语言

亚马逊推出新型多模态语言模型“Olympus”，预计在AWS大会上揭晓

“智源推出超实时虚拟心脏数字孪生：性能提升180倍！”

暂无评论

发表评论取消回复

亚马逊推出新型多模态语言模型“Olympus”，预计在AWS大会上揭晓

“智源推出超实时虚拟心脏数字孪生：性能提升180倍！”

相关推荐

暂无评论

发表评论 取消回复

搜索

Teuken-7B 语言模型发布：打破英语垄断，支持 24 种欧盟官方语言

发表评论取消回复