Teuken-7B 语言模型发布:打破英语垄断,支持 24 种欧盟官方语言
Teuken-7B是一款70亿参数的语言模型,支持欧盟24种官方语言,已在Hugging Face上推出。该模型由欧盟OpenGPT-X研发,通过开源方式向用户提供。与大多数专注于英语的模型不同,Teuken-7B的训练数据约一半来自非英语欧洲语言,表现出色,特别是在处理非英语语种方面。项目团队还建立了新的欧洲LLM排行榜,以评估模型在各语言中的表现,展现出欧洲在多语言AI领域的进步,助力跨语言的应用和研究。
Teuken-7B是一款70亿参数的语言模型,支持欧盟24种官方语言,已在Hugging Face上推出。该模型由欧盟OpenGPT-X研发,通过开源方式向用户提供。与大多数专注于英语的模型不同,Teuken-7B的训练数据约一半来自非英语欧洲语言,表现出色,特别是在处理非英语语种方面。项目团队还建立了新的欧洲LLM排行榜,以评估模型在各语言中的表现,展现出欧洲在多语言AI领域的进步,助力跨语言的应用和研究。