当前标签

视觉语言模型

Hugging Face推出SmolVLM:高效运行的2B参数视觉语言模型,适配普通设备

SmolVLM 是 Hugging Face 推出的一款针对设备端推理的轻量化视觉语言模型,具备2B参数,能够在低资源环境下高效运行。与同期模型相比,SmolVLM 的令牌生成速度提升了7.5到16倍,同时优化了架构,大大降低了对硬件的要求。它在处理视觉语言任务时表现出色,测试中对50帧 YouTube 视频的适应能力也展现了良好的性能。SmolVLM 的推出,使得强大的机器学习能力更加易于接触,填补了当前AI工具的一项重要空白。

查看全文