北京智谱华章科技有限公司宣布,旗下智谱开放平台BigModel推出首个免费的多模态API——GLM-4V-Flash。该模型基于4V系列的高性能,实现了图像处理精度的提升,降低了开发者使用大型模型进行深入研究的门槛。

GLM-4V-Flash模型拥有图像描述生成、图像分类、视觉推理、视觉问答(VQA)以及图像情感分析等多项高级图像处理功能,支持包括中文、英语、日语、韩语、德语在内的26种语言。针对特定垂直行业,该模型能提供精准的场景解决方案,帮助开发者轻松进入大模型时代,无需承担高昂的图像处理费用。

智谱 AI

智谱开放平台BigModel鼓励开发者利用GLM-4V-Flash的图像处理优势,将模型能力应用于实际场景。无论是信息提取、内容创作还是图片识别,GLM-4V-Flash都能大幅提升工作效率和用户体验。

GLM-4V-Flash模型已在多个行业场景中发挥巨大作用,包括社交媒体文案生成、教育创新支持、美容咨询助手、安全检测、OCR保险单信息提取、工单质量检测、电商商品描述生成和多模态数据标注等。

体验中心:

https://www.bigmodel.cn/console/trialcenter