IBM近期发布了其最新版本的Granite3.2大型语言模型,致力于为企业和开源社区提供“小巧、高效、实用”的企业人工智能解决方案。该模型不仅拥有多模态和推理能力,还增强了灵活性和成本效益,使用户更容易采纳。

QQ_1741229530181.png

Granite3.2引入了视觉语言模型(VLM),用于处理文档,进行数据分类和提取。IBM宣称,这一新模型在关键基准测试中,性能可与Llama3.211B和Pixtral12B等大型模型相媲美。此外,Granite3.2的8B模型在标准数学推理基准测试中,也展现出与大型模型匹敌或超越的能力。

为了加强推理能力,Granite3.2的部分模型还具备“思维链”功能,能够解释中间推理步骤。虽然这一功能需要较大的计算能力,但用户可根据需求随时启用或禁用,以优化效率并降低整体成本。IBM AI研究副总裁Sriram Raghavan在发布会上指出,下一代人工智能的发展重点在于效率、整合与实际影响,使企业在预算范围内实现强大成果。

除了推理能力的提升,Granite3.2还推出了“Granite Guardian”安全模型的小型化版本,尽管体积缩减了30%,但性能与前一代模型相当。此外,IBM还引入了“可言语化信心”能力,这种能力能更细致地评估风险,并在安全监测中考虑不确定性。

Granite3.2是在IBM的开源Docling工具包上训练的,该工具包允许开发者将文档转换为定制的企业AI模型所需的特定数据。模型训练过程中处理了8500万份PDF文件以及2600万个合成问答对,以增强VLM处理复杂文档工作流的能力。

IBM还宣布推出下一代TinyTimeMixers(TTM)模型,这是一种紧凑的预训练模型,专注于多变量时间序列预测,具备长达两年的长远预测能力。

官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision

划重点:

📊 Granite3.2引入视觉语言模型,提升文档处理与数据提取能力。

💡 新模型具备思维链功能,能够阐明推理过程,增强推理能力。

🔍 Granit Guardian安全模型小型化30%,但性能未受影响,同时推出可言语化信心的风险评估功能。