IBM发布Granite3.2：小巧高效AI模型，提升企业数据处理与安全

IBM近期发布了其最新版本的Granite3.2大型语言模型，致力于为企业和开源社区提供“小巧、高效、实用”的企业人工智能解决方案。该模型不仅拥有多模态和推理能力，还增强了灵活性和成本效益，使用户更容易采纳。

Granite3.2引入了视觉语言模型（VLM），用于处理文档，进行数据分类和提取。IBM宣称，这一新模型在关键基准测试中，性能可与Llama3.211B和Pixtral12B等大型模型相媲美。此外，Granite3.2的8B模型在标准数学推理基准测试中，也展现出与大型模型匹敌或超越的能力。

为了加强推理能力，Granite3.2的部分模型还具备“思维链”功能，能够解释中间推理步骤。虽然这一功能需要较大的计算能力，但用户可根据需求随时启用或禁用，以优化效率并降低整体成本。IBM AI研究副总裁Sriram Raghavan在发布会上指出，下一代人工智能的发展重点在于效率、整合与实际影响，使企业在预算范围内实现强大成果。

除了推理能力的提升，Granite3.2还推出了“Granite Guardian”安全模型的小型化版本，尽管体积缩减了30%，但性能与前一代模型相当。此外，IBM还引入了“可言语化信心”能力，这种能力能更细致地评估风险，并在安全监测中考虑不确定性。

Granite3.2是在IBM的开源Docling工具包上训练的，该工具包允许开发者将文档转换为定制的企业AI模型所需的特定数据。模型训练过程中处理了8500万份PDF文件以及2600万个合成问答对，以增强VLM处理复杂文档工作流的能力。

IBM还宣布推出下一代TinyTimeMixers（TTM）模型，这是一种紧凑的预训练模型，专注于多变量时间序列预测，具备长达两年的长远预测能力。

官方博客:https://www.ibm.com/new/announcements/ibm-granite-3-2-open-source-reasoning-and-vision

划重点:

📊 Granite3.2引入视觉语言模型，提升文档处理与数据提取能力。

💡 新模型具备思维链功能，能够阐明推理过程，增强推理能力。

🔍 Granit Guardian安全模型小型化30%，但性能未受影响，同时推出可言语化信心的风险评估功能。

IBM发布Granite3.2：小巧高效AI模型，提升企业数据处理与安全

CMA结束对微软OpenAI调查，AI行业监管再引关注

OpenAI发布GPT-4.5：最新最大模型逐步开放

暂无评论

发表评论取消回复

CMA结束对微软OpenAI调查，AI行业监管再引关注

OpenAI发布GPT-4.5：最新最大模型逐步开放

相关推荐

暂无评论

发表评论 取消回复

搜索

IBM发布Granite3.2：小巧高效AI模型，提升企业数据处理与安全

发表评论取消回复