上海人工智能实验室与魔搭联合推出CompassArena大模型评测平台新升级
上海人工智能实验室与魔搭联合推出的CompassArena大模型评测平台近日升级,新增Judge Copilot功能和20多个模型,提升模型评估体验。新功能提供多维度对比分析,优化榜单算法,确保模型排名更科学精准。用户反馈将进一步提升Judge模型的能力,丰富对战选择。
上海人工智能实验室与魔搭联合推出的CompassArena大模型评测平台近日升级,新增Judge Copilot功能和20多个模型,提升模型评估体验。新功能提供多维度对比分析,优化榜单算法,确保模型排名更科学精准。用户反馈将进一步提升Judge模型的能力,丰富对战选择。