上海人工智能实验室与魔搭联合推出CompassArena大模型评测平台新升级
上海人工智能实验室与魔搭联合推出的CompassArena大模型评测平台近日升级,新增Judge Copilot功能和20多个模型,提升模型评估体验。新功能提供多维度对比分析,优化榜单算法,确保模型排名更科学精准。用户反馈将进一步提升Judge模型的能力,丰富对战选择。
上海人工智能实验室与魔搭联合推出的CompassArena大模型评测平台近日升级,新增Judge Copilot功能和20多个模型,提升模型评估体验。新功能提供多维度对比分析,优化榜单算法,确保模型排名更科学精准。用户反馈将进一步提升Judge模型的能力,丰富对战选择。
Kimi应用近期频繁崩溃,用户遭遇网络连接错误,体验大受影响。业内人士分析,可能与高并发用户访问有关。此次事件引发用户不满,官方尚未明确解释原因。