当前标签

测评

Ai专栏 367 次浏览

AI搜索基准测评揭示大模型在场景应用中的表现差异

本次AI搜索基准测评评估了14个国内外大模型的搜索能力，重点考察信息检索和场景应用。ChatGPT-4o-latest表现领先，Kimi探索版紧随其后。国内大模型在科技、文化、商业等场景表现优秀，但在股票、体育等领域尚需提升。测评展示了各模型的优势与不足，为AI搜索模型的优化提供了宝贵参考。