Ai专栏 98 次浏览 LongBenchv2评估LLMs深度理解与推理 LongBench v2评估LLMs在长文本多任务中的深度理解和推理能力,具有更长的文本长度、更高的难度和更广泛的任务覆盖。 查看全文