当前标签

text understanding

LongBenchv2评估LLMs深度理解与推理

Ai专栏 157 次浏览

LongBenchv2评估LLMs深度理解与推理

LongBench v2评估LLMs在长文本多任务中的深度理解和推理能力，具有更长的文本长度、更高的难度和更广泛的任务覆盖。

LongBenchv2发布：长文本LLM深度理解与推理基准测试

新闻热点 135 次浏览

LongBenchv2发布：长文本LLM深度理解与推理基准测试

LongBench v2：腾讯智源院发布长文本模型评估基准，提升LLMs理解和推理能力。