当前标签

SandboxFusion

新闻热点 125 次浏览

字节豆包推出全栈代码模型评估基准FullStackBench，覆盖11类场景16种语言

字节豆包推出全新代码大模型评估基准FullStack Bench，覆盖11类真实场景，支持16种编程语言，含3374个问题，提升模型编程能力评估准确性。同时，开源代码沙盒工具SandboxFusion，助力开发者高效测试。团队还评测多款代码大模型，展现AI编程领域领先地位。