阿里云发布Qwen2.5-1M开源模型，支持百万Token长上下文

继 DeepSeek R1推出后，阿里云通义千问团队最新宣布开源模型Qwen2.5-1M，再次引发行业关注。

此次推出的Qwen2.5-1M系列包括两个开源模型：Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M。这是通义千问首次推出原生支持百万Token上下文长度的模型，并在推理速度上实现了显著提升。

阿里云、通义千问

Qwen2.5-1M的核心优势在于其原生支持百万Token的超长上下文处理能力。这使得模型能够轻松处理书籍、长篇报告、法律文件等超长文档，无需进行复杂的分割处理。同时，该模型还支持更长时间、更深入的对话，能够记住更长的对话历史，实现更连贯、更自然的交互体验。此外，Qwen2.5-1M在处理复杂任务，如代码理解、复杂推理、多轮对话等方面也表现出更强的能力。

除了百万Token上下文长度的突破，Qwen2.5-1M还带来了一项重大创新：闪电般快速的推理框架。通义千问团队完全开源了基于vLLM的推理框架，并集成了稀疏注意力机制。这一创新性的框架使得Qwen2.5-1M在处理百万Token输入时，速度提升了3倍到7倍！这意味着用户可以更高效地使用超长上下文模型，极大地提升了实际应用场景的效率和体验。

阿里云发布Qwen2.5-1M开源模型，支持百万Token长上下文

xAI最新模型Grok-3下周亮相，AI领域新里程碑

DeepSeekR1推理模型震撼发布，颠覆AI成本认知

暂无评论

发表评论取消回复

xAI最新模型Grok-3下周亮相，AI领域新里程碑

DeepSeekR1推理模型震撼发布，颠覆AI成本认知

相关推荐

暂无评论

发表评论 取消回复

搜索

阿里云发布Qwen2.5-1M开源模型，支持百万Token长上下文

发表评论取消回复