2025年2月27日,腾讯推出了新一代的快思考模型——混元Turbo S,这一发布标志着大模型技术在响应速度与性能优化上实现了关键性的突破。与传统的慢思考模型如Deepseek R1和混元T1相比,混元Turbo S实现了“秒回”功能,大幅提高了输出答案的效率,将吐字速度提升了一倍,首字时延减少了44%。这一创新使得模型在知识、数理、创作等多个领域表现出色,为大模型的快速响应能力提供了新的解决方案。

混元Turbo S的设计灵感源自于人类日常决策中90%至95%依赖直觉的快思考模式,并结合理性分析的慢思考模式,为大模型提供了更加智能和高效的解决问题能力。通过长短思维链的融合,该模型不仅在文科问题上保持了快速体验,还显著提升了理科推理能力,整体性能得到了大幅提升。在多个业界通用的公开Benchmark测试中,混元Turbo S的表现与DeepSeek V3、GPT4o、Claude等领先模型相当。

微信截图_20250227173715.png

在架构创新方面,混元Turbo S采用了Hybrid-Mamba-Transformer融合模式,有效降低了传统Transformer结构的计算复杂度和KV-Cache缓存占用,显著降低了训练和推理成本。这一混合架构突破了传统大模型在长文训练和推理成本高的难题,发挥了Mamba架构处理长序列的优势,同时保留了Transformer捕捉复杂上下文的能力,成为工业界首次成功将Mamba架构无损应用于超大型MoE模型的案例。

作为腾讯混元系列的核心基座,混元Turbo S未来将为推理、长文、代码等衍生模型提供基础能力。基于Turbo S,腾讯还推出了具备深度思考能力的推理模型T1,该模型已在腾讯元宝全量上线,并将很快对外提供API接入服务。

目前,开发者和企业用户已可在腾讯云官网通过API调用混元Turbo S,并享受一周内免费试用的优惠。该模型的定价为输入0.8元/百万tokens,输出2元/百万tokens,相比前代混元Turbo模型有显著降价。此外,混元Turbo S也即将在腾讯元宝中逐步灰度上线,用户可在元宝内选择“Hunyuan”模型并关闭深度思考功能进行体验。

腾讯混元Turbo模型API免费试用申请:https://cloud.tencent.com/apply/p/i2zophus2x8