阿里云魔搭首发两款多模态模型，刷新AI开源领域纪录

全球开发者再次将目光投向中国！在备受关注的全球开发者大会（GDC）上，阿里云魔搭社区重磅推出，首次上线阶跃星辰最新开源的两款多模态模型，分别是：全球参数量最大的开源视频生成模型Step-Video-T2V，以及业界首款产品级开源语音交互模型Step-Audio。这一消息迅速在AI开源社区引发热议，再次彰显了中国在人工智能领域的强大创新能力。

作为中国最大的AI模型社区，阿里云魔搭社区此次推出的这两款重量级模型，无疑是近期全球多模态领域最受关注的开源成果。Step-Video-T2V凭借其庞大的参数规模，刷新了开源视频生成模型的记录，预示着高质量、精细化视频内容创作时代的到来。而Step-Audio则突破了传统语音模型的限制，成为业界首个产品级开源语音交互系统，预示着更自然、更智能的语音交互技术将加速普及应用。

音频声波智能语音

图源备注：图片由AI生成，图片授权服务商Midjourney

据官方介绍，截至目前，阿里云魔搭社区已汇聚超过4万个开源模型，全面覆盖了包括大语言模型（LLM）、对话系统、语音技术、文生图、图生视频等多个前沿领域，稳居中国最大AI模型社区之列。此次选择在魔搭社区开源这两款重量级模型，既是对魔搭社区平台实力的认可，也体现了阶跃星辰对开源生态建设的积极贡献。

在GDC这一全球开发者关注的舞台上发布如此重要的开源成果，无疑向世界展示了中国AI技术的蓬勃发展态势和开放合作的态度。这两款模型的开源，将极大地降低AI技术的使用门槛，加速全球人工智能技术的普及和发展。

阿里云魔搭首发两款多模态模型，刷新AI开源领域纪录

微软GPT-4.5与GPT-5即将发布，AI技术引领行业变革

2025年“清朗”行动重点整治八领域

暂无评论

发表评论取消回复

微软GPT-4.5与GPT-5即将发布，AI技术引领行业变革

2025年“清朗”行动重点整治八领域

相关推荐

暂无评论

发表评论 取消回复

搜索

阿里云魔搭首发两款多模态模型，刷新AI开源领域纪录

发表评论取消回复