全球开发者再次将目光投向中国!在备受关注的全球开发者大会(GDC)上,阿里云魔搭社区重磅推出,首次上线阶跃星辰最新开源的两款多模态模型,分别是:全球参数量最大的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互模型Step-Audio。这一消息迅速在AI开源社区引发热议,再次彰显了中国在人工智能领域的强大创新能力。

作为中国最大的AI模型社区,阿里云魔搭社区此次推出的这两款重量级模型,无疑是近期全球多模态领域最受关注的开源成果。Step-Video-T2V凭借其庞大的参数规模,刷新了开源视频生成模型的记录,预示着高质量、精细化视频内容创作时代的到来。而Step-Audio则突破了传统语音模型的限制,成为业界首个产品级开源语音交互系统,预示着更自然、更智能的语音交互技术将加速普及应用。

音频 声波 智能语音

图源备注:图片由AI生成,图片授权服务商Midjourney

据官方介绍,截至目前,阿里云魔搭社区已汇聚超过4万个开源模型,全面覆盖了包括大语言模型(LLM)、对话系统、语音技术、文生图、图生视频等多个前沿领域,稳居中国最大AI模型社区之列。此次选择在魔搭社区开源这两款重量级模型,既是对魔搭社区平台实力的认可,也体现了阶跃星辰对开源生态建设的积极贡献。

在GDC这一全球开发者关注的舞台上发布如此重要的开源成果,无疑向世界展示了中国AI技术的蓬勃发展态势和开放合作的态度。这两款模型的开源,将极大地降低AI技术的使用门槛,加速全球人工智能技术的普及和发展。