香港大学发布Goku视频生成模型：创意无限，场景真实

近期，香港大学携手字节跳动共同研发的流动视频生成模型Goku正式亮相。该模型依托尖端生成算法，能根据文本提示生成高品质的视频内容，显著拓宽了数字艺术的展现形式。

为彰显Goku模型的强大性能，研究团队精心制作了一系列视频实例，这些实例不仅突显了模型的技术实力，也展示了其在创意表达上的无限潜能。

Goku模型的优势在于其快速生成和高质量图像。经过大量数据训练，Goku能够生成动画、自然风光、动物行为等多种场景。研究人员采用MovieGenBench提示进行测试，确保了演示效果的一致性和公正性。

例如，一段视频呈现了一位时尚女性在东京街头自信漫步的场景，街道上五光十色的霓虹灯映衬出温馨的夜色，行人络绎不绝，画面生动逼真。

另一段视频则描绘了数只巨型猛犸象在雪地上悠闲漫步的景象，周围雪山和树林的映衬，让人仿佛置身于冰雪世界。这些栩栩如生的场景不仅吸引了观众的目光，也为艺术创作者提供了丰富的灵感。

令人惊叹的是，Goku还支持直接生成虚拟数字人视频。Goku+将文本转换为超现实的人类视频，在生成超过20秒的视频时，以其稳定的手部动作和极具表现力的面部及身体动作为特点，明显优于现有方法。

此外，Goku还支持从产品图片生成和人物互动视频，保持产品样式并生成产品展示视频，还能从文本生成广告视频等功能。

如下所示：Goku+将产品图片转化为引人入胜的视频片段，确保端到端的优化，从而增强营销材料的吸引力和有效性。

如下所示：制作逼真且极具吸引力的视频，专门展示特定产品。这些视频有效地捕捉了产品的精髓，提升了观众的参与度和兴趣。

此外，模型支持文本创建定制的高清视频，以优化广告场景，在视频基础模型方面明显优于竞争对手。

项目入口：https://saiyan-world.github.io/goku/

划重点:

🌟 香港大学与字节跳动合作开发的Goku模型，可依据文本提示生成高质量视频内容。

🎨 模型可呈现各种场景，如东京街头时尚女性漫步和雪地猛犸象等，生动逼真。

💡 Goku模型的推出为视觉艺术创作提供了新工具，助力创作者探索更多可能性。