近期,香港大学携手字节跳动共同研发的流动视频生成模型Goku正式亮相。该模型依托尖端生成算法,能根据文本提示生成高品质的视频内容,显著拓宽了数字艺术的展现形式。
为彰显Goku模型的强大性能,研究团队精心制作了一系列视频实例,这些实例不仅突显了模型的技术实力,也展示了其在创意表达上的无限潜能。
Goku模型的优势在于其快速生成和高质量图像。经过大量数据训练,Goku能够生成动画、自然风光、动物行为等多种场景。研究人员采用MovieGenBench提示进行测试,确保了演示效果的一致性和公正性。
例如,一段视频呈现了一位时尚女性在东京街头自信漫步的场景,街道上五光十色的霓虹灯映衬出温馨的夜色,行人络绎不绝,画面生动逼真。
另一段视频则描绘了数只巨型猛犸象在雪地上悠闲漫步的景象,周围雪山和树林的映衬,让人仿佛置身于冰雪世界。这些栩栩如生的场景不仅吸引了观众的目光,也为艺术创作者提供了丰富的灵感。
令人惊叹的是,Goku还支持直接生成虚拟数字人视频。Goku+将文本转换为超现实的人类视频,在生成超过20秒的视频时,以其稳定的手部动作和极具表现力的面部及身体动作为特点,明显优于现有方法。
此外,Goku还支持从产品图片生成和人物互动视频,保持产品样式并生成产品展示视频,还能从文本生成广告视频等功能。
如下所示:Goku+将产品图片转化为引人入胜的视频片段,确保端到端的优化,从而增强营销材料的吸引力和有效性。
如下所示:制作逼真且极具吸引力的视频,专门展示特定产品。这些视频有效地捕捉了产品的精髓,提升了观众的参与度和兴趣。
此外,模型支持文本创建定制的高清视频,以优化广告场景,在视频基础模型方面明显优于竞争对手。
项目入口:https://saiyan-world.github.io/goku/
划重点:
🌟 香港大学与字节跳动合作开发的Goku模型,可依据文本提示生成高质量视频内容。
🎨 模型可呈现各种场景,如东京街头时尚女性漫步和雪地猛犸象等,生动逼真。
💡 Goku模型的推出为视觉艺术创作提供了新工具,助力创作者探索更多可能性。
暂无评论