OpenAI发布视频生成模型Sora,20秒高清视频引关注,国内AI产品表现不俗

备受瞩目的科技巨头OpenAI终于公布了其视频生成模型Sora。这一重大发布于北京时间12月10日凌晨的直播活动中揭晓,意味着Sora正式向全球用户开放。自2月份首次预告以来,Sora一直处于内测阶段,仅对部分艺术家、知名演员和导演开放。长时间的等待吊足了公众的胃口,发布后,全球网友的热情高涨,甚至导致服务器短暂过载。

Sora Turbo在功能和性能上均有显著提升,支持最高1080p分辨率、最长20秒的视频生成,实现了时长上的突破。更值得一提的是,Sora Turbo强大的“编辑”功能,用户不仅可以利用文字、图片或视频生成内容,还能通过指令进行视频的重混、重新剪辑、循环、混合等操作,几乎相当于一款高级视频编辑器。

Sora的正式发布引起了国内AI视频生成领域的关注。为了对比国内外产品的差异,“深度观察”团队进行了快速实测。结果显示,国内产品在某些方面并不输于Sora。

在视频生成时长方面,Sora以20秒的优势领先,紧随其后的是Runway,可达10秒。国内产品普遍在5-6秒左右,但这并不意味着性能落后。例如,白日梦虽然单次生成时长不长,但通过分步骤生成,最终能支持长达6分钟的视频。

在收费标准上,Sora对ChatGPT的Plus会员(每月20美元)和Pro会员(每月200美元)开放,Plus会员每月可生成50个480P分辨率的视频,Pro会员则享有不限次慢速生成的权益。国内产品大多提供免费试用,但限制使用次数。Runway的收费介于Sora和国内产品之间,最低月付费为15美元。

在功能对比测试中,“深度观察”团队从基础功能和进阶功能两个维度进行了评估。基础功能主要考察视频生成能力,包括对文字指令的理解、人物面部清晰度和多人物准确性。Sora在识别主体数量上存在问题,但整体表现尚可。国内产品中,即梦在人物真实感上有显著提升,智谱清言和FilmAction在画风和指令理解上各有特色。

进阶功能测试中,Sora的新功能表现不一。在Remix(重混)功能测试中,将兔子替换成小狗时出现了一些问题,实际操作并不如样片顺畅。业内人士指出,这可能与提示词、场景和风格选择有关。

尽管Sora的发布引起了广泛关注,但国内从业者对其评价相对冷静。生数科技投融资负责人樊家睿表示,Sora在模型真实感上较2月份的demo并无显著提升。多位网友实测反馈,Sora在处理复杂动作时仍存在困难,模拟物理世界时可能出错。

然而,Sora的一些新功能获得了业界认可。瀚皓科技CEO吴杰茜指出,Storyboard(故事板)和Style presets(风格预设)功能在FilmAction中已有实现,Blend(混合)功能在国外AI生成视频工具Luma中首次亮相。虽然国内产品也有类似功能,但Sora的实现方式更为高明。

AI行业资深研究者江树认为,Sora的部分功能属于独家,国内产品基本不具备。他特别提到Sora在处理细节连贯性上的优势,如直播演示中机器人在沙漠中漫步的画面,从远景到特写转换自然。Sora的空间感也很强,摄像机360度旋转时,每个角度的细节都十分准确。

在产品体验方面,Sora也收获了好评。江树表示,Sora此次发布的是一个从视频生成到制作成品的端到端完整产品,提供了提升视频创作体验的功能。樊家睿认为,Sora新功能的实现路径明确,对国内从业者来说,主要是时间问题。

相关推荐

暂无评论

发表评论