OpenAI发布视频生成模型Sora，20秒高清视频引关注，国内AI产品表现不俗

备受瞩目的科技巨头OpenAI终于公布了其视频生成模型Sora。这一重大发布于北京时间12月10日凌晨的直播活动中揭晓，意味着Sora正式向全球用户开放。自2月份首次预告以来，Sora一直处于内测阶段，仅对部分艺术家、知名演员和导演开放。长时间的等待吊足了公众的胃口，发布后，全球网友的热情高涨，甚至导致服务器短暂过载。

Sora Turbo在功能和性能上均有显著提升，支持最高1080p分辨率、最长20秒的视频生成，实现了时长上的突破。更值得一提的是，Sora Turbo强大的“编辑”功能，用户不仅可以利用文字、图片或视频生成内容，还能通过指令进行视频的重混、重新剪辑、循环、混合等操作，几乎相当于一款高级视频编辑器。

Sora的正式发布引起了国内AI视频生成领域的关注。为了对比国内外产品的差异，“深度观察”团队进行了快速实测。结果显示，国内产品在某些方面并不输于Sora。

在视频生成时长方面，Sora以20秒的优势领先，紧随其后的是Runway，可达10秒。国内产品普遍在5-6秒左右，但这并不意味着性能落后。例如，白日梦虽然单次生成时长不长，但通过分步骤生成，最终能支持长达6分钟的视频。

在收费标准上，Sora对ChatGPT的Plus会员（每月20美元）和Pro会员（每月200美元）开放，Plus会员每月可生成50个480P分辨率的视频，Pro会员则享有不限次慢速生成的权益。国内产品大多提供免费试用，但限制使用次数。Runway的收费介于Sora和国内产品之间，最低月付费为15美元。

在功能对比测试中，“深度观察”团队从基础功能和进阶功能两个维度进行了评估。基础功能主要考察视频生成能力，包括对文字指令的理解、人物面部清晰度和多人物准确性。Sora在识别主体数量上存在问题，但整体表现尚可。国内产品中，即梦在人物真实感上有显著提升，智谱清言和FilmAction在画风和指令理解上各有特色。

进阶功能测试中，Sora的新功能表现不一。在Remix（重混）功能测试中，将兔子替换成小狗时出现了一些问题，实际操作并不如样片顺畅。业内人士指出，这可能与提示词、场景和风格选择有关。

尽管Sora的发布引起了广泛关注，但国内从业者对其评价相对冷静。生数科技投融资负责人樊家睿表示，Sora在模型真实感上较2月份的demo并无显著提升。多位网友实测反馈，Sora在处理复杂动作时仍存在困难，模拟物理世界时可能出错。

然而，Sora的一些新功能获得了业界认可。瀚皓科技CEO吴杰茜指出，Storyboard（故事板）和Style presets（风格预设）功能在FilmAction中已有实现，Blend（混合）功能在国外AI生成视频工具Luma中首次亮相。虽然国内产品也有类似功能，但Sora的实现方式更为高明。

AI行业资深研究者江树认为，Sora的部分功能属于独家，国内产品基本不具备。他特别提到Sora在处理细节连贯性上的优势，如直播演示中机器人在沙漠中漫步的画面，从远景到特写转换自然。Sora的空间感也很强，摄像机360度旋转时，每个角度的细节都十分准确。

在产品体验方面，Sora也收获了好评。江树表示，Sora此次发布的是一个从视频生成到制作成品的端到端完整产品，提供了提升视频创作体验的功能。樊家睿认为，Sora新功能的实现路径明确，对国内从业者来说，主要是时间问题。