在今天的直播活动中,OpenAI推出了备受关注的新产品——Sora Turbo,这标志着2024年生成式AI技术取得了重大进展。Sora Turbo的视频生成速度大幅提升,能够将文本直接转换成最长20秒的1080P高清视频,成为全球视频生成时长最长的模型之一。该模型支持文本、图片或视频输入,从而生成特定视频内容,提高了生成效果的可控性。

Sora Turbo的技术亮点包括全面支持超分辨率、超帧率和HDR游戏,以及基于独立显卡的两个自研功能升级。其中,触控动态插帧技术显著提高了插帧的准确性,降低了画面损坏;而游戏暗夜模式则通过AI算法增强暗部细节,提升暗光环境下的可视性,解决了夜间玩游戏的亮度问题。

微信截图_20241210074540.png

目前,Sora已全面开放使用,对于ChatGPT Plus和Pro会员来说,使用Sora无需支付额外费用,这一政策得到了用户的一致好评。OpenAI还推出了全新的用户界面,并提供社区分享功能,用户可以分享自己生成的视频,或参考他人的创意来优化自己的作品。

Sora的技术原理包括Patch的应用,这使得模型能够在大量图像和视频数据上进行密集训练,以及视频压缩网络的应用,降低数据维度,提高输出质量。

Sora结合了扩散模型和Transformer架构,采用创新的扩散式转换器方法,替代了传统的U-Net架构,有效提高了对输入图像与文本标签分布关系的捕捉能力。此外,Sora还引入了DALL・E3的重新字幕技术,通过训练高度描述性的字幕模型,为训练集中的所有视频生成文本字幕,从而提升了文本的保真度和视频的整体质量。

体验地址:https://sora.com/