近期,OpenAI公布了一项重磅新闻:其内部项目Sora不仅已经推出了视频生成功能,还在积极研发图像生成功能。这一创新功能将使用户能够在视频和图像生成之间轻松切换,极大提升创作的灵活性。
据悉,Sora将新增一个隐藏的切换按钮,用户只需在提示栏中选择即可在两种模式间切换。在图像生成模式下,系统会自动提示用户描述一幅图像。这一设计旨在简化用户操作,提高生成内容的相关性与质量。
Sora在图像生成功能改进的同时,也对视频推送进行了重新分类。新增的“Best”和“Top”类别将帮助用户更高效地筛选和查找内容。“Best”类别与现有特色频道相似,而“Top”类别则可能根据用户点赞数或时间段对视频进行排名。这一分类的调整让人们对Sora的内容推荐机制充满期待。
对于DALL-E3的用户来说,这一消息无疑令人振奋,因为DALL-E3自发布以来已略显过时,尤其是在与Midjourney等竞争对手对比时。尽管Sora的图像生成功能尚未正式推出,但左侧导航栏中的“Images Internal”类别已引发用户好奇。目前这个类别主要用于视频推送,但未来或许也会提供图片生成相关内容。
有消息称,这次的图像生成模型可能被命名为DALL-E4,但OpenAI尚未确认。业内专家推测,Sora中的图像生成器可能不会直接使用DALL-E4,而是基于现有的“sora-turbo”模型。此外,业内人士指出,ChatGPT尚未推出基于GPT-4o的多模态图像生成功能,因此Sora项目的推出将是一个值得关注的新进展。
值得注意的是,Sora中的文本到图像生成器的代号为“papaya”,令人对这个项目充满好奇与期待。在DALL-E3发布一年半之后,下一代模型将带来怎样的创新,令人充满期待。
暂无评论