国内领先的大模型技术公司DeepSeek推出了全新的Janus-Pro多模态大模型,正式踏入文生图领域,此举标志着DeepSeek在多模态AI技术领域实现了重大突破。
在GenEval和DPG-Bench基准测试中,Janus-Pro-7B的表现超过了OpenAI的DALL-E3,甚至超越了Stable Diffusion、Emu3-Gen等知名模型。Janus-Pro遵循MIT开源协议,这允许它在商业场景中无限制使用。DeepSeek透露,Janus-Pro是2024年11月13日发布的JanusFlow大模型的高级版本。
相较于上一代模型,Janus-Pro在训练策略上进行了优化,扩展了训练数据,并且规模更大。这些改进使得Janus-Pro在多模态理解和文本到图像的指令跟踪方面取得了显著进步,同时提升了文本到图像生成的稳定性。
尽管Janus-Pro目前仅支持384x384分辨率的图像处理,但考虑到其紧凑的模型架构,这样的表现已经相当惊艳。
作为多模态模型,Janus-Pro不仅能够生成图像,还能对图片进行描述,识别地标,识别图像中的文字,并对图片中的知识进行讲解。
重点:
🌟 DeepSeek发布Janus-Pro多模态大模型,进入文生图领域。
📈 在基准测试中,Janus-Pro-7B的表现优于OpenAI的DALL-E3等热门模型。
✅ Janus-Pro采用MIT开源协议,可在商业场景中无限制使用。
暂无评论