近日,阿里巴巴宣布开源其最新研发的图像生成模型 Qwen2vl-Flux。该模型不仅具备编辑、融合和混合等多种功能,还能够在用户提供图像或文本的情况下,生成高度相似的全新图像。
Qwen2vl-Flux 提供了强大的图像变化功能。用户只需上传一张图像,无需任何文本提示,模型便能基于原图生成多幅相似的图像。例如,用户上传一张人物照片,模型可以生成多个不同角度的人物表现,展现出多样的视角与情感。
此外,模型还支持文本引导的图像混合。当用户输入一张图片并附加相关的文本提示时,Qwen2vl-Flux能够将输入图像与文本内容巧妙融合,创造出新的图像效果。
除了上述功能,Qwen2vl-Flux 还具备图像引导的图像混合能力。用户可以将两张不同的图像进行结合,实现角色合体或场景转换。比如,将一个角色与另一背景相结合,模型能够无缝地融合二者,形成新的视觉效果。
模型的网格风格迁移功能使用户能够对图像进行细致控制。用户可以对特定部分进行修改,进行精细化创作。例如,在一幅展示高科技与自然环境结合的图像中,用户可以添加生物发光的细节或森林晨雾的效果,呈现出更加丰富的视觉体验。
项目入口: https://huggingface.co/Djrango/Qwen2vl-Flux
划重点:
🌟 Qwen2vl-Flux 开源,具备强大的图像生成与编辑能力。
🖼️ 支持图像变化和文本引导的图像混合,创造全新视觉效果。
🔍 提供图像引导的混合和网格风格迁移,允许用户进行细致控制。
暂无评论