Meta推出Leffa开源AI虚拟试穿框架,提升在线购物体验减少退换货困扰
Meta推出开源AI虚拟试穿框架Leffa,通过生成新图像提升穿衣体验,减少图像失真,保留细节。用户可在线试用,项目代码公开,推动虚拟试穿技术进步。未来购物体验更个性化和便利。
字节跳动Infinity框架革新图像生成:高分辨率速度提升显著
字节跳动推出“Infinity”框架,通过比特级标记和无限词汇分类器,大幅提升文本到高分辨率图像合成效率和质量,实现0.8秒内生成1024×1024图像,真实细节丰富,精准响应复杂文本。
AI技术新突破:AWPortraitCN模型专注生成中国人肖像,细腻真实皮肤质感
AWPortraitCN模型专注于生成符合中国人特征和审美的肖像图像,操作简便,图像质量细腻真实,适用于多种场景,推动人工智能技术民主化,现已开放体验。
亚马逊发布Nova多模式AI模型系列,支持文本图像视频生成,优化15种语言
亚马逊网络服务推出新型多模式生成AI模型系列Nova,包括文本、图像和视频生成模型,支持15种语言,强调速度、成本效益及与AWS平台的无缝集成。
MistralAI助手LeChat升级:集成网络搜索图像生成PixtralLarge模型
Mistral AI升级Le Chat助手,新增网络搜索、图像生成功能,推出Pixtral Large模型,性能超越竞品,助力用户高效创作和处理复杂图像。
阿里开源Qwen2vl-Flux图像生成模型:支持图像融合与风格转移功能
阿里巴巴近日开源了图像生成模型Qwen2vl-Flux,该模型具备强大的图像生成与编辑功能。用户可以通过输入图像或文本,实现图像的变换、融合与混合。模型能够生成多幅相似图像,支持文本引导图像混合,巧妙地结合输入图像与文本内容。此外,Qwen2vl-Flux还允许将不同图像进行合体,并提供网格风格迁移功能,使用户能精细修改特定部分,创造丰富的视觉效果。项目已上线,可通过Hugging Face访问。
“Stability AI SD3.5L发布:三大ControlNet功能提升生图能力”
Stability AI 发布了新版 Stable Diffusion 3.5 Large,新增了三种 ControlNet 功能:Blur、Canny 和 Depth,增强了图像生成能力。用户可在不商业化的情况下免费使用该模型,年收入低于100万美元的小型企业和创作者也可用于商业用途,且可保留生成作品的所有权。这一更新降低了使用门槛,吸引了大量创作者。公司同时强调安全性,采取措施防止模型滥用,并计划推出更多 ControlNet 功能,为技术进步注入新活力。