近期,谷歌正式发布了其最新的图像生成模型——Imagen3,该模型已可在Gemini API上供开发者使用。Imagen3在视觉效果上表现卓越,能够生成各种风格的高质量图像,涵盖超现实主义、印象派风景、抽象艺术以及动漫角色等。此外,该模型通过简化文本提示,使用户更轻松地将创意转化为图像,同时提升了图像的清晰度和构图能力。
起初,Imagen3将仅对付费用户开放,预计很快将向免费用户开放。官方透露,用户仅需支付每幅图像0.03美元的费用,即可享受Imagen3的强大功能。同时,用户在生成图像时,可自由调整图像的宽高比和生成选项,以满足个性化需求。
为了打击虚假信息和不当归属,Imagen3生成的所有图像都附有不可见的数字水印SynthID,以便识别图像为人工智能生成。此外,开发者可通过Python代码轻松实现图像生成,官方文档中已提供具体的代码示例。用户只需设置API密钥、输入提示词,即可生成想要的图像,轻松体验新技术带来的便利。
为了帮助用户更好地了解Imagen3的能力,官方展示了一系列生成的图像样本,涵盖了多种风格与主题。随着技术的不断进步,谷歌计划在不久的将来将更多的生成媒体模型整合到Gemini API中,进一步推动生成媒体与语言模型的结合,助力开发者创造更多有趣的应用。
博客:https://developers.googleblog.com/en/imagen-3-arrives-in-the-gemini-api/
划重点:
🌟 Imagen3现已上线Gemini API,提供多种风格的高质量图像生成服务。
💰 每幅图像生成费用为0.03美元,支持用户自定义宽高比和生成选项。
🔒 所有生成图像均带有不可见水印,以防止虚假信息传播。
暂无评论