亚马逊发布Nova多模式AI模型系列，支持文本图像视频生成，优化15种语言

在最近的re:Invent大会上，亚马逊网络服务（AWS）宣布推出全新多模式生成AI模型系列——Nova。该系列包含四种文本生成模型：Micro、Lite、Pro和Premier，同时还包括图像生成模型Nova Canvas和视频生成模型Nova Reel。

AWS首席执行官Andy Jassy透露，Micro、Lite和Pro模型即日起向AWS客户开放，而Premier模型预计将于2025年初发布。Nova系列旨在处理多种输入形式（如文本、图像、视频），其中文本生成模型针对15种语言进行了优化，主要支持英语。

Nova文本生成模型特点

Nova文本生成模型具备不同的功能和性能。Micro模型以极低延迟和快速响应著称，仅支持文本输入输出，适用于快速处理任务。Lite模型能够快速处理文本、图像和视频输入，而Pro模型在准确度、速度和成本之间取得了平衡。Premier模型作为最强大的存在，专为处理复杂工作负载而设计，适用于需要定制模型的高级应用。

这些模型的上下文窗口大小也各不相同。Micro模型支持约100，000个单词，Lite和Pro模型可处理约225，000个单词、15，000行代码或30分钟的音频内容。AWS表示，到2025年初，部分Nova模型的上下文窗口将扩展至200万个标记。

Jassy强调，Nova系列在同类产品中具有最快的速度和最低的成本。它们可在AWS的AI开发平台AWS Bedrock上进行微调，进一步提升速度和效率。此外，Nova系列还能与专有系统和API无缝集成，完成多种自动化任务。

Nova Canvas与Nova Reel介绍

除了文本生成，AWS还推出了两款图像和视频生成工具：Nova Canvas和Nova Reel。Nova Canvas让用户能够通过提示生成和编辑图像，并提供对生成图像的配色方案和布局的控制。Nova Reel则可根据提示或参考图像生成长达6秒的视频，支持用户调整摄像机运动，包括平移、旋转和缩放。

以下是来自 Canvas 的图片:

虽然Reel目前仅支持制作6秒短视频，但AWS表示更长的视频版本将很快推出。同时，AWS为这些工具内置了责任使用控制措施，包括水印和内容审核，以防止生成有害内容。

Jassy还透露，AWS正在开发一款语音到语音模型，预计于2025年第一季度推出，该模型将支持语音输入并生成自然的人类语音。此外，AWS还在研发一个“任意到任意”模型，预计于2025年中期发布，实现跨文本、语音、图像和视频的多模态转换。

AWS对训练数据的保密性保持谨慎态度，并表示将在版权问题上提供赔偿政策，以保障客户合法权益。

项目入口:https://aws.amazon.com/cn/ai/generative-ai/nova/

官方博客:https://aws.amazon.com/cn/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/

亚马逊发布Nova多模式AI模型系列，支持文本图像视频生成，优化15种语言

亚马逊发布NovaAI模型系列，推动人工智能技术发展

斯坦福报告：美中英领跑全球AI发展潜力，创新经济政策成关键

暂无评论

发表评论取消回复

亚马逊发布NovaAI模型系列，推动人工智能技术发展

斯坦福报告：美中英领跑全球AI发展潜力，创新经济政策成关键

相关推荐

暂无评论

发表评论 取消回复

搜索

亚马逊发布Nova多模式AI模型系列，支持文本图像视频生成，优化15种语言

发表评论取消回复