在最近的re:Invent大会上,亚马逊网络服务(AWS)宣布推出全新多模式生成AI模型系列——Nova。该系列包含四种文本生成模型:Micro、Lite、Pro和Premier,同时还包括图像生成模型Nova Canvas和视频生成模型Nova Reel。
AWS首席执行官Andy Jassy透露,Micro、Lite和Pro模型即日起向AWS客户开放,而Premier模型预计将于2025年初发布。Nova系列旨在处理多种输入形式(如文本、图像、视频),其中文本生成模型针对15种语言进行了优化,主要支持英语。
Nova文本生成模型特点
Nova文本生成模型具备不同的功能和性能。Micro模型以极低延迟和快速响应著称,仅支持文本输入输出,适用于快速处理任务。Lite模型能够快速处理文本、图像和视频输入,而Pro模型在准确度、速度和成本之间取得了平衡。Premier模型作为最强大的存在,专为处理复杂工作负载而设计,适用于需要定制模型的高级应用。
这些模型的上下文窗口大小也各不相同。Micro模型支持约100,000个单词,Lite和Pro模型可处理约225,000个单词、15,000行代码或30分钟的音频内容。AWS表示,到2025年初,部分Nova模型的上下文窗口将扩展至200万个标记。
Jassy强调,Nova系列在同类产品中具有最快的速度和最低的成本。它们可在AWS的AI开发平台AWS Bedrock上进行微调,进一步提升速度和效率。此外,Nova系列还能与专有系统和API无缝集成,完成多种自动化任务。
Nova Canvas与Nova Reel介绍
除了文本生成,AWS还推出了两款图像和视频生成工具:Nova Canvas和Nova Reel。Nova Canvas让用户能够通过提示生成和编辑图像,并提供对生成图像的配色方案和布局的控制。Nova Reel则可根据提示或参考图像生成长达6秒的视频,支持用户调整摄像机运动,包括平移、旋转和缩放。
以下是来自 Canvas 的图片:
虽然Reel目前仅支持制作6秒短视频,但AWS表示更长的视频版本将很快推出。同时,AWS为这些工具内置了责任使用控制措施,包括水印和内容审核,以防止生成有害内容。
Jassy还透露,AWS正在开发一款语音到语音模型,预计于2025年第一季度推出,该模型将支持语音输入并生成自然的人类语音。此外,AWS还在研发一个“任意到任意”模型,预计于2025年中期发布,实现跨文本、语音、图像和视频的多模态转换。
AWS对训练数据的保密性保持谨慎态度,并表示将在版权问题上提供赔偿政策,以保障客户合法权益。
项目入口:https://aws.amazon.com/cn/ai/generative-ai/nova/
官方博客:https://aws.amazon.com/cn/blogs/aws/introducing-amazon-nova-frontier-intelligence-and-industry-leading-price-performance/
暂无评论