Amazon 最新的尖端基础模型实现了前沿智能和行业领先的性价比。
(adsbygoogle=window.adsbygoogle||[]).push({});
我们为推理和训练专门研发的 Inferentia 和 Trainium 芯片,提供业界领先的基础模型(Foundation Models),以及 AI 驱动的解决方案,包括 Amazon Bedrock、由 Rufus 和 Alexa 所支持的体验,我们始终致力于提供具有实际价值的生成式 AI(Gen AI)解决方案,以真实意义改善消费者的生活。我们的目标是通过 AI 简化购物者、卖家、广告商和企业的体验。
作为我们 AI 之旅的下一步,Amazon 新推出的基础模型 Amazon Nova,具备处理文本、图像和视频作为输入的能力,用户可利用其驱动的生成式 AI 应用来解读视频、图表和文档,或生成视频及其他多媒体内容。
“在 Amazon 内部,我们有近 1,000 个生成式 AI 应用在使用,我们对开发者面临的挑战有深入的理解,”Amazon 人工通用智能部门高级副总裁 Rohit Prasad 表示。“新推出的 Amazon Nova 模型旨在帮助内部与外部的开发者应对这些挑战,提供引人注目的智能和内容生成,并在延迟、成本效益、定制化及信息溯源等方面取得显著进展。”
Amazon Nova 模型现已在 Amazon Bedrock 中上线,包括:
- Amazon Nova Micro,专注于文本的低成本模型,能以极低的开支提供最快的响应。
- Amazon Nova Lite,一个低成本的多模态模型,能够快速处理图像、视频和文本输入。
- Amazon Nova Pro,高性能的多模态模型,在准确度、速度和成本之间实现最佳平衡,适应多种任务。
- Amazon Nova Premier,这是 Amazon 最强大的多模态模型,适合复杂推理任务,可以作为蒸馏自定义模型的最佳教师(预计于 2025 年第一季度推出)。
- Amazon Nova Canvas,一款顶尖的图像生成模型。
- Amazon Nova Reel,一款顶尖的视频生成模型。
Amazon Nova Reel 通过输入单张图片和提示“dolly forward”将其转化为简短视频。
Amazon Nova 模型为客户带来的好处
所有 Amazon Nova 模型均具有卓越的能力、快速响应和高性价比,设计时便便于与客户的系统和数据集成。它们能支持多模态和超过 200 种语言的多种任务。Amazon Nova Micro、Amazon Nova Lite 和 Amazon Nova Pro 的成本至少比 Amazon Bedrock 中的同类最佳性能模型低 75%。在其各自的智能类别中,这些模型也是 Amazon Bedrock 中速度最快的模型。
这些模型与 Amazon Bedrock 集成。Amazon Bedrock 是一个完全托管的服务,通过 API 提供来自领先 AI 公司和 Amazon 的高性能基础模型。借助 Amazon Bedrock,客户可以轻松试验和评估 Amazon Nova 模型及其他基础模型,以找到最适合其应用的方案。
这些模型支持定制微调,客户可以利用自身标记的专有数据示例来提高准确性。Amazon Nova 模型从客户的数据中学习,培养出私有的微调模型,以提供定制化的响应。
除了支持微调,这些模型还应用蒸馏技术,将更强大的“大型教师模型”的特定知识转移至更小且高效的模型中,从而在保持高准确性的同时实现更快速和经济的运行。
Amazon Nova 模型同时与 Amazon Bedrock 的知识库集成,擅长检索增强生成(RAG),使客户能通过整理自身的数据为生成的响应提供信息溯源,确保最佳准确性。
Amazon Nova 模型经过优化,以便于使用,并在需要通过多种 API 交互的多步骤任务中表现出色。
创意内容生成
凭借高质量的输出、直观的 API 平台及先进的自定义功能,Amazon Nova 创意生成模型(Amazon Nova Canvas 和 Amazon Nova Reel)正在帮助 Amazon Ads 消除卖家和广告商的障碍,激发前所未有的创造力与创新。例如,首次利用视频广告,为产品目录中的更多产品创造展示和视频活动,并尝试诸如关键词级创意等新策略。平均而言,使用这些工具的品牌能够推广五倍于以往数量的产品,同时在每种推广产品中应用双倍数量的图片,并将预算转向效果最佳的策略。
在这个示例中,Amazon Ads 通过 Amazon Nova Reel 为虚构的盒装意大利面品牌制作了一则视频广告。在富有想象力的“意大利面城市”中,高耸的通心粉管雕刻成建筑物,社区点缀着意大利香料的景观,街道上铺满了美味的番茄酱、螺旋意大利面和嫩滑的肉丸。该广告展示了广告商如何通过 Amazon Nova 模型为其产品赋予生命,创造出高质量的内容。
视频理解
为了测试 Amazon Nova Pro 的视频理解能力,我们要求模型审阅并描述一段无声的足球比赛视频剪辑。模型的结果包含对比赛场景、球队制服、球员动作及比赛结果的详细描述。
视频提示:“描述视频。”
输出:“视频展示了一场正在绿茵场进行的足球比赛。两支球队分别穿着黄色和白色队服。黄色队的四分卫将球传给一名接球手,接球手接住球后开始向前跑动。白色队的防守队员试图追赶并拦截他。比赛最终以接球手被擒抱倒地结束。”
展望未来
我们预计将在 2025 年发布两款新型 Amazon Nova 模型,其中包括语音到语音模型和本地多模态到多模态(即“任意到任意”模态)模型。我们的语音到语音模型将能够理解以自然语言流式输入的语音,解析语言及非语言线索(如语调和语速),并提供自然人类式的互动。而我们的任意到任意模型将能处理文本、图像、音频和视频作为输入和输出。这将简化应用程序开发,使同一模型能够完成多种任务,例如将内容从一种模态翻译为另一种、编辑内容,以及支持能够理解所有模态的 AI 代理。
负责任的 AI
Amazon Nova 模型内置安全措施和保护机制。公司已为 Amazon Nova 模型推出 AWS AI 服务卡,向用户提供关于使用案例、局限性和负责任 AI 实践的透明信息。
这只是 Amazon Nova 的开端,我们期待能继续创新,为每位 Amazon 客户创造实际价值。 了解更多 并开始体验 Amazon Nova。
暂无评论