AmazonNova发布：革命性基础模型提升AI生成与理解能力

Amazon 最新的尖端基础模型实现了前沿智能和行业领先的性价比。

(adsbygoogle=window.adsbygoogle||[]).push({});

我们为推理和训练专门研发的 Inferentia 和 Trainium 芯片，提供业界领先的基础模型（Foundation Models），以及 AI 驱动的解决方案，包括 Amazon Bedrock、由 Rufus 和 Alexa 所支持的体验，我们始终致力于提供具有实际价值的生成式 AI（Gen AI）解决方案，以真实意义改善消费者的生活。我们的目标是通过 AI 简化购物者、卖家、广告商和企业的体验。

作为我们 AI 之旅的下一步，Amazon 新推出的基础模型 Amazon Nova，具备处理文本、图像和视频作为输入的能力，用户可利用其驱动的生成式 AI 应用来解读视频、图表和文档，或生成视频及其他多媒体内容。

“在 Amazon 内部，我们有近 1,000 个生成式 AI 应用在使用，我们对开发者面临的挑战有深入的理解，”Amazon 人工通用智能部门高级副总裁 Rohit Prasad 表示。“新推出的 Amazon Nova 模型旨在帮助内部与外部的开发者应对这些挑战，提供引人注目的智能和内容生成，并在延迟、成本效益、定制化及信息溯源等方面取得显著进展。”

Amazon Nova 模型现已在 Amazon Bedrock 中上线，包括：

Amazon Nova Micro，专注于文本的低成本模型，能以极低的开支提供最快的响应。
Amazon Nova Lite，一个低成本的多模态模型，能够快速处理图像、视频和文本输入。
Amazon Nova Pro，高性能的多模态模型，在准确度、速度和成本之间实现最佳平衡，适应多种任务。
Amazon Nova Premier，这是 Amazon 最强大的多模态模型，适合复杂推理任务，可以作为蒸馏自定义模型的最佳教师（预计于 2025 年第一季度推出）。
Amazon Nova Canvas，一款顶尖的图像生成模型。
Amazon Nova Reel，一款顶尖的视频生成模型。

AmazonNova发布：革命性基础模型提升AI生成与理解能力

Amazon Nova Reel 通过输入单张图片和提示“dolly forward”将其转化为简短视频。

Amazon Nova 模型为客户带来的好处

所有 Amazon Nova 模型均具有卓越的能力、快速响应和高性价比，设计时便便于与客户的系统和数据集成。它们能支持多模态和超过 200 种语言的多种任务。Amazon Nova Micro、Amazon Nova Lite 和 Amazon Nova Pro 的成本至少比 Amazon Bedrock 中的同类最佳性能模型低 75%。在其各自的智能类别中，这些模型也是 Amazon Bedrock 中速度最快的模型。

这些模型与 Amazon Bedrock 集成。Amazon Bedrock 是一个完全托管的服务，通过 API 提供来自领先 AI 公司和 Amazon 的高性能基础模型。借助 Amazon Bedrock，客户可以轻松试验和评估 Amazon Nova 模型及其他基础模型，以找到最适合其应用的方案。

这些模型支持定制微调，客户可以利用自身标记的专有数据示例来提高准确性。Amazon Nova 模型从客户的数据中学习，培养出私有的微调模型，以提供定制化的响应。

除了支持微调，这些模型还应用蒸馏技术，将更强大的“大型教师模型”的特定知识转移至更小且高效的模型中，从而在保持高准确性的同时实现更快速和经济的运行。

Amazon Nova 模型同时与 Amazon Bedrock 的知识库集成，擅长检索增强生成（RAG），使客户能通过整理自身的数据为生成的响应提供信息溯源，确保最佳准确性。

Amazon Nova 模型经过优化，以便于使用，并在需要通过多种 API 交互的多步骤任务中表现出色。

创意内容生成

凭借高质量的输出、直观的 API 平台及先进的自定义功能，Amazon Nova 创意生成模型（Amazon Nova Canvas 和 Amazon Nova Reel）正在帮助 Amazon Ads 消除卖家和广告商的障碍，激发前所未有的创造力与创新。例如，首次利用视频广告，为产品目录中的更多产品创造展示和视频活动，并尝试诸如关键词级创意等新策略。平均而言，使用这些工具的品牌能够推广五倍于以往数量的产品，同时在每种推广产品中应用双倍数量的图片，并将预算转向效果最佳的策略。

在这个示例中，Amazon Ads 通过 Amazon Nova Reel 为虚构的盒装意大利面品牌制作了一则视频广告。在富有想象力的“意大利面城市”中，高耸的通心粉管雕刻成建筑物，社区点缀着意大利香料的景观，街道上铺满了美味的番茄酱、螺旋意大利面和嫩滑的肉丸。该广告展示了广告商如何通过 Amazon Nova 模型为其产品赋予生命，创造出高质量的内容。

视频理解

为了测试 Amazon Nova Pro 的视频理解能力，我们要求模型审阅并描述一段无声的足球比赛视频剪辑。模型的结果包含对比赛场景、球队制服、球员动作及比赛结果的详细描述。

视频提示：“描述视频。”

输出：“视频展示了一场正在绿茵场进行的足球比赛。两支球队分别穿着黄色和白色队服。黄色队的四分卫将球传给一名接球手，接球手接住球后开始向前跑动。白色队的防守队员试图追赶并拦截他。比赛最终以接球手被擒抱倒地结束。”

展望未来

我们预计将在 2025 年发布两款新型 Amazon Nova 模型，其中包括语音到语音模型和本地多模态到多模态（即“任意到任意”模态）模型。我们的语音到语音模型将能够理解以自然语言流式输入的语音，解析语言及非语言线索（如语调和语速），并提供自然人类式的互动。而我们的任意到任意模型将能处理文本、图像、音频和视频作为输入和输出。这将简化应用程序开发，使同一模型能够完成多种任务，例如将内容从一种模态翻译为另一种、编辑内容，以及支持能够理解所有模态的 AI 代理。

负责任的 AI

Amazon Nova 模型内置安全措施和保护机制。公司已为 Amazon Nova 模型推出 AWS AI 服务卡，向用户提供关于使用案例、局限性和负责任 AI 实践的透明信息。

这只是 Amazon Nova 的开端，我们期待能继续创新，为每位 Amazon 客户创造实际价值。了解更多并开始体验 Amazon Nova。

AmazonNova发布：革命性基础模型提升AI生成与理解能力

Amazon Nova 模型为客户带来的好处

创意内容生成

视频理解

展望未来

负责任的 AI

Meta发布Llama3.3：700亿参数的高效大型语言模型揭秘

海螺AI海外版上线秒级语音克隆功能，轻松生成个性化声音

暂无评论

发表评论取消回复

Amazon Nova 模型为客户带来的好处

创意内容生成

视频理解

展望未来

负责任的 AI

Meta发布Llama3.3：700亿参数的高效大型语言模型揭秘

海螺AI海外版上线秒级语音克隆功能，轻松生成个性化声音

相关推荐

暂无评论

发表评论 取消回复

搜索

AmazonNova发布：革命性基础模型提升AI生成与理解能力

发表评论取消回复