在2025年的消费电子展(CES)上,NVIDIA正式推出了革命性的Cosmos平台。该平台专注于加速物理人工智能(AI)系统的开发,特别是在自主驾驶车辆和机器人领域。Cosmos平台融合了生成式世界基础模型(WFM)、视频标记器、安全防护机制以及高效的数据处理管道,助力开发者降低对真实世界数据的依赖,从而更高效地构建和优化AI模型。
Cosmos平台将采用开放模型许可方式,在Hugging Face和NVIDIA NGC目录中公开发布。未来,NVIDIA还将推出优化的NVIDIA NIM微服务,并通过NVIDIA AI企业软件平台提供全方位的企业级支持。
NVIDIA首席执行官黄仁勋在展会上强调:“机器人技术正迎来一个类似于ChatGPT的转折点。与大型语言模型一样,世界基础模型是推动机器人和自动驾驶车辆进步的关键。然而,并非所有开发者都有能力或资源来训练自己的模型。Cosmos的推出旨在让物理AI的开发变得更加普及,让每一位开发者都能接触到通用机器人技术。”
Cosmos模型能够根据文本、图像和传感器数据生成高清物理视频,适用于视频搜索、合成数据生成和强化学习等多种应用。开发者可以根据需求定制模型,模拟工业环境、驾驶场景等特定用例。此外,NVIDIA还推出了NeMo Curator,一个加速视频处理管道,可在14天内处理2000万小时的视频数据,以及Cosmos Tokeniser,一个视觉数据压缩工具。
Agility Robotics首席技术官Pras Velagapudi表示:“数据稀缺性和变异性是机器人环境学习成功的关键挑战。Cosmos的文本、图像和视频到世界的能力使我们能够在无需大量昂贵真实数据的情况下,生成和增强各种任务的场景。”
多家主流的机器人和运输公司,包括Agile Robots、XPENG、Waabi和Uber,已经开始采用Cosmos进行AI开发。Uber首席执行官Dara Khosrowshahi表示:“生成式AI将推动未来出行,这需要丰富的数据和强大的计算能力。与NVIDIA的合作,让我们有信心加速安全、可扩展的自动驾驶解决方案的进程。”
除了Cosmos,NVIDIA还推出了Llama Nemotron大型语言模型和Cosmos Nemotron视觉语言模型,专为医疗、金融和制造等行业的企业用户量身定制。
官方博客:https://nvidianews.nvidia.com/news/nvidia-launches-cosmos-world-foundation-model-platform-to-accelerate-physical-ai-development
划重点:
🌍 Cosmos平台旨在加速自主驾驶车辆和机器人的开发,降低对真实数据的依赖。
🚀 开发者可根据需求定制模型,生成多种应用场景的视频数据。
🤖 多家机器人和运输公司已开始使用Cosmos,加速AI技术的实际应用。
暂无评论