英伟达引领“合成数据”革命,AI训练新趋势

英伟达(NVDA)、谷歌(GOOGL)及其旗下初创公司OpenAI正积极转向“合成数据”工厂,以满足深度学习AI算法训练所需的大量数据需求。本周的消费电子展上,英伟达CEO赞扬了合成数据的力量,这可能对英伟达股价产生积极影响。

转向合成数据的趋势在AI公司耗尽训练强大AI模型所需的真实世界数据之际愈发明显。

数据科学家Ben Lorica在2025年展望报告中指出:“合成数据为解决稀缺或敏感数据需求提供了关键解决方案。随着主要AI公司用尽可用于训练的互联网数据,这一趋势正在加速。”

Lorica补充说:“团队已经可以利用基础模型为特定用例生成合成数据,而更大的组织可能会将合成数据与他们的专有数据集相结合。我们期待主要AI实验室推出改进的合成数据生成工具,使这项技术更容易为从业者所用。”

在2025年CES上,英伟达CEO黄仁勋强调人工智能在汽车和机器人应用中的未来作用,并指出合成数据将发挥重要作用。

经济学家Ed Yardeni在一份关于CES进展的报告中说:“英伟达正在收集和组织传统数据,并利用它们来创建合成数据。这些数据和合成数据都将用于在英伟达的数据工厂中训练AI代理和机器人。”

Yardeni补充说:“通过让Nvidia Cosmos观看2000万小时关于自然、人类以及与物质世界相关的任何事物的视频,开发了Nvidia Cosmos。基于这些真实场景,它还可以创建合成数据,以创建更多场景。然后,它可以使用其真实数据和合成数据来训练需要在世界中导航的机器人,无论是在仓库工作还是驾驶自动驾驶汽车。”

谷歌的云计算部门也在积极推动企业应用的合成数据。此外,OpenAI最新的具有增强推理能力的基础模型使用了合成数据生成技术。

进入2025年,一个大的争论是,由于难以获取高质量、人工制作的训练数据,AI模型是否已经开始趋于平稳。此外,像谷歌和Meta Platforms(META)这样的科技巨头拥有来自YouTube、地图、Instagram和Facebook的内部专有数据,可用于构建更大的模型。

与此同时,英伟达股票在2025年上涨了4%。在2023年飙升239%之后,英伟达股票在2024年上涨了171%。

相关推荐

暂无评论

发表评论