扎克伯格法庭辩护：MetaAI训练版权数据争议

2025-01-17

Meta首席执行官马克·扎克伯格在近期的一项法律诉讼中，通过YouTube与盗版内容的斗争，为公司在AI训练中使用版权数据的做法进行辩护。这起诉讼被称为“Kadrey 诉 Meta”，是美国法庭众多针对AI公司的版权诉讼之一，涉及知名作家莎拉·西尔弗曼和塔-纳希西·科茨等人。

以下是扎克伯格证词的摘录，他表示，尽管YouTube上可能存在盗版内容，但YouTube仍在努力删除这些内容。“大多数在YouTube上的内容应该是合法的，他们有相关许可。” 扎克伯格的这番话暗示了他对Meta使用LibGen版权电子书数据集进行AI训练的立场。

LibGen是一个提供包括Cengage Learning、麦格劳-希尔和皮尔逊教育等多个出版社版权作品的链接聚合网站。该网站因版权侵权多次被起诉，并遭受数千万美元的罚款。法庭文件显示，尽管Meta的AI团队对使用LibGen的法律风险表示担忧，扎克伯格仍批准将其用作训练数据集。

在审问中，扎克伯格声称自己对LibGen并不熟悉，但表示禁止使用YouTube这样的平台将是不合理的。“不，我不会希望对人们使用YouTube设定政策，因为一些内容可能是受版权保护的。” 他说。同时，扎克伯格承认，Meta在使用版权材料进行训练时需要谨慎。

原告律师的最新指控称，Meta曾将LibGen上的某些盗版书籍与可供授权的版权书籍进行交叉参考，以决定是否与出版商达成许可协议。此外，原告还指控Meta在训练其最新的Llama模型时使用了LibGen的数据集，并曾从另一个盗版源Z-Library下载电子书用于训练。

Z-Library也因版权问题遭到多次法律行动，其维护者在2022年被控版权侵权、网络诈骗及洗钱等罪名。

以下是重点内容：

📚 扎克伯格在法庭上引用YouTube的案例为Meta在AI训练中使用版权材料辩护。

🔍 原告指控Meta使用盗版书籍数据集LibGen进行Llama模型的训练，并隐藏相关信息。

⚖️ Meta面临多起版权诉讼，相关法律风险引发了内部讨论与关注。

标签：AI 训练 · Meta · 版权诉讼

暂无评论

发表评论取消回复

要发表评论，您必须先登录。