扎克伯格法庭辩护:MetaAI训练版权数据争议

Meta首席执行官马克·扎克伯格在近期的一项法律诉讼中,通过YouTube与盗版内容的斗争,为公司在AI训练中使用版权数据的做法进行辩护。这起诉讼被称为“Kadrey 诉 Meta”,是美国法庭众多针对AI公司的版权诉讼之一,涉及知名作家莎拉·西尔弗曼和塔-纳希西·科茨等人。

以下是扎克伯格证词的摘录,他表示,尽管YouTube上可能存在盗版内容,但YouTube仍在努力删除这些内容。“大多数在YouTube上的内容应该是合法的,他们有相关许可。” 扎克伯格的这番话暗示了他对Meta使用LibGen版权电子书数据集进行AI训练的立场。

LibGen是一个提供包括Cengage Learning、麦格劳-希尔和皮尔逊教育等多个出版社版权作品的链接聚合网站。该网站因版权侵权多次被起诉,并遭受数千万美元的罚款。法庭文件显示,尽管Meta的AI团队对使用LibGen的法律风险表示担忧,扎克伯格仍批准将其用作训练数据集。

在审问中,扎克伯格声称自己对LibGen并不熟悉,但表示禁止使用YouTube这样的平台将是不合理的。“不,我不会希望对人们使用YouTube设定政策,因为一些内容可能是受版权保护的。” 他说。同时,扎克伯格承认,Meta在使用版权材料进行训练时需要谨慎。

原告律师的最新指控称,Meta曾将LibGen上的某些盗版书籍与可供授权的版权书籍进行交叉参考,以决定是否与出版商达成许可协议。此外,原告还指控Meta在训练其最新的Llama模型时使用了LibGen的数据集,并曾从另一个盗版源Z-Library下载电子书用于训练。

Z-Library也因版权问题遭到多次法律行动,其维护者在2022年被控版权侵权、网络诈骗及洗钱等罪名。

以下是重点内容:

📚 扎克伯格在法庭上引用YouTube的案例为Meta在AI训练中使用版权材料辩护。

🔍 原告指控Meta使用盗版书籍数据集LibGen进行Llama模型的训练,并隐藏相关信息。

⚖️ Meta面临多起版权诉讼,相关法律风险引发了内部讨论与关注。

相关推荐

暂无评论

发表评论