Loading...

Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播

GoodNav 3 月 27 日的报道,科技媒体 WinBuzzer 在 3 月 26 日发布的一篇博文中指出,最新研究表明,Meta 在数字图书盗版链中的参与程度超出了预期。

据报道,Meta 公司在利用 LibGen 和 Z-Library 等“影子图书馆”的盗版资料来训练 AI 模型的同时,还通过 BitTorrent 再次上传了大约 30% 的已下载书籍,这客观上延长了盗版作品的传播周期。

Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播

专家指出,尽管 BitTorrent 通常会分片上传数据,但 Meta 的上传活动异常频繁,可能在某种程度上构成了盗版网络的节点。

今年 2 月,有报道称,Meta 在法庭文件中表示,虽然公司下载了 82TB 的盗版内容来训练 LLaMA 人工智能模型,但已采取措施以确保在下载过程中不进行任何“种子分享(seeding)”

Meta 被曝助推数字盗版:30% 训练 AI 书籍遭二次传播

然而,最新研究揭示的再上传行为可能推翻了这个说法。澳大利亚前总理马尔科姆·特恩布尔发现自己的著作被盗用,表示“极度不安”,而美国普利策奖得主迈克尔·夏邦等人已提起诉讼,法国出版商指控 Meta 的行为是对版权作品的“大规模掠夺”。

欧盟委员会已经关注此事件,可能依据《欧盟 AI 法案》对其进行严厉处罚。如果法院最终裁定 Meta 需为训练数据获得合法授权,将可能改变 AI 行业的数据获取规则。目前案件进展尚不明确,但这场版权争议无疑将成为数字时代知识产权保护的一个标志性事件。

相关阅读:

© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...