我为了打造Claude销毁了数百万本书:Anthropic Project Panama的真相

15亿美元和解,数百万本书被销毁:要点

  • Anthropic购买、拆解、扫描并销毁了数百万本书用于Claude训练
  • 内部文件:”Project Panama是我们破坏性扫描全球书籍的尝试”
  • 15亿美元和解金,每本书向作者支付约3,000美元

发生了什么?

超过4,000页的法庭文件被公开,揭露了Anthropic的秘密项目。代号是”Project Panama”。内部计划文件明确指出:”Project Panama是我们破坏性扫描全球书籍的努力。”他们从Better World Books和World of Books等二手书店大量购买了数万本书。他们用”液压切割机”整齐地切掉书脊。他们用高速、高质量扫描仪扫描页面。然后回收公司收走剩余的残骸。[Techmeme]

这个项目由Tom Turvey领导。他是20年前创建Google Books项目的前Google高管。在大约一年的时间里,Anthropic投资了数百万美元来获取和扫描数百万本书。[Futurism]

为什么这很重要?

说实话,这揭示了AI训练数据获取的真实面貌。

Anthropic为什么选择这种方式?首先,为了避免非法下载的风险。其次,购买二手书并按意愿处置,根据”首次销售原则”很可能是合法的。实际上,法官也认定这种扫描方法本身属于合理使用。[CNBC]

然而问题在于:在Project Panama之前,Anthropic从Library Genesis和Pirate Library Mirror等非法网站免费下载了超过700万本书。法官裁定这部分可能构成版权侵权。[NPR]

我个人认为这才是核心问题。问题不在于扫描”合法”购买的书籍以便销毁,而在于他们首先非法下载了这些书。Anthropic自己也意识到了这一点。内部文件明确指出:”我们不希望这项工作被公开。”会有后果吗?

15亿美元的和解金是AI版权纠纷史上最大规模的。约50万本书的作者将获得每本约3,000美元。[PBS]

AI已经有了其他先例。对企业的影响是巨大的。OpenAI、Google和Meta也面临类似的诉讼。标准已经明确:”购买书籍并扫描是可以的,但非法下载是不被允许的。”

Anthropic已经卷入了音乐版权诉讼。另一起诉讼于1月提起,音乐出版商声称Claude 4.5被训练”记忆”受版权保护的作品。Watchdog]

常见问题

Q: Project Panama中实际可用的书籍有多少本?它们被销毁了吗?

A: 根据法庭文件,多达200万本书被列为”破坏性扫描”目标。Anthropic从Better World Books和World of Books等二手书店购买了数万本书,估计在大约一年的时间里投资了数百万美元处理了数百万本书。

Q: 作者能获得多少?

A: 15亿美元的和解金适用于约50万本书。每本约3,000美元。被非法下载书籍的作者有资格提出索赔,一旦法院批准和解,他们可以单独提出索赔。但是,如果不是所有作者都提出索赔,实际收到的金额可能会增加。

Q: 购买书籍并扫描是否合法?

A: 法官认定这种方法属于合理使用。这是因为根据”首次销售原则”,购买的书籍可以按意愿处置。然而Anthropic的问题是,在Project Panama之前,他们从非法网站下载了书籍。扫描合法购买的书籍目前是合法的。


如果这篇文章对你有帮助,请订阅AI Digester。

参考资料

发表评论