Claudeを作るために数百万冊の本を破壊した:AnthropicのProject Panamaの真実

15億ドル和解、数百万冊破棄:要点まとめ

  • AnthropicがClaude学習用に数百万冊の本を購入し、裁断・スキャン後に廃棄処理
  • 内部文書:「Project Panamaは世界中のすべての本を破壊的にスキャンしようとする試み」
  • 15億ドル(約2,250億円)の和解金で作家に1冊あたり約3,000ドルを賠償

何が起きたのか?

4,000ページ以上の裁判文書が公開され、Anthropicの秘密プロジェクトが明らかになった。コードネームは「Project Panama」。内部企画文書にはこう書かれていた:「Project Panamaは世界中のすべての本を破壊的にスキャンしようとする我々の取り組みである。」[Washington Post]

方法はこうだ。Better World Books、World of Booksのような中古書店から数万冊単位で本を大量購入する。「ギロチン式裁断機」で背表紙をきれいに切り落とす。高速・高品質スキャナーでページをスキャンする。そしてリサイクル業者が残った残骸を回収する。[Techmeme]

プロジェクトを率いたのはTom Turvey。20年前にGoogle Booksプロジェクトを立ち上げた元Google幹部だ。約1年でAnthropicは数千万ドルを投資し、数百万冊の本を確保・スキャンした。[Futurism]

なぜ重要なのか?

正直なところ、これはAI学習データ確保の切実さを物語っている。

Anthropicはなぜこのような方法を選んだのか?第一に、違法ダウンロードのリスクを避けるため。第二に、中古本を買って好きなように処分するのは「ファーストセール・ドクトリン」(最初の販売原則)上、合法である可能性が高かった。実際、裁判官もこのスキャン方法自体をフェアユース(公正使用)として認めた。[CNBC]

しかし問題があった。Project Panama以前に、AnthropicはLibrary Genesis、Pirate Library Mirrorのような違法サイトから700万冊以上の本を無料でダウンロードしていた。裁判官はこの部分が著作権侵害に当たる可能性があると判断した。[NPR]

個人的には、ここが核心だと考える。「合法的な」本の破壊スキャンより、その前に違法ダウンロードを先にしていたという事実が問題だった。Anthropic自身も認識していた―内部文書に「この作業が知られることを望まない」と書かれていた。

今後どうなるのか?

15億ドルの和解金はAI著作権紛争史上最大規模だ。推定50万冊に対して1冊あたり約3,000ドルが作家に支払われる。[PBS]

この判例が他のAI企業に与える影響は大きい。OpenAI、Google、Metaも同様の訴訟に直面している。「本を買ってスキャンするのは問題ないが、違法ダウンロードはダメ」という基準が明確になった。

Anthropicは音楽著作権訴訟も進行中だ。1月に音楽出版社がClaude 4.5が著作物を「暗記」するよう学習されたと主張する別の訴訟を提起した。[IP Watchdog]

よくある質問(FAQ)

Q: Project Panamaで実際に何冊の本が破壊されたのか?

A: 裁判文書によると、最大200万冊の本が「破壊的スキャン」の対象となった。AnthropicはBetter World Books、World of Booksなどの中古書店から数万冊単位で本を購入し、約1年間で数千万ドルを投資して数百万冊を処理したと推定される。

Q: 作家はいくら受け取れるのか?

A: 15億ドルの和解金は約50万冊に適用される。1冊あたり約3,000ドル水準だ。違法ダウンロードされた本の作家が請求対象であり、和解が裁判所で承認されれば個別に請求できる。ただし、すべての作家が請求しなければ、実際の受領額は増える可能性がある。

Q: 本を買ってスキャンするのは合法なのか?

A: 裁判官はこの方法を公正使用として認めた。「ファーストセール・ドクトリン」に基づき、購入した本は好きなように処分できるからだ。ただし、Anthropicが問題になったのはProject Panama以前に違法サイトから本をダウンロードした部分だ。正当に購入した本のスキャンは現在の基準では合法だ。


この記事が役に立ったら、AI Digesterを購読してください。

参考資料

コメントする