クロードを作るために数百万冊の本を切り刻んだ: Anthropic Project Panamaの真実

15億ドルの和解、数百万冊破棄:主な内容

  • Anthropic、数百万冊のClaude学習用図書を購入後廃棄、スキャン後破棄
  • 内部文書:“Project Panamaは全世界の図書を破壊的にスキャンしようとする試み”
  • 15億ドルの和解、著者に本1冊あたり約3,000ドル支払い

何が起こったのか?

Anthropicの秘密プロジェクトが4,000ページ以上の裁判所文書公開で明らかになる。コード名は“Project Panama”。内部計画文書には“Project Panamaは全世界の図書を破壊的にスキャンしようとする私たちの努力”と明示されている。Better World BooksやWorld of Booksのような中古書店で数万冊の本を大量に購入。“油圧カッター”で背表紙をきれいに切断。高速、高品質スキャナーでページをスキャン。そしてリサイクル会社が残った残骸を回収。[Techmeme]

このプロジェクトはTom Turveyが率いた。彼は20年前Google Booksプロジェクトを作った元Google幹部。約1年間、Anthropicは数百万冊の本を確保しスキャンするのに数千万ドルを投資。[Futurism]

なぜ重要なのか?

率直に言って、これはAI学習データ確保の実際の姿を示している。

Anthropicはなぜこのアプローチを選んだのか?第一に、不法ダウンロードのリスクを避けるため。第二に、中古書籍を購入し、望むように廃棄することが“最初の販売原則”によって合法である可能性が高かった。実際に判事は、このスキャン方法自体をフェアユースとして認めた。[CNBC]

しかし問題があった。Project Panama以前、AnthropicはLibrary GenesisやPirate Library Mirrorのような違法サイトから700万冊以上の本を無料でダウンロードしていた。判事は、この部分が著作権侵害に該当する可能性があると判決した。[NPR]

個人的にはこれが核心だと思う。問題は“合法的な”本を破棄するためにスキャンするよりも、不法に先にダウンロードしたという点だ。Anthropic自身も認識していた。内部文書には“この作業が知られることを望まない”と明示されている。効果があるだろうか?

15億ドルの和解はAI著作権紛争史上最大規模。推定される50万冊の本に対し、本1冊あたり約3,000ドルが著者に支払われる。[PBS]

AIは他の先例を持つ。会社に及ぼす影響は大きい。OpenAI、Google、Metaも同様の訴訟に直面している。“本を買ってスキャンするのは大丈夫だが、不法ダウンロードは許されない”という基準が明確になった。

Anthropicはすでに音楽著作権訴訟に巻き込まれている。別の訴訟は1月に提起され、音楽出版社はClaude 4.5が著作権のある作品を“暗記”するように教育されたと主張している。Watchdog]

よくある質問

Q: Project Panamaで実際に使用できる本は何冊か?破棄されたのか?

A: 裁判所文書によると、最大200万冊の本が“破壊的スキャン”の対象だった。AnthropicはBetter World BooksやWorld of Booksのような中古書店で数万冊の本を購入し、約1年間で数千万ドルを投資して数百万冊の本を処理したと推定される。

Q: 著者はいくら受け取ることになるのか?

A: 15億ドルの和解は約50万冊の本に適用される。本1冊あたり約3,000ドル。不法にダウンロードした本の著者が請求対象であり、和解が裁判所で承認されれば個別に請求できる。しかし、すべての著者が請求しなければ、実際に受け取る金額が増える可能性がある。

Q: 本を買ってスキャンするのは合法か?

A: 判事はこの方法をフェアユースとして認めた。これは“最初の販売原則”によって購入した本は望むように処分できるからだ。しかし、Anthropicの問題はProject Panama以前に違法サイトから本をダウンロードしたという点だ。合法的に購入した本のスキャンは現在合法だ。


この記事が役に立ったなら、AI Digesterを購読してください。

参考文献

コメントする