AnthropicのAIトレーニング書籍スキャン計画「Panama」が司法文書で暴露

AnthropicはAIモデルClaudeの精度向上のため、数千万ドルの投資で書籍を無許可でデジタル化していた。Washington Postが報じた司法文書がこの秘密プロジェクトを明らかにした。AI企業間のデータ争奪戦が倫理的問題を引き起こしている。
プロジェクトPanamaはどう始まったか
Anthropicは2024年初頭にプロジェクトPanamaを開始した。
内部文書は「世界中のすべての書籍を破壊的スキャンする」ことを目標とした。
企業はこれを秘密に保つことを望んだ。
書籍取得とスキャンの実態は
約1年で数千万ドルを投じ、数百万冊の書籍を購入した。
油圧機械で背表紙を切り、スキャン後にリサイクルした。
これらのデータがClaudeのトレーニングに使用された。
なぜこの計画が暴露されたのか
著者らの著作権侵害訴訟で詳細が明らかになった。
2025年8月に15億ドルで和解したが、裁判所が4,000ページ超の文書を公開した。
他のAI企業も関与したか
- Meta、Google、OpenAIも大量データ取得競争に参加。
- Anthropic共同創業者は2023年1月、書籍で「良い書き方を教える」と理論化した。
- Metaの2024年内部メールはデジタルライブラリを「競争力の鍵」と記述。
許可なしデータ取得の手法
企業は出版社や著者の許可を「非現実的」と判断した。
第三者サイトから無許可ダウンロードを実施した。
2024年4月のチャットで、Amazonサーバーを借りてトレント使用を「追跡回避」と説明。
| 企業 | 行動例 | 日付 |
|---|---|---|
| Anthropic | LibGenからBen Mannが2021年6月に11日間ダウンロード | 2021年6月 |
| Anthropic | Pirate Library Mirrorを2022年7月称賛 | 2022年7月 |
| Meta | ダウンロードをMZ(Mark Zuckerberg?)承認 | 2023年12月 |
AnthropicはLibGenやPirate Library Mirrorのデータを商用モデルに使用せずと主張。
Anthropicの合法的解決策は
法的リスクで戦略変更。Tom Turvey(Google Books経験者)を雇用。
中古書店やStrand書店から数百万冊を購入し、倉庫に積み上げた。
提案では6ヶ月で50万〜200万冊変換を目指した。
AIトレーニングの法的判断は
多くの訴訟が進行中。
2025年6月、William Alsup判事は書籍使用を「変形的」として合法と認定。
Vince Chhabria判事はMetaの場合、著者の売上被害を証明せず。
最終合意の内容
Anthropicは15億ドルを支払い、責任を認めず和解。
ダウンロード被害著者はタイトルあたり約3,000ドル請求可能。
主なタイムライン
- 2021年6月: LibGenダウンロード開始
- 2023年1月: 書籍トレーニング理論化
- 2024年初頭: Panama開始
- 2025年6月: 判決
- 2025年8月: 和解





