AnthropicのAIトレーニング書籍スキャン計画「Panama」が司法文書で暴露

AnthropicはAIモデルClaudeの精度向上のため、数千万ドルの投資で書籍を無許可でデジタル化していた。Washington Postが報じた司法文書がこの秘密プロジェクトを明らかにした。AI企業間のデータ争奪戦が倫理的問題を引き起こしている。

プロジェクトPanamaはどう始まったか

Anthropic2024年初頭プロジェクトPanamaを開始した。

内部文書は「世界中のすべての書籍を破壊的スキャンする」ことを目標とした。

企業はこれを秘密に保つことを望んだ。

書籍取得とスキャンの実態は

約1年で数千万ドルを投じ、数百万冊の書籍を購入した。

油圧機械で背表紙を切り、スキャン後にリサイクルした。

これらのデータがClaudeのトレーニングに使用された。

なぜこの計画が暴露されたのか

著者らの著作権侵害訴訟で詳細が明らかになった。

2025年8月15億ドルで和解したが、裁判所が4,000ページ超の文書を公開した。

他のAI企業も関与したか

  • MetaGoogleOpenAIも大量データ取得競争に参加。
  • Anthropic共同創業者2023年1月、書籍で「良い書き方を教える」と理論化した。
  • Meta2024年内部メールはデジタルライブラリを「競争力の鍵」と記述。

許可なしデータ取得の手法

企業は出版社や著者の許可を「非現実的」と判断した。

第三者サイトから無許可ダウンロードを実施した。

2024年4月のチャットで、Amazonサーバーを借りてトレント使用を「追跡回避」と説明。

企業行動例日付
AnthropicLibGenからBen Mann2021年6月に11日間ダウンロード2021年6月
AnthropicPirate Library Mirror2022年7月称賛2022年7月
MetaダウンロードをMZ(Mark Zuckerberg?)承認2023年12月

AnthropicはLibGenやPirate Library Mirrorのデータを商用モデルに使用せずと主張。

Anthropicの合法的解決策は

法的リスクで戦略変更。Tom Turvey(Google Books経験者)を雇用。

中古書店やStrand書店から数百万冊を購入し、倉庫に積み上げた。

提案では6ヶ月50万〜200万冊変換を目指した。

AIトレーニングの法的判断は

多くの訴訟が進行中。

2025年6月William Alsup判事は書籍使用を「変形的」として合法と認定。

Vince Chhabria判事はMetaの場合、著者の売上被害を証明せず。

最終合意の内容

Anthropicは15億ドルを支払い、責任を認めず和解。

ダウンロード被害著者はタイトルあたり約3,000ドル請求可能。

主なタイムライン

  • 2021年6月: LibGenダウンロード開始
  • 2023年1月: 書籍トレーニング理論化
  • 2024年初頭: Panama開始
  • 2025年6月: 判決
  • 2025年8月: 和解
Anzai Hotaka

10 年の経験を持つコンピュータ エンジニア。Linux コンピュータ システム管理者、Web プログラマー、システム エンジニア。