Adobe、AIモデル訓練に著作権侵害疑いで集団訴訟を提訴される

AdobeはAI戦略でクリエイター保護を掲げてきたが、SlimLMの訓練データ使用をめぐり著作権侵害の訴訟に直面している。カリフォルニア北部連邦地裁で火曜日に提起されたこの集団訴訟は、業界のデータ利用問題を浮き彫りにする。

訴訟の詳細

著者エリザベス・ライオン氏が原告となり、Adobeが許可なく著作権保護された書籍(自身の作品を含む)を使用してSlimLMを訓練したと主張している。この訴訟は、カリフォルニア北部連邦地裁で火曜日に提出された提案集団訴訟の形式をとる。ライオン氏は同様の被害を受けた他の権利者代表として行動している。

AI訓練データの大きな論争

この種の訴訟が頻発する背景には、現代の人工知能の仕組みがある。チャットボットや画像生成ツールの背後で、膨大な量のデータから学習する基盤モデルが存在し、データ量の多さが性能向上に寄与するが、データの出所と使用条件が問題となる。

訴訟で指摘されたモデルはAdobeの有名な創造系Fireflyではなく、SlimLMである。これは小型言語モデル群で、文書関連タスク、特にモバイルデバイス向け支援を目的とする。創造生成ではなくバックグラウンド運用が特徴だ。

訴状によると、問題はSlimLMの最終製品ではなく訓練データにある。AdobeはこれをオープンソースデータセットSlimPajama-627B(Cerebrasが2023年6月に公開)で事前訓練したと説明する。このデータセットはRedPajama由来で、そこに著作権保護書籍を集めたBooks3が含まれるという。

AdobeのAI戦略と対比

Adobeの公的メッセージは主にFirefly中心で、ライセンス付きコンテンツ(Adobe Stockなど)とパブリックドメイン素材を使用し、Stock貢献者への補償プログラムを強調する。しかし本訴訟はSlimLMを標的とし、商業的に目立たない支援タスクに焦点を当てる点が重要だ。

業界全体の文脈

この訴訟は米国でのAI訓練関連訴訟の流れにある。近年、OpenAIやAnthropicに対し著者らが著作権侵害を訴え、一部は巨額和解に至っている。これらはAIデータ利用の法的境界を定める一歩と見なされる。

現在、訴訟は初期段階で、原告は未定の経済的補償を求め、AdobeはReutersのコメント要請に応じていない。裁判の行方が注目される中、AI進化とコンテンツクリエイター権利のバランスが再び問われている。

Anzai Hotaka

10 年の経験を持つコンピュータ エンジニア。Linux コンピュータ システム管理者、Web プログラマー、システム エンジニア。