デジ未来
AI (エーアイ)
Adobe、AIモデル訓練に著作権侵害疑いで集団訴訟を提訴される

Adobe、AIモデル訓練に著作権侵害疑いで集団訴訟を提訴される

X (Twitter) Facebook Pinterest LinkedIn Email

AdobeはAI戦略でクリエイター保護を掲げてきたが、SlimLMの訓練データ使用をめぐり著作権侵害の訴訟に直面している。カリフォルニア北部連邦地裁で火曜日に提起されたこの集団訴訟は、業界のデータ利用問題を浮き彫りにする。

訴訟の詳細

著者エリザベス・ライオン氏が原告となり、Adobeが許可なく著作権保護された書籍（自身の作品を含む）を使用してSlimLMを訓練したと主張している。この訴訟は、カリフォルニア北部連邦地裁で火曜日に提出された提案集団訴訟の形式をとる。ライオン氏は同様の被害を受けた他の権利者代表として行動している。

AI訓練データの大きな論争

この種の訴訟が頻発する背景には、現代の人工知能の仕組みがある。チャットボットや画像生成ツールの背後で、膨大な量のデータから学習する基盤モデルが存在し、データ量の多さが性能向上に寄与するが、データの出所と使用条件が問題となる。

訴訟で指摘されたモデルはAdobeの有名な創造系Fireflyではなく、SlimLMである。これは小型言語モデル群で、文書関連タスク、特にモバイルデバイス向け支援を目的とする。創造生成ではなくバックグラウンド運用が特徴だ。

訴状によると、問題はSlimLMの最終製品ではなく訓練データにある。AdobeはこれをオープンソースデータセットSlimPajama-627B（Cerebrasが2023年6月に公開）で事前訓練したと説明する。このデータセットはRedPajama由来で、そこに著作権保護書籍を集めたBooks3が含まれるという。