アドビがAIモデルの訓練に無断で著作物を使用したとして、集団訴訟が提起されたと発表しました。この訴訟は、オレゴン州の作家エリザベス・ライオン氏を代表とするもので、同社が海賊版の書籍を使用して「SlimLM」というAIモデルを訓練したと主張しています。
アドビは、SlimLMを「モバイルデバイスでの文書支援タスクに最適化された小型言語モデルシリーズ」と説明しています。このモデルは、2023年6月にCerebrasが公開した「SlimPajama-627B」というデータセットで事前訓練されたとしています。ライオン氏は、自身のノンフィクション執筆ガイドブックがアドビによって使用されたデータセットに含まれていると述べています。
この訴訟は、ライオン氏の著作物が「RedPajama」データセットをコピーし、操作した「SlimPajama」データセットの一部として使用されたと主張しています。RedPajamaデータセットには「Books3」と呼ばれる191,000冊の書籍が含まれており、これがAIシステムの訓練に使用されていることが問題視されています。
「Books3」は、AI訓練における著作権侵害の疑いで技術業界において法的問題を引き起こしているということです。9月には、Appleが著作権で保護された資料を無断で使用したとして訴訟が提起され、10月にはSalesforceに対しても同様の訴訟が起こされています。
AIアルゴリズムは大規模なデータセットで訓練されることが多く、これらのデータセットには無断で使用された資料が含まれている疑いがあります。9月にはAnthropicが、同様の訴訟で1.5億ドル(約233億円)を支払うことで和解しました。このケースは、AI訓練データにおける著作権侵害問題の転機と見なされています。
