デジ未来
AI (エーアイ)
スペイン発の基盤モデル「ALIA-40b」──早すぎた公開と今後の課題

スペイン発の基盤モデル「ALIA-40b」──早すぎた公開と今後の課題

X (Twitter) Facebook Pinterest LinkedIn Email

スペインで開発された基盤型AIモデルALIA-40bは、公開時点で十分に訓練・調整されておらず、当初の期待と比べて性能面で課題が露呈した。開発はバルセロナスーパーコンピューティングセンター（BSC-CNS）が統括している。

プロジェクトの概要と公開経緯

ALIA-40bは大規模な多言語の基盤モデルで、MareNostrum 5を利用して訓練が行われたと説明されているが、訓練トークン数や工程は当初の計画より制限された状態での公開となった。BSC-CNSの紹介文では40,000百万（40B）パラメータ、初期訓練で6.9兆トークン（最終的には最大9.2兆を想定）とされる説明がある（BSC-CNSの記述はそのまま保持する）。

なぜ「早すぎた」公開になったのか

開発責任者の説明によれば、公開は「技術的判断」ではなく戦略的・運用的要因で行われ、予定していた長期の事前訓練が途中で中断されたためである。チームは当初、12兆トークン（12T）での訓練を目指していたが、実際には2.3兆トークンでモデルを公開せざるを得なかった。

技術的に何が足りなかったか

事前訓練（pre-trained）段階のみで公開され、対話指向の応答や安全性を担保するInstruction TuningやAlignmentが未実装だった。
訓練で用いる学習率スケジューラはコサインベースが採用され、最終段階での低学習率による微調整が十分に行われていなかった。
推論用の公開プラットフォーム（例：チャットインターフェース）や利用状況のメトリクスが存在せず、利用者からのフィードバックを得られない状態だった。

性能評価と批判

初期のベンチマークでは、ALIA-40bの性能は既存の公開モデル（例：Llama-2-34b等）と比較して高くはなく、いくつかの独立した検証では期待を下回る結果が報告された。たとえば、大学の研究では数学の選択式試験で他のLLMより低い得点となり、「推測した方が良い」ほどの成績だったという評価がある（研究の記述は原文のまま保持）。

データ利用と法的・倫理的配慮

訓練データにはCommon Crawlのような大規模公開コーパスが含まれており、著作権に関する議論が伴っている。報道では、当該訓練は現行法と「データマイニングの例外規定」に基づくと説明される一方で、著作者側には複雑な異議申し立て手続きが要求されることが指摘されている。開発チームは規約遵守のためにデータセットを再生成する必要があると述べている。

計算資源と運用上の制約

MareNostrum 5上でのノード利用は限定的で、開発初期には最大で512ノードのうち一部を使えた期間があったが、長期的には256ノード、さらに128ノードへと削減され、現在は推論用の専用ノード数がさらに制限されている。これにより多様な試行錯誤や反復訓練が難しく、商用大手のように何百回ものバリエーションを作ることができなかった。