AI企業のCohereは、インドAIサミットにおいて、多言語対応の新モデル「Tiny Aya」を発表しました。このモデルはオープンウェイトで、基盤コードが公開され、誰でも利用・修正が可能です。70以上の言語をサポートし、ノートパソコンなどの一般的なデバイスでインターネット接続なしに動作できるということです。
Cohereの研究部門であるCohere Labsが開発したこのモデルは、ベンガル語、ヒンディー語、パンジャブ語、ウルドゥー語、グジャラート語、タミル語、テルグ語、マラーティー語などの南アジア諸言語をサポートしています。
このベースモデルは33億5,000万のパラメータを含み、そのサイズと複雑さを示しています。Cohereは、ユーザーの指示により良く従うように調整された「TinyAya-Global」も発表しました。地域別のバリエーションも充実しており、アフリカ言語向けの「TinyAya-Earth」、南アジア言語向けの「TinyAya-Fire」、アジア太平洋、西アジア、ヨーロッパ向けの「TinyAya-Water」があります。
Cohereは声明で、「このアプローチにより、各モデルはより強固な言語基盤と文化的ニュアンスを発展させ、対象となるコミュニティにとって自然で信頼性のあるシステムを作り出すことができます。一方で、すべてのTiny Ayaモデルは広範な多言語カバレッジを保持しており、さらなる適応と研究のための柔軟な出発点となります」としています。
これらのモデルは、Nvidia製の64台のH100 GPUクラスターを用いて比較的少ない計算資源で訓練されており、ネイティブ言語を話すユーザー向けのアプリを開発する研究者や開発者にとって理想的だということです。また、デバイス上で直接動作可能で、オフライン翻訳を可能にするための基盤ソフトウェアが構築されています。
言語が多様な国々、例えばインドでは、このようなオフライン対応の機能が多様なアプリケーションやユースケースを開拓する可能性があります。
これらのモデルは、AIモデルの共有とテストのための人気プラットフォームであるHuggingFaceやCohereプラットフォームで入手可能です。開発者は、HuggingFace、Kaggle、Ollamaでダウンロードし、ローカルで展開することができます。Cohereはまた、HuggingFaceで訓練と評価のデータセットを公開し、訓練方法を詳述した技術報告書を発表する予定です。
スタートアップのCEO、エイダン・ゴメス氏は昨年、同社が「近いうちに」上場する計画があると述べました。CNBCによると、同社は2025年を好調に終え、年間繰り返し収益が2億4,000万ドル(約3,720億円)に達し、四半期ごとに50%の成長を遂げたとされています。
