AI動画生成スタートアップのLuma社は、テキスト、画像、動画、音声の一貫したクリエイティブ作業を担うLumaエージェントを発表しました。これは、同社の新しいAIモデル「Unified Intelligence」に基づいており、単一のマルチモーダル推論システムで訓練されています。
Lumaエージェントは、広告代理店、マーケティングチーム、デザインスタジオ、企業向けの新しい作業方法として提案されています。Luma社によれば、これらのエージェントはテキスト、画像、動画、音声を計画し生成する能力を持ち、LumaのRay 3.14やGoogleのVeo 3、ByteDanceのSeedream、ElevenLabsの音声モデルと連携することができるということです。
Luma社のエージェントは、Unified IntelligenceファミリーのAIモデルの最初のものであるUni-1モデルに基づいています。Amit Jain最高経営責任者によれば、このモデルは音声、動画、画像、言語、空間推論で訓練されており、「ピクセルの知性」と呼ばれる能力を持つとしています。
Jain氏は、既存の顧客であるPublicis GroupeやServiceplanなどの広告代理店、AdidasやMazda、サウジアラビアのAI企業Humain向けに新しいエージェントプラットフォームの展開を開始したと述べました。
Lumaエージェントは、資産や協力者、クリエイティブな反復の間で持続的なコンテキストを維持できる点で画期的だとJain氏は述べています。これにより、出力を評価し、自己批判を通じて結果を改善することが可能になるということです。
Jain氏は、現在のクリエイティブ環境でAIツールを使用するワークフローは、期待されるほどの利点を加速させていないと指摘しました。Lumaエージェントは、各イメージやアイデアの反復ごとにプロンプトを必要とせず、会話を通じて方向性を導くことができる点が異なるとしています。
このシステムはクリエイティブなワークフローを大幅に迅速化できるとされ、Jain氏は200語の概要と商品の画像から広告キャンペーンのアイデアを生成するデモンストレーションを行いました。
Lumaエージェントは現在APIを通じて公開されていますが、Luma社はユーザーが安定したアクセスを維持できるよう段階的に展開する方針です。
