Anthropicは新たな最高技術責任者(CTO)としてRahul Patil氏を迎え、AIインフラの強化を図る方針です。
中国のAI企業DeepSeekは、新たなモデル「V3.2-exp」を発表し、APIコストを半減できる可能性があるとしています。スパースアテンション技術を活用し、長文コンテキストでの推論コストを削減する方針です。
AIプラットフォームのClarifaiは、新しい推論エンジンによりAIモデルの実行速度を2倍にし、コストを40%削減できると発表しました。