AI技術の進化において、特にコード生成ツールの進化が著しいとインド政府が発表しました。GPT-5やGemini 2.5の登場により、新たな開発者向けの自動化技術が可能となり、先週にはSonnet 2.4もその進化を示しました。
一方で、他のスキルの進化は緩やかです。AIを利用してメールを書く場合、1年前と同様の価値しか得られないことが多いということです。特に、複数のタスクを同時に行うチャットボットでは、モデルが改良されても製品自体の向上が見られないことがあります。
この進化の差は、強化学習(RL)が大きな役割を果たしているということです。コード生成アプリは、数十億回のテストを通じて強化学習を行い、実用的なコードを生成する能力を向上させています。強化学習は、明確な合否基準がある場合に最も効果的であり、人間の介入を必要とせずに何度も繰り返すことができます。
強化学習に適したスキル、例えばバグ修正や競技数学は急速に進化していますが、文章作成のようなスキルはわずかな進化にとどまっています。ソフトウェア開発は強化学習に最適な分野とされています。AI以前から、ソフトウェアの耐久性をテストするためのサブディシプリンが存在し、AI生成コードの検証にも役立っています。
一方で、メールやチャットボットの応答を検証する簡単な方法は存在しません。これらのスキルは主観的であり、大規模に測定するのが難しいということです。しかし、すべてのタスクが「テストしやすい」または「テストしにくい」に明確に分類されるわけではありません。
AI生成ビデオのように、以前は「テストしにくい」と考えられていたプロセスも、OpenAIの新しいSora 2モデルの進化により、テストが可能であることが示されました。Sora 2では、物体が突然現れたり消えたりせず、顔は特定の人物のように見え、物理法則を尊重する映像が生成されます。
強化学習がAI開発の中心的役割を果たしている限り、「強化学習格差」は広がり続けるということです。この格差が、スタートアップや経済全体に重大な影響を与える可能性があります。特に、どの医療サービスが強化学習に適しているかは、今後20年間の経済の形を大きく左右することになります。