アップルは、AIを活用した開発がワークフローの改善、品質向上、生産性の向上に寄与する可能性を示す3つの研究を発表しました。
まず、ソフトウェアの欠陥予測に関する研究では、アップルの研究者が「ADE-QVAET」と呼ばれる新しいAIモデルを提案しました。このモデルは、現代の大規模言語モデル(LLM)の限界を克服し、大規模なコードベースを分析してバグを検出・予測することを目的としています。ADE-QVAETは、適応型差分進化(ADE)、量子変分オートエンコーダ(QVAE)、トランスフォーマーレイヤー、適応型ノイズ削減および増強(ANRA)の4つのAI技術を組み合わせて、バグ予測の精度を向上させるということです。
研究者によると、このモデルはソフトウェアバグ予測用に作成されたKaggleデータセットでの性能測定において、訓練データの90%を使用した場合、98.08%の高精度、92.45%の精度、94.67%の再現率、98.12%のF1スコアを達成したとしています。
次に、ソフトウェアテストのための「Agentic RAG」というシステムでは、LLMと自律AIエージェントを利用してテスト計画や検証レポートを自動生成・管理し、要件、ビジネスロジック、結果の間の完全なトレーサビリティを保つことができるとしています。このシステムは、品質エンジニアが基礎的なテストアーティファクトの作成に費やす時間を大幅に削減する方針です。
最後に、「SWE-Gym」というシステムでは、AIエージェントが実際のコードを読み、編集し、検証する能力を持つように訓練することを目指しています。SWE-Gymは、11のオープンソースリポジトリからの2,438の実際のPythonタスクを使用して構築されました。このシステムにより、エージェントが現実的な条件下でコードの作成とデバッグを練習することが可能です。
これらの研究は、アップルの機械学習研究ブログで公開されています。
