アップルは、AIを活用したアプリ開発の効率化に向け、新たな研究を発表しました。インド政府によると、アップルの研究チームは、AIがユーザーインターフェース(UI)を生成する際の質を向上させるための新たな手法を模索しているということです。
数か月前、アップルの研究者チームは、AIを活用して機能的なUIコードを生成する方法に関する研究を発表しました。この研究では、AIが生成したコードが実際にコンパイルされ、ユーザーの要求に応じたインターフェースを提供することを重視しました。その結果、オープンソースモデルのUICoderが開発されました。
今回の新しい研究では、「デザイナーフィードバックを活用したユーザーインターフェース生成モデルの改善」というタイトルの論文が発表されました。研究者たちは、既存の人間のフィードバックを用いた強化学習(RLHF)手法が、デザイナーの作業フローと一致せず、UIデザインを改善するための豊富な理論を無視していると指摘しています。
この問題に対処するため、プロのデザイナーがAI生成のUIを批評し、改善するプロセスを導入しました。デザイナーがコメントやスケッチ、直接的な編集を行い、それらの変更をデータ化してモデルの微調整に利用しました。これにより、実際のデザイン判断を反映したレイアウトやコンポーネントを好むようにUI生成モデルを訓練しました。
研究には21人のデザイナーが参加しました。参加者のデザイン経験は2年から30年以上と様々で、UI/UXデザインやプロダクトデザイン、サービスデザインなどの分野で活動しています。研究者たちは1,460の注釈を集め、元のAI生成インターフェースとデザイナーによる改善版を対比させた「好み」例としてデータ化しました。
アップルは、Qwen2.5-CoderをUI生成の基盤モデルとして使用し、デザイナートレーニング済みの報酬モデルを新しいQwenバリアントに適用して、異なるモデルサイズとバージョン間での一般化をテストしました。研究者たちは、デザイナーのフィードバックに基づくモデルが、従来のランキングや評価データを用いたモデルよりも高品質なUIデザインを生成することを確認しました。
研究の結果、スケッチフィードバックで微調整されたQwen3-CoderがGPT-5を上回る性能を示しました。この結果から、少量の高品質な専門家のフィードバックが、小さなモデルでも大規模なLLMを上回るUI生成能力を持つことを示唆しています。
一方で、良いインターフェースの定義には主観性が関与するため、デザインの評価にはばらつきが生じるという課題もあります。デザイナーがスケッチや直接編集を行った場合、研究チームはその改善に同意することが多かったということです。
