Googleは、Pixel 10シリーズに搭載されるTensor G5について、同社のカスタムシリコンの大幅なアップグレードであると発表しました。
Tensor G5は、TSMCの最新3nmプロセスノードで製造されており、これによりCPUの平均速度が34%向上し、シングルおよびマルチスレッド性能で「大幅な向上」が見られるということです。Webブラウジング、アプリ起動、OSレンダリング、AI体験などの作業での応答性の向上が期待されています。
新しいチップには1つの高性能コア、5つの中性能コア、2つの効率コアが搭載されています。Googleはまた、ハードウェアとソフトウェアの熱制御を強化し、チップがスロットリングなしで高い周波数で動作できるようにしたとしています。Tensor G5は、LPDDR5Xによる高速メモリインターフェースとUFS 4.0による高速フラッシュストレージを備えています。
TPU(Tensor Processing Unit)は最大60%の性能向上を果たし、Tensor G5はDeepMindの最新Gemini Nanoモデルを実行します。これにより、Pixel ScreenshotsやRecorderなどの用途で「2.6倍の速度と2倍の効率」を実現します。G5は32Kトークンコンテキストウィンドウを持ち、昨年の12Kと比較して大幅に拡張されています。
Tensorチームは、DeepMindとの協力により、デバイス上のモデルの品質向上を図っています。G5はMatformer Model Architectureを活用し、より効率的にモデルを実行します。また、Per Layer Embeddingにより、モバイルデバイスのRAMの制約を考慮しながら、モデル応答の質を向上させます。
Tensor G5は、Magic Cue、Call Notes with actions、新しいJournalアプリ、Scam Detection、Gboard Smart Editなど、20以上のデバイス上のAI機能をサポートしています。Voice Translateでは、発話内容の翻訳に生成モデルと従来のオーディオMLモデルが並行して動作します。One-shot voice preservationにより、数秒のライブオーディオから話者の声の特徴を再構築することが可能です。プライバシー面では、音声登録やオーディオの保存は行われない方針です。
カスタムイメージシグナルプロセッサも強化され、特に低照度条件でのビデオ性能が向上しています。ISPはより詳細なシーンセグメンテーションを行い、領域やオブジェクトを理解します。これにより、Pixel 10はデフォルトで1080pと4K30での10ビットビデオの録画が可能です。モーションデブラーやReal Toneの改善も見られます。
カメラ面では、Tensor G5がAdd Me、Auto Best Take、100x Pro Res Zoomをサポートしています。後者は、約10億パラメータを持つGoogle最大のPixelカメラモデルです。これはアプリで初めてのディフュージョンモデルであり、TPUが大きな役割を果たしています。ただし、カメラパイプラインはチップのすべての部分(CPU、DSP、ISP)を活用しています。比較として、Pixel 8 ProのG3のズームは数万パラメータ、Pixel 9 ProのG4は数百万パラメータでした。(G5の能力のもう一つの例として、リアルタイム音声用途のための30億パラメータの多言語モデルがあります。)