NVIDIAのGB300 NVL72、Hopper比でワットあたり推論性能50倍、1百万トークンあたりコスト35倍削減
NVIDIAのGB300 NVL72プラットフォームは、Hopperプラットフォーム比でAI推論性能に大幅な世代間向上を実現し、ワットあたり性能が50倍向上、1百万トークンあたりのコストが35倍低減します。
NVIDIAは、最新のGB300 NVL72システムによりAI推論性能の最前線に位置づけられ、前世代のHopperプラットフォームに対して大幅な世代間進化を実現しました。この新プラットフォームは、ワットあたりの性能を50倍向上させ、1百万トークンあたりのコストを35倍削減し、大規模AI展開をより効率化します。
推論とは、訓練済みAIモデルを実行してテキストや画像などの出力を生成するプロセスで、生成AIアプリケーションを支えるデータセンターの重要なワークロードです。NVIDIAのHopperプラットフォームはH100 GPUを代表としてこれまで高いスループットを誇っていましたが、GB300 NVL72は72基のGrace Blackwell SuperchipをNVLink高速インターコネクトで接続したラックスケール構成により、さらなる飛躍を遂げています。
ワットあたりの性能が50倍向上した点は、NVIDIAのエネルギー効率への注力を示しており、AIインフラがエクサスケールへ拡大する中で電力消費の比例増加を防ぎます。この指標によりデータセンターは持続可能性の課題に対処しやすくなります。同様に、1百万トークンあたりのコスト35倍削減は、総所有コストを最適化し、エンタープライズやクラウドプロバイダーにとって先進AIを経済的に実現可能にします。
これらのベンチマークにより、GB300 NVL72は次世代AIファクトリーの基盤となります。NVIDIAはHopperからBlackwellベースのシステムへの継続的なGPUアーキテクチャ革新により、未曾有のスケールでAI推論を加速するリーダーシップを維持しています。
重要ポイント
- ワットあたり性能50倍向上
- 1百万トークンあたりコスト35倍低減
- GB300 NVL72がHopperプラットフォームを上回る
- NVIDIAが推論性能でリード
