NVIDIA Vera Rubinアーキテクチャ、推論コスト10分の1削減の次世代AIスーパーコンピューター公開

NVIDIAは、次世代AIスーパーコンピュータプラットフォーム「Vera Rubin」を発表した。Blackwellと比較して推論性能を5倍、トークンあたりのコストを10分の1に削減することを目標としている。2026年下半期の発売を予告し、AIコンピューティングの新たな基準を示す。

CES 2026で発表されたVera Rubinプラットフォームは、合計6つの新規チップで構成される。NVIDIAの公式発表によると、Rubin GPUとVera CPUを組み合わせたNVL72ラックスケール構成が核心である。この構成は、72個のGPUを1つのシステムとしてまとめ、大規模AIモデルの推論作業を処理する。特に注目すべき点は経済性である。Tom’s Hardwareの報道によれば、Blackwellアーキテクチャと比較してトークンあたりのコストを10倍削減できるという。AIサービス運営企業にとって、推論コストは最大の負担の一つであるが、この数値が実現すれば業界全体に大きな波及効果が予想される。Vera CPUはARMベースのアーキテクチャを採用し、電力効率も改善した。NVLink第6世代インターコネクトを通じて、GPU間の通信帯域幅も大幅に拡大された。NVIDIAブログは、Rubinプラットフォームが自動運転、オープンモデル生態系まで網羅する青写真の一部であると説明した。単なるハードウェア性能向上にとどまらず、AIインフラ全体を再設計しようとする戦略が垣間見える。

Vera Rubinの登場は、AI産業のコスト構造を根本的に変える可能性がある。推論コストが実際に10倍削減されれば、中小企業も大規模AIサービスを運営できる時代が開かれる。もちろん、実際の性能は発売後の検証が必要であるが、NVIDIAのロードマップが業界標準を再び再編することは明らかである。下半期発売後、クラウドサービス業者の導入速度が鍵となるだろう。

FAQ

Q: NVIDIA Vera Rubinはいつ発売されるか?

A: NVIDIAは2026年下半期の発売を予告した。正確な月はまだ公開されていない。

Q: Blackwellと比較してどのような点が改善されたか?

A: 推論性能が最大5倍向上し、トークンあたりのコストは10分の1程度に削減される。NVLink第6世代とARMベースのVera CPUも新たに導入された。

Q: Vera Rubin NVL72構成とは何か?

A: 72個のRubin GPUを1つのラックスケールシステムとして統合した構成である。大規模AIモデルの学習と推論を1つのシステムで処理できるように設計された。

コメントする