2022年1月24日月曜日

AI時代を支えるNVIDIA【後編】CPU「Grace」の発表に見え隠れする、“GPUの覇者”NVIDIAの本当の狙い

NVIDIAを単に“GPUベンダー”と呼ぶことはもはやできない。CPUの処理をオフロードする「DPU」に加えて、同社製CPU「Grace」を発表した。その狙いと、これまでのCPUとの違いを紹介する。

[渡邉利和著]

関連キーワード

ビッグデータ | ビジネスPC | 機械学習 | サーバ

 中編「NVIDIAがHPC市場に投入するDPU『BlueField』の役割 SmartNICとは違うのか?」で紹介した通り、NVIDIAは買収したMellanox Technologiesの「SmartNIC」ベースのDPU(Data Processing Unit)「BlueField」シリーズを提供している。NVIDIAがAI(人工知能)技術やHPC(高性能コンピューティング)分野で打ち出す新たな取り組みはこれだけではない。

 Mellanox時代との大きな違いとして、ソフトウェア開発フレームワーク「DOCA 1.0」の存在が挙げられる。これはNVIDIAが「GPGPU」(General-Purpose Computing on GPU)向けに整備した開発環境およびプログラミングモデル「CUDA」の経験を踏まえた取り組みだ。GPGPUとは前編「GPUベンダーから“AIの会社”に変貌 NVIDIAの歴史とこれから」で紹介した通り、GPU(グラフィックス処理ユニット)をグラフィックス処理以外の汎用(はんよう)計算に用いることを指す。

 DOCA 1.0は、NVIDIAがネットワークやセキュリティ関連などさまざまなソフトウェア技術を持つパートナーと協力し、DPU活用を強力に推進するエコシステム(関連製品・技術群)を構築する土台になる。2021年4月にDOCA 1.0の提供が開始したばかりではあるが、DPUとDOCA 1.0の周りには既にそうそうたる企業が集まっており、DPUを活用したCPUのオフロードが急速に一般化する可能性がありそうだ。NVIDIAは同社が提供するAI技術向けコンピュータ「NVIDIA DGX」にもBlueFieldを搭載することを発表しており、これもDPUの活用を広げる一因になるだろう。

GPUの足を引っ張らないCPU「Grace」の実力

 2021年4月中旬にNVIDIAが開催したプライベートイベント「NVIDIA GTC 2021」の基調講演で、同社はDPUの他に新たなCPUも発表した。それが「NVIDIA Grace」(以下、Grace)だ。これは端的に表現するなら「ArmベースのNVIDIA製CPU」ということになる。NVIDIAの表現を借りれば「大規模のAI技術およびHPC向けに設計されたCPU」だ。NVIDIAは、DPUがCPUの処理負荷をオフロードする新たなアーキテクチャであることと同様に、Graceについても既存のCPUのアーキテクチャの課題を解決するための次世代アーキテクチャとして位置付けている。

 GPUはAI技術やHPCで極めて有用なアクセラレータとしての利用が拡大している一方で、NVIDIAは「GPUの性能をフルに生かすためにはCPUがボトルネックになりつつある」と指摘する。データを置くメインメモリとGPUの間にCPUが位置し、メモリからGPUへとデータを転送するのが現時点での一般的なアーキテクチャになっている。これではGPUの処理速度にデータ転送が追い付かないというわけだ。

 そこでNVIDIAが新たに考えたアーキテクチャでは、CPUの機能を小さく分割してより少量のメモリを担当させ、CPUとGPUを接続する。さらにデータ転送速度を重視した設計にすることによって、処理効率を引き上げることを想定している(図)。これがGraceの基本になるアーキテクチャだ。ある意味では、CPUをGPUのための「データ転送エンジン」として位置付け直す逆転の発想と言える。

 Graceの提供開始は2023年初頭になる見込みだ。既に市場で圧倒的な支持を得ているNVIDIA製GPUにMellanox由来のDPUと高速インターコネクト、さらにデータ転送のボトルネックを解消するCPUとしてGraceが加わると、HPCシステムの中核要素がほぼ全てNVIDIA製品で実現できる形になる。

画像図 Graceを使ったコンピューティングのアーキテクチャ(LPDDR5X、HBM2Eは共にメモリ規格)

 GPUという特定用途に特化したプロセッサのベンダーという立ち位置だったNVIDIAが、AI技術という新たな用途を得たことでその事業領域を大きく拡大させた。そして今や次世代のHPCシステムのための新たなシステムアーキテクチャを提案し、それを自社製品で実現できる体制を整えるに至っている。今後のコンピューティングアーキテクチャの進化をけん引する存在として、NVIDIAの存在感が急速に高まっているのは間違いない。

 問題があるとすれば、現在市場でのGPU等のニーズの高まりに応えるだけの製品供給が難しくなっている点が挙げられる。特にGPUに関しては、世界的な半導体供給不足や暗号資産(仮想通貨)のマイニング用途で利用拡大などの影響もあり、市場では奪い合いに近い状況にもなっていると聞く。安定的に十分な量の製品を供給できるかどうかは、ラージエンタープライズ(大企業)市場やトップエンドのHPC市場などでは重視されるポイントの一つだと考えられる。

- PR -

注目の情報

Amazonギフト券(3000円分)が当たる、「業務自動化とRPA」に関するアンケート

簡単なアンケートにご回答いただいた方の中から抽選で10名にAmazonギフト券(3000円分)をプレゼントします。ぜひご回答ください!

新着ホワイトペーパー

製品資料日本ビジネスシステムズ株式会社

クラウドの普及でデータ管理/運用が困難に、ストレージは今どう変わるべきか?

マルチクラウドや高度な分析の普及でデータが急増する中、従来型ストレージの限界が露呈している。データを消費するワークロードとのギャップを埋め、ハイブリッド環境でもスマートにデータを管理/運用するには、どうすればよいのか。

製品資料日本ビジネスシステムズ株式会社

止められないアプリケーション運用、ストレージが工数を大きく左右する理由

アプリケーションの高度化は、それを支えるITインフラの運用負荷も高めている。その工数を大きく左右するのが、進化が目覚ましいストレージだ。問題の予測をストレージからアプリケーションまで拡張するなど自己管理機能がさらに向上した。

事例日本ヒューレット・パッカード合同会社

データ/計算科学で先端DX人材を育成、兵庫県立大学が選んだ新スパコンシステム

AIや機械学習を用いた教育研究を行い、社会課題の解決などに貢献する先端DX人材の育成に取り組む、兵庫県立大学大学院の情報科学研究科。その研究活動に不可欠なビッグデータの収集・分析などを行うために選ばれた、新たな計算機環境とは?

製品資料エレコム株式会社

重複排除で容量とバックアップ時間を効率化、事例に見る高性能NASの実力

企業が扱うデータ量の増大に伴う形で浮上する、ストレージの容量不足。この問題を解決するために導入したNAS製品により、さらに高パフォーマンス化や低コスト化も実現した企業の事例を紹介する。

技術文書アイティメディア株式会社

SSDでRAIDを組む意味はあるのか?

RAIDは重要な技術であり続けた。だが、SSDでもRAIDは有効なのか。使うべきなのか。結論としては有効だが、HDDと同じ設計で使ってはならない。

0 コメント:

コメントを投稿