2021年7月30日金曜日

NVIDIAがHPC市場に投入するDPU「BlueField」の役割 SmartNICとは違うのか?

https://techtarget.itmedia.co.jp/tt/news/2107/13/news05.html
シェアしました。

GPUベンダーとしての確固たる地位を築いてきたNVIDIAが、AI技術分野での存在感を高めている。同社がAI処理などを担うサーバ向けの新たなアクセラレータとして提供するのが「DPU」だ。

[渡邉利和著]

関連キーワード

ビッグデータ | ビジネスPC | 機械学習 | サーバ

 NVIDIAはGPU(グラフィックス処理ユニット)の供給元という立場から、AI(人工知能)技術の分野に軸足を移しつつある。AI技術の発展に必要な技術要素を積極的に集積する企業へとその姿を変貌させている。AI技術の先には、次の時代のHPC(高性能コンピューティング)の姿も見え始めているようだ。

 かつてスーパーコンピュータのプロセッサとして主流だったベクトルプロセッサ(注1)は、2021年現在、その役割をほぼGPUに譲っている。スーパーコンピュータではスカラープロセッサ(CPUなど一般的なプロセッサ)とGPUの組み合わせが主流になっている。スカラープロセッサベンダーの選択肢はまずIntel、次いでAMD(Advanced Micro Devices)、さらにArmへと段階的に拡大してきた。Armのプロセッサは、もともと従来型携帯電話(フィーチャーフォン)やスマートフォンの市場でシェアを拡大した。その後順調に処理性能の向上を果たし、計算速度を競う「TOP500」などの処理性能ランキングでトップクラスに入るスーパーコンピュータがArmのプロセッサを採用する事例も見られるようになってきている。

※注1:ベクトルプロセッサは演算処理をパイプライン化し、1つの命令(インストラクション)で複数のデータを同時に扱う。

 Arm買収を発表しているNVIDIAは、2020年4月に高速ネットワーク技術を持っていたMellanox Technologiesを買収した。MellanoxはHPC分野の標準的なインターコネクト技術だった「InfiniBand」で知られるベンダーだ。Armの買収は本稿執筆時点で完了していないため不確定要素が残る状況ではあるものの、NVIDIAはHPCシステムの主要構成要素を1社で提供できる、圧倒的な地位を確立しつつある状況なのだ。

NVIDIAが生み出した「DPU」の正体

 2021年4月中旬にNVIDIAが開催したプライベートイベント「NVIDIA GTC 2021」で、同社の創業者でありCEOのジェンスン・フアン氏はさまざまな新たな取り組みを発表した。フアン氏は「データセンターがコンピューティングの新たな単位となる」(Data Center is the new unit of computing)というコンセプトを強調した。これを実現する上で大きな役割を果たすのが、GPUに次ぐ新たなアクセラレータチップ「DPU」(Data Processing Unit)だ。

 NVIDIAはDPUを「NVIDIA BlueField DPU」(以下、BlueField)という製品名で提供している。フアン氏はBlueFieldの新製品として「BlueField-2」の提供開始を発表すると同時に、BlueFieldの開発計画を明らかにした。次世代の「BlueField-3」は2022年に、「BlueField-4」は2024年頃に市場に投入する。各製品の特徴は次の通り、段階的に大幅な性能向上を果たす計画だ。

  • BlueField-2
    • トランジスタ数:70億個
    • 処理性能:9SPECint(注2)、0.7TOPS(注3)
    • データ転送速度:200Gbps
  • BlueField-3
    • トランジスタ数:220億個
    • 処理性能:42SPECint、1.5TOPS
    • データ転送速度:400Gbps
  • BlueFiled-4
    • トランジスタ数:640億個
    • 処理性能:160SPECint、1000TOPS
    • データ転送速度:800Gbps

※注2:「SPECint」は業界団体SPEC(Standard Performance Evaluation Corporation)が定める処理性能のベンチマーク。

※注3:「TOPS」は「Trillion Operations Per Second」(1秒間に1兆回の処理)の略。

 トランジスタ数が指数関数的に増えることを予測した「ムーアの法則」の限界が見え始め、CPUはかつてほどの処理性能の向上が見込めなくなりつつある。そのCPUに代わり、用途特化型のアクセラレータが急速な進化を遂げることで、システム全体としての処理性能は順調に向上する見込みだ。

 BlueFieldは、Mellanoxが開発した「SmartNIC」がベースとなっている。同社の関係者によれば、実際にBlueField-2のハードウェア部分はMellanoxのSmartNICそのものという話だ。MellanoxのSmartNICはNVIDIAが買収する前の2018年6月、国内で開催された「Interop Tokyo 2018」で「Best of Show Award」を受賞し、注目を集めた。SmartNICとはその呼び名の通り、一般的にはNIC(ネットワークインタフェースカード)のコントローラーに付加価値としてソフトウェア実行機能を追加する、という位置付けの製品を指す。

 MellanoxはInfiniBandやその技術を応用した「高速イーサネット」のスイッチなどを主力製品としていたベンダーであり、ネットワークの高速化技術で業界をけん引してきた。その同社が、新たな取り組みとして“NICのスマート化”に取り組んだ成果がSmartNICだった。NVIDIAは2020年4月のMellanox買収から1年を経て、その製品コンセプトをブラッシュアップした。コントローラーチップを搭載した単なる付加価値付きのNICではなく、システム(サーバ)の入り口で処理を一部オフロードするアクセラレータとして位置付けを変更するとともに、呼び名をDPUに変更した形だ。

CPUの負荷をオフロード

 BlueFieldの基本的な構造は、NICのコントローラーにArm製のコアを追加したものだと考えてよいだろう。Armコアを採用したのはMellanox時代の決定だが、その後のNVIDIAによるArm買収の方針とも見事に合致している。BlueFieldで既にArmコアを活用していることが、NVIDIAがArm買収に踏み切る意思決定に影響を与えた可能性さえ考えられる。

 DPUとしてのBlueFieldの役割は、外部との接続点となるNICにプロセッサを配置することで、サーバに入ってくるデータの処理負荷をCPUからオフロードできる点にある。具体的には、現在では活用が一般化しつつある仮想ネットワーク関連の処理やセキュリティのための処理などだ。

 スーパーコンピュータなどHPC分野で利用する端末もインターネットに接続し、クラウドサービスのように利用することが珍しくなくなってきている。これは運用効率を高めるための取り組みの一環だ。ただしセキュリティの懸念もある。実際にスーパーコンピュータが不正アクセスされ、暗号資産(仮想通貨)のマイニングに使われた例もあるという。一方で不正アクセスを防ぐためにセキュリティを強化しようとすると、その処理の負荷をプロセッサに与えてしまう。本来のデータ処理に専念させたいプロセッサの処理性能を、セキュリティのために浪費してしまう形だ。

 DPUはセキュリティの処理をプロセッサからオフロードすることで、システム全体の効率を向上させることができる。入ってきたパケットを精査してCPUやGPUで処理しやすい形に前処理を実施するなどの活用も考えられる。GPUが大規模な並列処理に適したアクセラレータだとすれば、DPUは高速ネットワークから流れてくるパケットを、ワイヤスピード(NICやケーブルが採用するネットワーク規格の理論的な最大通信速度)で次々と処理していくストリーミング処理に特化したアクセラレータだと位置付けてよさそうだ。


0 コメント:

コメントを投稿