https://www.itmedia.co.jp/news/articles/2401/23/news001.html
https://www.itmedia.co.jp/news/articles/2401/23/news001.html
2022年12月、筑波大学のキャンパスに“天馬”が舞い降りた。「Pegasus」(ペガサス)と名付けられたスーパーコンピュータ(スパコン)が稼働し始めたのだ。プロセッサやメモリなど当時の最新テクノロジーをつぎ込んで生まれたPegasusは、科学研究における使いやすさを最重視しながら、スパコンの省エネ性能を比べる世界ランキングで国内1位にも輝いた。
Pegasusは、筑波大学が世の中のどこにもないものをイチから作り上げたスパコンだ。その名前に、天翔る馬のような高速計算の意味を込め、力強く羽ばたく翼にビッグメモリを重ね合わせている。
Pegasusには米NVIDIAのGPU「NVIDIA H100 Tensor コア GPU」や米IntelのCPU「第4世代Xeon」、不揮発性メモリ「Optane」などの最先端テクノロジーが詰まっている。しかし、そのすごさは部品の性能だけではない。Pegasusのプロジェクトを率いた研究者と部品を提供したエヌビディア、構築や運用を担ったNECを取材した。
筑波大学が作るからには――“最適なスパコン”を生む土壌
Pegasusの礎を築いたのは、開発を担った筑波大学の計算科学研究センターだ。Pegasusの活躍が期待されているのは、宇宙物理学や素粒子物理学、生命科学、地球科学などの研究だ。大規模なシミュレーションやビッグデータの解析、AIなどの高度な計算が求められる「計算科学」分野での成果が見込まれている。
「計算科学研究センターは、使う側の研究者と作る側の研究者が議論をしてスパコンを作り上げています。市場から既製品を購入するのではなく、用途に合わせて計算の効率化や価格性能比を追求するのです。独自の視点と最先端のテクノロジーを取り入れることで計算が進み、ひいては計算科学の研究が前進します。それを目指して研究と運営を続けています」――筑波大学 計算科学研究センターの朴泰祐教授(センター長)は話す。
朴教授は、使う側と作る側が融合した体制を「コ・デザイン」(協調設計)というコンセプトで表現する。研究者のニーズを踏まえてスパコンを設計し、アプリケーションの調整まで共同で行うことで研究成果につながる最適なスパコンを作れるという思想だ。
コ・デザインの姿勢はセンター名に表れている。スパコンを運用している国内大学の多くは「基盤センター」という位置付けで、調達した計算能力を提供することがミッションだ。一方で、筑波大学は「研究センター」を名乗っており、研究のためのスパコンを運用し続けている。
計算が速い「頭でっかちなスパコン」が正解ではない
スパコンの性能は「FLOPS」(フロップス)という指標で表すことが多い。FLOPSは、コンピュータが1秒間に処理できる浮動小数点演算の回数を示す単位だ。これを基にしたスパコンの世界ランキング「TOP500」の結果が新聞をにぎわすこともある。しかし、コ・デザインの考え方の下で科学研究に寄り添う筑波大学にとっては、TOP500を目指してスパコンを開発することが正解ではない。
同センターでPegasusの設計を担った建部修見教授は、TOP500に名を連ねる最近のスパコンは「計算速度だけを追求するあまり、頭でっかちになっている」と指摘する。計算速度はずばぬけて速いが、1ノード当たりのメモリ容量やストレージ性能が足りず、扱える問題が限られてしまうのだ。
計算科学はビッグデータの解析など大量のデータを処理する必要がある。そのためには大規模なメモリ空間やGPUのような演算加速装置が欠かせない。建部教授らはやみくもに速さを極めるのではなく、研究者が使いやすく、研究に役立つスパコンを第一に掲げて開発に挑んだ。
世界に1台だけのPegasus 採用した最新テクノロジーの数々
Pegasusのプロジェクトが動き出した20年ごろ、技術的なブレークスルーが次々に起きた。GPUの性能が飛躍的に向上した上に、超高速かつ大容量のメモリ空間を構築できる不揮発性メモリが実用段階に入ったのだ。
「高速なGPUと最新のCPU、不揮発性メモリ、次世代のネットワーク技術が計算科学のニーズにとてもマッチすると考えました」(建部教授)
Pegasusは120台の計算ノードで構成されていて、理論ピーク性能は6PFLOPS(ペタフロップス)を超える。各ノードには、NVIDIAが22年に発表した世界トップクラスの演算性能を誇るHPC向けGPUのNVIDIA H100 Tensor コア GPUと、Intelが23年に発表したCPU「第4世代Xeon スケーラブル・プロセッサー」(Sapphire Rapids)を搭載している。
さらにIntelが23年に展開した不揮発性メモリ「インテル Optaneパーシステント・メモリー300シリーズ」を採用してメモリ容量の問題を解決した。これらの構成要素をつなぐネットワークに、通信速度が200Gbpsの「NVIDIA Quantum-2 InfiniBand プラットフォーム」を導入することで処理速度を向上させている。
「どれか1つの部品の性能が良いからといってスパコンの性能につながるわけではない」と話すのは、エヌビディアの愛甲浩史氏(エンタープライズ マーケティング マーケティングマネージャー)だ。そこで同社は、GPUに限らずネットワークやソフトウェアなどとハードウェアとの親和性を重視して、顧客ニーズに合うものを提案している。
ビジネスPCと同じように、高性能のGPUがあってもメモリ容量が小さければユーザー体験を損ねてしまう。TOP500で1位になったスパコン「富岳」の場合は、1ノード当たりのメモリ容量が32GBと小さく、昨今の大きな問題サイズに対しては細かく多数のノードにまたがった処理が必要になり、ノード間通信で大きなオーバーヘッドが発生してしまう。しかし、Pegasusは各ノードに約2TBの不揮発性メモリを搭載しているため、データを並列化せずに計算できる。これが計算科学を支えるシミュレーションやAIに適している。
コ・デザインの思想で研究者のニーズを聞きながら適切なパーツを組み合わせることで、必要な計算を効果的に実行できるPegasusが誕生した。朴教授は、最新世代の不揮発性メモリを搭載したスパコンはPegasusが世界初だと誇らしげに説明する。
「2%の壁」を乗り越えて日本一になれたワケ
Pegasusがその名を世界にとどろかせたのは、TOP500に並ぶスパコンの世界ランキング「Green500」で国内1位、世界12位にランクインしたときだ。Green500は、消費電力1W当たりの計算性能を比較するもので、省エネ性能とも言い換えられる。Pegasusは1W当たり41.12GFLOPS(ギガフロップス)を達成して、日本一に輝いた。
Green500における快挙には、電力効率がいいH100が大きく貢献した。その力を引き出せたのは、システム全体の構築を担当したNECの功績があると建部教授は振り返る。ベンチマークのスコアを上げるだけなら、それに特化したシステム構築にすればいい。しかし、そのシステムが計算科学にとって使いやすい構成とは限らない。それでは計算科学の研究を一番に掲げる計算科学研究センターの理念に反する。
NECは、実用的なスパコンを作りながら世界トップクラスの性能を追い掛けるという難しい局面に立たされた。システムの構築が大詰めを迎えたタイミングでも、数%の性能向上を目指して奮闘した。
「当初、日本一に数%届いていませんでした。『あと2%足りない。何とかしてほしい』という宿題に対して建部教授とNECが周波数に至るまで徹底的に調整するなど、最後の数%を上げるために相当な努力をした結果です」(朴教授)
当時、NECがPegasusの調整に使えたのは月に一度のメンテナンスの時間だけだった。そこで結果を出さなくてはならず、NECの三宅健太氏(官公ソリューション事業部門 文教・科学ソリューション統括部)は「筑波大学さまの構想は特徴的でチャレンジングです。当社としても挑戦が必要で、いいことも難しいこともあり、関係者全員で乗り越えました」と振り返る。
飛び立ったPegasusが見つめる未来
コ・デザインの思想を体現するPegasusは、22年12月に稼働し始めた。GPUやCPU、メモリ、ネットワークなどが協調し、ユーザーファーストかつサイエンスファーストで誰が使っても一定の性能が出る仕組みを実現した唯一無二のスパコンだ。建部教授は「極めて良くできた」と高く評価する。
「どのパーツも素晴らしいものです。それらの良いところを組み合わせることでスパコンが成り立ちます。筑波大学と一緒になって、各パーツの性能を最大限に引き出す設計と構築を行うのがNECの役割でした」――NECの永谷公学氏(インフラテックセールス統括部 テックパートナー共創推進グループ)はこう説明する。
Pegasusを作る上で、計算科学の視点で研究者が使いやすいシステムを掲げ、省電力も見捨てず、最終的にスイートスポットとなる性能を追求した。朴教授は「私たちはワガママなんですよ」と笑うが、筑波大学とエヌビディア、NECという異なる立場の者たちが妥協せずに同じ目標を目指したからこそ完成したのだ。
「NECに感謝している」と話すのはエヌビディアの岩谷正樹氏(ネットワーキングプロダクトマーケティング ネットワーキング ディレクター)だ。エヌビディアは直販していないため、筑波大学に真剣に向き合ってニーズを的確にヒアリングして伝えてくれるNECは重要なパートナーなのだ。
NECは、筑波大学からの信頼も厚い。建部教授は「Pegasusは新しいテクノロジーを使っているので、世界で初めてのトラブルもたまに発生します。それをNECにきちんと対応していただきました」と明かす。
「NECは、最大の成果を最小のコストで実現してくださいました。また、19年に運用を始めたスパコン『Cygnus』(シグナス)もNECが手掛けていることは広く知れ渡っています。それはNECの真摯(しんし)な姿勢があるからです。現場を安心して任せられます」(朴教授)
Pegasusの背中に乗ったNECは、新しいテクノロジーに触れ、さまざまな「世界初」を経験した。この貴重な経験を、他の学術研究機関や一般企業に横展開することで国内の研究開発やビジネスを加速させていきたいと同社の三宅氏は意気込む。
Pegasusはいま、空高く飛ぼうとしている。これから、研究者やベンダーがどのような未来に駆けていくのか、いまから楽しみだ。
Copyright © ITmedia, Inc. All Rights Reserved.
提供:日本電気株式会社
アイティメディア営業企画/制作:ITmedia NEWS編集部/掲載内容有効期限:2024年3月22日
0 コメント:
コメントを投稿