2024年1月31日水曜日

さくらインターネット、生成AIのニーズに向けてNVIDIA H100 GPUのベアメタルクラウド「高火力 PHY」を発表 2024年1月24日(水)日川 佳三(IT Leaders編集部)

https://it.impress.co.jp/articles/-/25870

https://it.impress.co.jp/articles/-/25870

さくらインターネットは2024年1月24日、生成AI向けベアメタルクラウドサービス「高火力 PHY(ファイ)」を発表した。同社の石狩データセンターで同年1月31日から提供する。生成AIの用途で需要が大きい「NVIDIA H100 Tensor コア GPU」をサーバー1台あたり8基搭載している。料金(税込み)は月額304万6120円(最低利用期間は2カ月)で、1年契約で月額274万1508円、3年契約で月額243万6896円に減額される。今後、時間単位など他の課金体系の提供を検討している。

 さくらインターネットの「高火力」シリーズは、AI用途を想定したGPUベースのクラウドサービスである。石狩データセンター(北海道石狩市、写真1)で提供する。今後3年間で130億円規模を投資し、半精度(AI用途)の浮動小数点演算で合計2EFLOPS(エクサフロップス)に相当する計算資源を構築することを発表している(関連記事さくらインターネット、AI用途を想定したGPUクラウドサービスを2024年1月以降に開始)。

写真1:「高火力」シリーズのサービス提供基盤を運用する石狩データセンターの外観(出典:さくらインターネット)
拡大画像表示

 昨今の生成AIのメガトレンドを踏まえて、物理サーバーリソースをクラウドライクに提供するベアメタルクラウドサービス「高火力 PHY(ファイ)」を2024年1月31日から提供開始する。

 GPUに生成AI用途で需要が大きい「NVIDIA H100 Tensor コア GPU」(SXM接続版)を採用し、サーバー1台あたり8基搭載する。また、サーバー間通信は200GbE(ギガビットEthernet)4回線など、大規模言語モデル(LLM)/生成AIの利用を想定した仕様でベアメタルサービスを提供する。

 GPUの処理性能は、GPUメモリー80GB/TF32 Tensorコアで989TFLOPS、同/BFLOAT16 Tensorコアで1979TFLOPSなど。なお、メインメモリー容量は2TB、CPUはIntel Xeon Platinum 8480+2個、OSはUbuntu Server 22.04 LTS(表1)。

表1:「高火力 PHY」の概要(出典:さくらインターネット)
CPUIntel Xeon Platinum 8480+ ×2
コア数(1CPUあたり)112(56)
GPUNVIDIA H100 SXM 80GB×8
メインメモリー容量2.0TB
ローカルディスク(NVMeSSD)OS用400GB×2(RAID1構成)
ローカルディスク(NVMeSSD)非OS用7.68TB×4
グローバル回線(標準)100Mbit/s
ローカル回線
(専用サーバーPHYサービスネットワーク)
4GbE(2Gbit/s×2)
ローカル回線 インターコネクト
(広域ロスレスネットワーク)
200GbE×4
電源冗長対応

 料金(税込み)は月額304万6120円(最低利用期間は2カ月)で、1年契約で月額274万1508円、3年契約で月額243万6896円に減額される。今後、時間単位など他の課金体系の提供を検討している。

 さくらインターネットは、石狩データセンターが再生可能エネルギー100%で運営することから、CO2排出量ゼロを実現しながら生成AIの開発に取り組めることをアピールしている。

0 コメント:

コメントを投稿