https://special.nikkeibp.co.jp/atclh/NXT/23/delltechnologies1027/
https://special.nikkeibp.co.jp/atclh/NXT/23/delltechnologies1027/
サーバーの熱設計に注目が集まっている。熱設計とは、CPUやGPUなどのプロセッサーが発する熱を冷却するための、シャシー(筐体)設計のこと。排熱するファンやエアフロー(排熱のための風の通り道)をどう確保し、いかに冷却するか――。これはCPUやGPUの性能を左右し、引いてはシステムのパフォーマンスにも大きく影響するという。こうした観点から、いち早く高効率な熱設計に注力し続けて来たのがデル・テクノロジーズだ。ここでは2023年9月末に開催された「日経クロステックNEXT東京 2023」で行われた講演を基に、同社のサーバーの熱設計に関する取り組みを紹介したい。
なぜ「熱設計」がx86サーバーの大きな差別化ポイントとなるのか
データセンター ソリューションズ事業統括
製品本部 シニアプロダクトマネージャー
岡野 家和氏
サーバーの熱設計には、CPUやGPUを冷やすためのファンを使って冷却する「空冷」、CPUやGPUのヒートシンクに液体が通っているパイプを通じて熱をラジエーターに移動することで冷却する「水冷」や「液冷」、さらには最近ではサーバー機器を液体の中に直接漬けて冷却する「液浸」など様々な方式がある。
この熱設計が注目される背景にあるのは、高性能なCPUやGPUなどの進化だ。サーバー機器に搭載されているCPUやGPUはパフォーマンス向上とともに消費する電力が年々増加しており、それに伴って発生する熱量が年々増加している。
サーバーはCPUやGPUが発熱することで、内部の温度が上昇する。この温度上昇は、サーバーの性能を低下させたり、故障やダウンの原因になったり、あるいは製品寿命を短くする可能性がある。つまり、サーバーの稼働を安定させるには、排熱効果を高めることが不可欠となるわけだ。さらに、最近ではサステナビリティの観点からも消費電力の抑制は重大な社会ニーズとなった。こうしたことから、「いかに高度な熱設計を施せるか」がサーバーベンダーの“腕の見せ所”となっているという。
「x86アーキテクチャのサーバー機器は、どこのメーカーも同じような性能だといわれることが少なくありません。しかし、実は熱設計周りには大きな差があり、そこが大きな差別化のポイントになっています」とデル・テクノロジーズの岡野 家和氏は述べる。
特に現代のCPUの性能は、この熱設計に大きく依存する。CPUはシステム側の排熱に余裕があり、もう少し熱を出しても大丈夫と判断した場合には、より高いクロック周波数へと自動で移行して、より処理能力を引き上げる仕組みが入っている。つまり、CPUメーカーが規定しているスペックであるTDP(Thermal Design Power:熱設計消費電力※)よりも、高いポイントで動作してより多くの熱量が発生しても排熱できるような設計にしておけば、CPUの性能をさらに引き出すことが可能になる。
逆に、システム側の排熱が追い付かない場合、CPUは規定のスペックを下回って動作するように設計されている。つまり、せっかく高クロック周波数で動作するCPUの上位のモデルを購入しても、機器ベンダーの熱設計がイマイチだと、性能をフルに発揮できないどころか、規定された性能すら発揮できないとなりかねないわけだ。このためサーバーベンダーには、そうしたTDP時に発生する熱量、可能であればTDPを超える電力消費時に発生しうる熱量を放熱できるような放熱設計が求められているのである。
※ TDP:CPUメーカーが規定している熱設計時に参照するスペック上想定される消費電力のこと。機器ベンダーは、TDPの消費電力をCPUが消費している時に発生する熱量を排熱できるように設計する必要がある
経験豊富なサーマルエンジニアが多数在籍するデル・テクノロジーズ
そうしたTDPは、増えこそすれ、減ることはない。10年前には150Wを切っていたTDPは、ここ数年で200Wを超えており、Intel® 社の最新製品となる第4世代インテル® Xeon® スケーラブル・プロセッサー・ファミリーでは実に350Wに達している。
こうした潮流を受け、熱設計に多大な投資を行っているのがデル・テクノロジーズだ。「当社のサーバー製品開発拠点は多数のサーマルエンジニアが所属しています。いずれも熱力学、熱伝導、流体力学などの専門家で、空冷、水冷、液冷などの冷却ソリューションの開発経験があり、サーバーをいかに冷やすのかを日々研究しているのです」と岡野氏は述べる。
そうした研究成果の1つが、現在製品に搭載されている「マルチベクタークーリング」だ。マルチベクタークーリングとは、複数のファンをゾーンごとに分けて効率よく冷却する仕組み。CPUの周辺、あるいはGPUのようにCPUに匹敵するような消費電力を出す拡張カードを挿入するPCI Expressスロットなどを“冷やし分け”することができる。サーバー自身が必要に応じてファンの回転数を動的に変えることで、ファンが必要とする消費電力を最小化していき、サーバー機器の消費電力を最適化するわけだ。
また、デル・テクノロジーズの近年のサーバーに搭載されているiDRAC(integrated Dell Remote Access Controller:アイドラック)を利用すれば、システムがファンの回転数を変更するパラメーターを調整できる。例えば、「吸・排気温度差の上限を設定する」「システムの排気温度の上限を設定する」「PCI Expressスロットごとのエアフロー量を設定する」といったパラメーターを調整することで、ファンが消費する電力と性能の間でバランスを取るのわけだ。「このように、サーマルエンジニアが開発拠点で日々研究していることが、新しい世代の製品に適用されています」と岡野氏は強調する。
実際、熱設計を評価して同社製品を選択する事例も増えているという。「例えば、IaaS型クラウドサービスとデータセンター事業を展開するIDCフロンティア様は、同じ構成でも弊社サーバーの消費電力が最も少なく、1ラックに搭載できるサーバー数が他社よりも多くなる事が採用の決め手になりました」(岡野氏)。
最新世代Dell PowerEdgeサーバーを幅広いポートフォリオで提供
デル・テクノロジーズでは、こうした熱設計を実装した製品を続々と投入している。第4世代インテル® Xeon® スケーラブル・プロセッサー・ファミリーを搭載した「最新世代Dell PowerEdgeサーバー」はその代表例だ。一般的なデータセンターに格納されるようなサーバーから、エッジサーバー、さらにはCSP(クラウド・サービス・プロバイダー)向けのスケールアウト向けまで幅広いポートフォリオで提供している。
「前世代と比較した際、AI推論で性能が最大2.9倍、仮想デスクトップで格納できるユーザー数が最大20%増加、ERPでもユーザー数を最大50%増やせるなど、システムパフォーマンスが大きく上がっています。そうした性能を最大限発揮できるのが最新熱設計を採用したPowerEdgeサーバーの特長です」と岡野氏は述べる。
最新世代のPowerEdgeでは、インテリジェントな熱設計がさらに進化しており、「Smart Flowシャーシ」と呼ばれる新しい熱設計を施した新シャーシが導入されている。Smart Flowはサーバー機器の中央に専用の空気の取り入れ口を設け、ストレージなどの外気流入を阻む要素を低減する設計にすることで、空気の通りをよくしてサーバーの排熱性能を高めるものだ。
そうした設計を採用することで、1UのPowerEdge R660サーバーは、エアフロー量が前世代製品に比べて15%増え、TDP350Wに達するような最新のCPUであっても空冷で対応できる。また、2UのPowerEdge R760でもエアフロー量が前世代に比べて13%増えており、こちらではミッドレンジのCPUを選択した場合に最大52%の冷却ファンの消費電力を削減できているという。
デル・テクノロジーズが注力しているのは、空冷ソリューションだけではない。水冷製品の強化を行っている。「従来はサードパーティーが提供してきた水冷のインフラも当社から一括して提供できるようになっており、保守などもまとめてワンストップで提供できるようになっています」(岡野氏)。既にDLC 3000とDLC 7000という水冷システムの規模の違いで2つのシリーズを投入しているという。
サステナビリティの実現に向けてEPEAT シルバー認証を取得
熱設計を実装した同社の製品は、対外的にも様々な評価を獲得している。「省電力の基準として、従来はENERGY STARに準拠していることがうたわれてきましたが、最近では米国で連邦政府調達の基準とされていることもありEPEAT(イーピート)が重要視されるようになっています。EPEATにはいくつかの基準がありますが、当社の製品はシルバー認証を、PowerEdgeの15機種で取得しています。今後もデル・テクノロジーズでは、熱設計をはじめした消費電力の低減に注力するとともに、必要な機能や技術を搭載したサーバー製品を提供していきます」と岡野氏は話した。
0 コメント:
コメントを投稿