https://xtech.nikkei.com/atcl/nxt/mag/ne/18/00001/00504/
https://xtech.nikkei.com/atcl/nxt/mag/ne/18/00001/00504/
米IBM上級副社長で研究開発部門を率いるDario Gil(ダリオ・ギル)氏は半導体や量子分野における日米連携のキーパーソンだ。Rapidus(ラピダス、東京・千代田)と2nm(ナノメートル)世代半導体を共同開発し、理化学研究所とは量子コンピューターとスーパーコンピューターの連携に取り組む。半導体や人工知能(AI)、量子技術が切り開くコンピューティングの未来について聞いた。(聞き手は大下 淳一)
半導体とAI、量子のいずれでも最先端の研究を手掛けています。これらの技術はコンピューティングのあり方をどう変えますか。
半導体、AI、量子技術を組み合わせ、それぞれの能力を引き出したり補ったりする技術が重要性を増す。Bits(ビッツ=半導体)、Neurons(ニューロンズ=AI)、Qubits(キュービッツ=量子)という3つの要素のコンビネーションだ。
半導体とAIを組み合わせる例には、当社のメインフレーム「IBM Z(ズィー)」がある。Zはゼロダウンタイムを意味し、稼働が止まることのない社会インフラとして金融分野などで使われている。独自開発したプロセッサーやAIアクセラレーター(AI処理専用回路)を搭載しており、大規模言語モデル(LLM)などを扱える。
AIアクセラレーターはプロセッサーと同じコア回路を集積し、カード形状でシステムに搭載する。プロセッサーとAIアクセラレーターが連係動作し、システム全体の処理能力を高める仕組みだ。最新のシステムではプロセッサーとAIアクセラレーターともに5nm世代の半導体製造技術を使っている。
理化学研究所とは半導体と量子技術を組み合わせた量子セントリックなスーパーコンピューターの実現を目指す。理化学研究所のスパコン「富岳」と我々の量子コンピューター「IBM Quantum System Two」を連係動作させる研究を進める。化学シミュレーションなどの効率を飛躍的に高めることを狙う。
AIを扱うデータセンターでは半導体に起因する消費電力の増大が懸念されています。どのような解決策がありますか。
AI処理の低電力化はコンピューティング技術の中心的な課題だ。ソフトウエア、ハードウエア、通信(データ伝送)という3つの側面からの改善が求められる。
ソフトウエアについては、LLMのサイズ(パラメーター数)の用途に応じた最適化が重要になる。消費電力はAIモデルの規模にほぼ比例して増える。必要なタスクをこなせる範囲でモデルサイズを小さくすることが求められる。
ハードウエアについては、GPU(画像処理半導体)よりも演算効率の高いアーキテクチャーが必要になる。GPUは汎用性が高く、AI処理やグラフィックス処理など様々な用途に使える。ただしAI処理だけに絞ると演算効率は必ずしも高くない。
IBM Zに搭載しているAIアクセラレーターカードの消費電力は1枚当たり75W。GPUの消費電力が600Wを超えることを考えると電力効率が高い。データフロー型と呼ぶ演算アーキテクチャーを採用していることが大きい。米Google(グーグル)の「TPU(Tensor Processing Unit)」もデータフロー型のプロセッサーだ。
将来は(人間の脳を模倣した)ニューロモルフィック・コンピューティングの活用で消費電力をさらに下げられる。メモリーの近くや内部に演算機能を持たせるというアプローチだ。我々は「North Pole(ノースポール)」と呼ぶニューロモルフィック型チップの開発を進めている。
データセンターではメモリーとプロセッサーなど、チップ間のデータ伝送にも大きな電力が費やされる。その解決に向けて我々は最近、CPO(Co-Packaged Optics、コ・パッケージド・オプティクス)技術を開発した。チップ間やパッケージ間のデータ伝送を光に担わせるもので、電気を使う場合と比べ消費電力を8割減らせることを実証した。
0 コメント:
コメントを投稿