高性能で使いやすいAI橋渡しクラウドとは 生成AIの開発と社会実装を加速
(※本記事は「産総研マガジン」に2024年11月20日付で掲載された記事を、許可を得て掲載しています)
AIのアルゴリズムと、実社会から得られるビッグデータをつなぐABCI(AI橋渡しクラウド:AI Bridging Cloud Infrastructure)。AI技術の開発と社会実装を加速するため、オープンに利用できる大規模計算インフラとして産総研が整備し、2018年に運用を開始しました。2021年にABCI 2.0、さらに今年はABCI 3.0にアップグレードします。産学官の幅広いユーザーに活用されて目覚ましい成果をあげ、AI技術による産業創出を牽引しています。
最高水準の計算性能と省エネ性能を備え企業がアクセスしやすいAIスパコン
産総研がABCIの構築に取り組んだのは、海外でディープラーニング(深層学習)の極めて重要な技術が相次いで開発された時期です。一方国内ではAIへの関心は高いものの、導入している企業は約1割に過ぎませんでした。そこで、研究機関や大学だけでなく企業がアクセスしやすい大規模計算インフラを整備し、実際にAIを試してみることのできる「場」を提供することにしました。
そうして誕生したのが、当時、スパコン速度性能ランキングで世界第5位となったABCIです。半精度演算の性能は550ペタフロップスで、最新GPUを4,352基搭載。GPUが多いほど消費電力と発熱量が上昇しますが、省エネ性能の面でも世界最高水準を実現したのが特徴です。その仕組みについて高野了成に聞きました。
「一般的なデータセンターは、計算機の消費電力とほぼ同じくらい冷却用の電力が必要です。しかしABCIの場合は、計算機の消費電力の10分の1以下で冷却することができます。一番のポイントは、クーラーのように消費電力の大きい冷凍機を使うのではなく、フリークーリングと言って、いわゆる『打ち水効果』により作った温水のみを用いて年間を通して冷却を行うことです。非常に高効率・省エネで、オペレーションコストの削減に貢献しています」
より高速な最新GPUを搭載し生成AIの開発で多くの成果
2021年5月にはABCI 2.0へアップグレードしました。その経緯ついて、小川宏高は次のように説明します。
「利用者が右肩上がりに増え続け、利用率も非常に高い水準になってきたため、より高速な最新GPUを搭載したシステムを新たに導入し、従来システムと併せて利用できるようにしました。そもそも生成AIの性能は、パラメータ数や学習させるデータ量に応じて向上します。それらを増やしていって、あるポイントを過ぎると突然性能が上がる傾向があることから、さまざまなデベロッパーが生成AIの開発にしのぎを削っています。そうした利用者に向けて、ABCI 2.0は生成AI開発に優先的にリソースを割り当てています」
GPUサーバーやストレージシステムを増強し、半精度演算の性能は851.5ペタフロップスに向上。このABCI 2.0を活用してさまざまな成果が生まれています。その例をいくつか紹介すると、『ABCIで日本語版大規模言語モデルを構築する』(Preferred Networks)、『AI・自動運転技術で新しい物流インフラを構築する』(T2)、『画像認識で食肉から骨を見つけ出す、食肉加工機械の進化』(前川製作所)、『動画解析AI「DeepLiquid」で挑む、流体特性の新たなデジタル化』(AnyTech)などがあります。
(記事の続きはこちらから。産総研マガジン「高性能で使いやすいAI橋渡しクラウドで生成AIの開発と社会実装を加速する」)