Aerospace

NVIDIA DGX H100 が加速するマルチモーダル AI 開発

航空宇宙生産技術開発センター
熟練検査員の高度な知識を AI に

航空宇宙生産技術開発センターは、内閣府交付金と岐阜県補助金の支援を受けて、2019 年 4 月に発足した国内初の「生産技術」にフォーカスした教育研究機関である。2020 年 10 月に岐阜大学内にセンター建屋が完成、2021 年 4 月にセンター開所式典を行った。同センターは、研究開発と人材育成を柱として活動を行っており、研究開発事業ではロボットや AI/IoT による生産効率向上に関する研究を進め、人材育成事業では学生および就労者を対象に生産技術を体系的に学ぶ講座を開講している。

岐阜大学工学部 電気電子・情報工学科 情報コース の加藤 邦人教授は、同センターにおける AI 開発のリーダーとして、コンピュータービジョンを活用した検査 AI などの開発に取り組んできた。

これまで NVIDIA A100 や NVIDIA RTX 6000 Ada 世代などの NVIDIA GPU を複数利用して AI の学習を行ってきたが、マルチモーダルでの AI 学習には非常に高い演算性能が必要であり、開発速度を向上させるために、2023 年 9 月に NVIDIA DGX H100 を導入した。その効果は絶大であり、NVIDIA A100 4 基での学習と比べて、トータルでは 4 〜 5 倍学習が高速化された。今後は、熟練検査員の高度な知識を学習させることで、単に欠陥があるかないかを判別するだけでなく、判断理由を文章で示してくれる超汎用検査 AI を目指して開発に取り組んでいる。

Customer

岐阜大学
航空宇宙生産技術開発センター

Partner

HPC Tech

Use Case

Generative AI / LLMs

Products

NVIDIA DGX H100

チャレンジ

これまで、画像から製品の良品、不良品を判断する検査 AI は、数多くの良品画像と不良品画像を用意し、ディープラーニングを用いて学習させることで良品と不良品を見分けるといった手法が一般的であったが、この方法には、汎用性が低く検査対象物ごとにモデルの学習を行わねばならないという欠点がある。例えば、皿の良品不良品を学習させたモデルで、コップの良品不良品を判断することはできないのだ。人間は、一度割れや欠け、変色などの不良と判断すべき事象を学習すれば、他の対象物に対してもその知識を活かすことができる。そうした人間のように汎用性の高い検査 AI を目指していた加藤教授に、大きな衝撃を与えたのが、2022 年頃から盛り上がってきたマルチモーダル AI である。マルチモーダル AI とは、テキスト、音声、画像、動画、センサー情報など、2 つ以上の異なるモダリティ(データの種類)の情報を統合して処理する AI であり、単一のモダリティしか扱えない従来のシングルモーダル AI ではできなかったさまざまなことが可能になる。「この 1 年は本当に面白い 1 年でした。これまで私は画像だけを扱っていました。画像だけで、画像認識をさせようとしていたのですが、そこに突然言語が加わりました。言語が加わると、クラスラベルという概念がそもそもなくなり、言語によって概念を覚えるわけです。この 1 年で私の研究内容がガラッと変わり、今までやってたことを全てやめて、新しくマルチモーダル AI に取り組むことにしたのです」

ソリューション

そこで、加藤教授はマルチモーダル AI の学習を加速するために、NVIDIA の高性能 GPU「NVIDIA H100」を 8 基搭載した AI サーバー「NVIDIA DGX H100」の導入を決定した。実際に導入を担当することになったのが、株式会社 HPC テックである。HPC テックについて、加藤氏は次のようにコメントした。「導入はスムーズで、納期もしっかり守っていただけたので、高く評価しています」

リザルト

NVIDIA DGX H100 は 2023 年 9 月に導入が完了し、マルチモーダル AI の学習などにフル活用されている。加藤教授も NVIDIA DGX H100 の性能は期待以上だと顔をほころばす。「NVIDIA DGX H100 では 1 つの GPU あたりメモリが 80GB 使えるので、合計 640GB という大きなメモリを利用できます。ストレージなどの性能も向上しているので、トータルの学習速度はNVIDIA A100 を 4 基使っていた頃と比べて 4~5 倍になりました。それでもマルチモーダル AI の学習には 5 日間とかかるわけですが、NVIDIA DGX H100 がなければ研究がここまで進んでいなかったと思います」

NVIDIA H100 には、Transformer モデルの実行を加速する Transformer Engine が搭載されていることも、マルチモーダル AI の学習速度の向上に寄与していると、加藤教授は指摘した。また、マルチモーダル AI のような大規模なモデルは膨大な学習データが必要なので、ストレージの容量や速度も重要になる。加藤研究室では、 学習データを InfiniBand 経由での高速ストレージサーバーに置くことで、ストレージの性能を改善した。この高速ストレージサーバと NVIDIA DGX H100 を組み合わせたシステム構成によって、超汎用検査 AI の開発速度は大きく向上。既に一般知識は豊富だが外観検査に関する専門知識は乏しい LVLM に対して、外観検査の基準を例示して学習させることで、汎用的な外観検査が行えるモデルの作成に成功した。「いくつかの例を示すことで、マルチモーダル AI  の強力な推論能力が働き、まるで人間のようにさまざまな対象について外観検査ができるようになるのです」汎用外観検査ができる AI はこれまでに例がなく、非常に素晴らしい成果だ。加藤教授はさらに、単に良品と不良品を判断するだけでなく、熟練検査員の知識を AI に学習させることで、不良品と判断した理由や、どこに不良があるといった指摘まで行ってくれる、さらに優れた超汎用検査 AI の実現に向けて研究を進めている。超汎用検査 AI の実現は、NVIDIA DGX H100 のような高い演算性能を持ったシステムが不可欠である。「我々は国内の一研究室としては、かなり大きな演算資源を所有していると思いますが、これはある意味とても恵まれている環境なんです。マルチモーダル AI を開発するには、最低でもこれくらいの演算資源が必要になります。上を見ればキリがありませんが、私たちもさらに AI 開発を加速するために、予算が許せば近いうちにもう 1 台 NVIDIA DGX H100 を導入したいと考えています」

岐阜大学工学部 電気電子・情報工学科 情報コース 教授 
人工知能研究推進センター センター長
加藤 邦人 氏

加藤 邦人 氏

概要

  • マルチモーダルでの AI 学習には非常に高い演算性能が必要であり、開発速度を向上させるため 2023 年 9 月に NVIDIA DGX H100 を導入した。その効果は絶大であり、NVIDIA A100 4 基での学習と比べて、トータルでは 4 〜 5 倍学習が高速化された。
  • 今後は、熟練検査員の高度な知識を学習させることで、単に欠陥があるかないかを判別するだけでなく、判断理由を文章で示してくれる超汎用検査 AI を目指して開発に取り組んでいる。

NVIDIA DGX H100は、第 4 世代のNVIDIA DGX システムで、NVIDIA H100 Tensor コア GPU と NVLinkSwitch System、NVIDIA ConnectX-7 を組み合わせた世界最速の AI システムです。