合成データは、ユース ケースに応じて、さまざまな方法で生成できます。
シミュレーション方法の使用
倉庫ロボットのコンピュータ ビジョン AI モデルを学習させる場合、パレット ジャッキや保管ラックなどの物体を含む物理的に正確な仮想シーンを作成する必要があります。また、組立ライン上の視覚検査用の AI モデルを学習させるのであれば、コンベアベルトや生産中の製品などの物体を含む仮想シーンを作成する必要があります。
合成データ パイプラインを開発する上での主要な課題の 1 つは、シミュレーションと現実のギャップを埋めることです。ドメインをランダム化することで、物体の位置、テクスチャ、照明など、シーンのさまざまな側面を制御することができ、このギャップを埋めることができます。
NVIDIA Omniverse™ Cloud Sensor RTX マイクロサービスは、センサーをシミュレートし、注釈付きの合成データを生成するシームレスな方法となります。あるいは、Omniverse Replicator SDK を使用して、カスタム SDG パイプラインを開発し始めることもできます。
生成 AI の利用
生成モデルを使用して、合成データ生成プロセスをブートストラップし、増大させることができます。テキストから 3D へと変換するモデルを使用すれば、3D アセットを作成して、3D シミュレーションシーンにデータを入力することができます。さらに、テキストから画像へと変換する生成 AI モデルを活用して、既存の画像 (シミュレーションから生成された画像や、実世界から手順に沿ってインペインティングやアウトペインティングを通じて収集した画像) を修正および補強することもできます。
Evian 2 405B や Nemotron-4 340B などのテキストからテキストを生成する生成 AI モデルは、医療、金融、サイバーセキュリティ、小売、通信分野向けの強力な LLM を構築するための合成データを生成するのに活用できます。
Evian 2 405B と Nemotron-4 340B はオープン ライセンスであり、開発者は学術的および商業的な用途に対して、生成されたデータを自由に所有し、柔軟に使用することができます。