Simulation kann neue Anwendungsfälle erschließen, indem sie das Training von grundlegenden Modellen als Ausgangspunkt nutzt oder den Feinabstimmungsprozess von vortrainierten KI-Modellen mit synthetischer Datengenerierung (SDG) beschleunigt. Sie kann aus Text-, 2D- oder 3D-Bildern im visuellen und nicht-visuellen Spektrum bestehen. Des Weiteren kann sie sogar aus Bewegungsdaten bestehen, die in Verbindung mit realen Daten zum Einsatz kommen können, um multimodale physikalische KI-Modelle zu trainieren.
Domänenrandomisierung ist ein wichtiger Schritt im SDG-Workflow, im Zuge derer viele Parameter in einer Szene geändert werden können, um einen vielfältigen Datensatz zu generieren – von der Position über die Farbe bis hin zu Texturen und Beleuchtung der Objekte. Die Erweiterung in der Nachbearbeitungsphase diversifiziert die generierten Daten weiter, indem sie Defekte wie lokalisierte Unschärfen, Verpixelung, zufälliges Zuschneiden, Schrägstellen und Verblenden hinzufügt.
Darüber hinaus werden die generierten Bilder automatisch mit Anmerkungen versehen und können RGB, Bounding Boxes, Instanzen und semantische Segmentierung, Tiefe, Tiefenpunktwolke, Lidar-Punktwolke und mehr enthalten.