La simulación puede desbloquear nuevos casos de uso novedosos al iniciar el entrenamiento de modelos básicos o acelerar el proceso de ajuste fino de modelos de IA preentrenados con generación de datos sintéticos o SDG. Puede constar de texto, imágenes 2D o 3D en el espectro visual y no visual, e incluso datos de movimiento que se pueden utilizar en combinación con datos del mundo real para entrenar modelos de IA físicos multimodales.
La aleatorización de dominios es un paso clave en el flujo de trabajo de SDG, donde se pueden cambiar muchos parámetros de una escena para generar un conjunto de datos diverso, desde la ubicación, hasta el color, pasando por las texturas y la iluminación de los objetos. El aumento, en la fase de posprocesamiento, diversifica aún más los datos generados al agregar defectos como el desenfoque localizado, la pixelación, el recorte aleatorizado, la distorsión y la fusión.
Además, las imágenes generadas se anotan automáticamente y pueden incluir RGB, rectángulos delimitadores, segmentación de instancia y semántica, profundidad, nube de puntos de profundidad, nube de puntos de lidar, y mucho más.