Los datos sintéticos se pueden generar de varias maneras, según el caso de uso.
Uso de Métodos de Simulación
Si está entrenando un modelo de IA de visión por computadora para un robot de almacén, deberá crear una escena virtual físicamente precisa con objetos como transpaletas y estantes de almacenamiento. O puede entrenar un modelo de IA para la inspección visual en una línea de montaje, donde tendrá que crear una escena virtual con objetos como una cinta transportadora y el producto que se está produciendo.
Uno de los desafíos clave en el desarrollo de pipelines de datos sintéticos es cerrar la brecha entre la simulación y la realidad. La aleatorización de dominios cierra esa brecha al permitirle controlar varios aspectos de la escena, como la posición de los objetos, la textura y la iluminación.
Los microservicios NVIDIA Omniverse™ Cloud Sensor RTX te ofrecen una forma fluida de simular sensores y generar datos sintéticos anotados. Como alternativa, puedes comenzar con el SDK de Omniverse Replicator para desarrollar pipelines de SDG personalizadas.
Uso de la IA Generativa
Los modelos generativos se pueden utilizar para iniciar y aumentar los procesos de generación de datos sintéticos. Los modelos de texto a 3D permiten la creación de activos 3D para rellenar una escena de simulación 3D. Los modelos de IA generativa de texto a imagen también se pueden utilizar para modificar y aumentar las imágenes existentes, ya sea generadas a partir de simulaciones o recopiladas en el mundo real a través de procedimientos de pintura interna o exterior.
Los modelos de IA generativa de texto a texto, como Evian 2 405B y Nemotron-4 340B , se pueden utilizar para generar datos sintéticos y crear potentes LLM para el área de la salud, las finanzas, la ciberseguridad, el comercio minorista y las telecomunicaciones.
Evian 2 405B y Nemotron-4 340B proporcionan una licencia abierta, otorgando a los desarrolladores los derechos para poseer y usar los datos generados en sus aplicaciones académicas y comerciales.