Generazione di dati sintetici

Accelera i tuoi flussi di lavoro IA.

Carichi di lavoro

Computer vision /Analisi video

Settori

Produzione industriale
Hardware/semiconduttore
Automotive/trasporti
Città/Spazi intelligenti
Robotica

Obiettivo aziendale

Innovazione

Prodotti

NVIDIA Omniverse Enterprise
NVIDIA DRIVE
NVIDIA Isaac
NVIDIA Metropolis

Che cosa sono i dati sintetici?

La formazione di qualsiasi modello di IA richiede set di dati attentamente etichettati, di alta qualità e diversi per ottenere l'accuratezza e le prestazioni desiderate. In molti casi, i dati sono limitati, riservati o non disponibili. La raccolta e l'etichettatura di questi dati del mondo reale richiedono molto tempo e possono essere proibitive dal punto di vista economico, rallentando lo sviluppo di modelli fisici di intelligenza artificiale e il tempo necessario per trovare una soluzione.

I dati sintetici possono aiutare ad affrontare questa sfida, generati da una simulazione al computer, da modelli generativi di IA o da una combinazione dei due. Possono essere costituiti da testo, immagini 2D o 3D nello spettro visivo e non visivo, che possono essere utilizzate in combinazione con dati del mondo reale per addestrare modelli di IA fisica multimodale. Questo può farti risparmiare una notevole quantità di tempo di formazione e ridurre sensibilmente i costi.

Synthetic data

Perché utilizzare dati sintetici?

Potenziare l'addestramento del modello IA

Superare le lacune nei dati e accelerare lo sviluppo dei modelli IA, riducendo al contempo il costo complessivo di acquisizione ed etichettatura dei dati necessari per addestrare i modelli IA testuali, visivi e fisici.

Privacy e sicurezza

Affrontare i problemi di privacy e ridurre i pregiudizi generando diversi set di dati sintetici per rappresentare il mondo reale.

Accuratezza

Creare modelli IA generalizzati e altamente accurati, addestrando con vari dati che includono casi d'angolo rari, ma cruciali, che altrimenti non sarebbe possibile raccogliere.

Scalabile

Generare dati in modo procedurale con dati di pipeline automatizzati che si adattano al tuo caso d'uso nei settori di produzione, automotive, robotica e altro ancora.

Generazione di dati sintetici

I dati sintetici possono essere generati in vari modi, a seconda del caso d'uso.

Utilizzo dei metodi di simulazione

Se stai allenando un modello di IA per la visione artificiale per un robot di magazzino, dovrai creare una scena virtuale fisicamente accurata con oggetti come martinetti per pallet e scaffali di stoccaggio. Oppure puoi addestrare un modello di IA per l'ispezione visiva su una linea di assemblaggio, dove dovrai creare una scena virtuale con oggetti come un nastro trasportatore e il prodotto in produzione.

Una delle sfide principali nello sviluppo di pipeline di dati sintetici è colmare il divario tra simulazione e realtà. La randomizzazione del dominio colma questo divario consentendo di controllare vari aspetti della scena, come la posizione degli oggetti, la texture e l'illuminazione.

I microservizi NVIDIA Omniverse™ Cloud Sensor RTX offrono un modo semplice per simulare i sensori e generare dati sintetici annotati. In alternativa, puoi iniziare a utilizzare Omniverse Replicator SDK per lo sviluppo di pipeline SDG personalizzate.

Utilizzare l'IA generativa

I modelli generativi possono essere utilizzati per avviare e aumentare i processi di generazione di dati sintetici. I modelli da testo a 3D consentono la creazione di risorse 3D per popolare una scena di simulazione 3D. I modelli di IA generativi da testo a immagine possono anche essere utilizzati per modificare e aumentare le immagini esistenti, generate da simulazioni o raccolte nel mondo reale attraverso l'inpainting o l'outpainting procedurale.

I modelli di IA generativi da testo a testo come Evian 2 405B e Nemotron-4 340B possono essere utilizzati per generare dati sintetici per costruire LLM potenti per l'assistenza sanitaria, la finanza, la sicurezza informatica, il commercio al dettaglio e le telecomunicazioni.

Evian 2 405B e Nemotron-4 340B forniscono una licenza aperta, che dà agli sviluppatori i diritti di possedere e utilizzare i dati generati nelle loro applicazioni accademiche e commerciali.

Simulazione robotica

Nel campo della robotica, i dati sintetici possono essere utilizzati per addestrare modelli di intelligenza artificiale che vengono distribuiti per la percezione, la manipolazione o la capacità di afferrare dei robot, o sui robot utilizzati per l'ispezione visiva.

Link rapidi

Immagine per gentile concessione di Techman Robot

Ispezione industriale

Rilevare i difetti nei pezzi fabbricati è estremamente difficile perché le anomalie sono spesso sottili o rare e possono variare molto. I dati sintetici basati su difetti reali come graffi, spaccature o ammaccature possono essere creati per addestrare i modelli di IA a catturare i difetti all'inizio del processo di produzione.

Immagine per gentile concessione di Delta Electronics

Link rapidi

Immagine per gentile concessione di Edge Impulse

Veicoli autonomi

La distribuzione di un veicolo autonomo che può navigare in sicurezza nei dintorni richiede enormi quantità di dati di addestramento, il che è estremamente costoso e pericoloso da acquisire nella vita reale. I dati sintetici possono essere utilizzati per sviluppare e testare soluzioni di veicoli autonomi in un ambiente di simulazione, riducendo i tempi di test e di formazione e abbassando i costi.

Finanza

I dati sintetici consentono una sofisticata modellazione del rischio e il rilevamento delle frodi, salvaguardando al contempo le informazioni finanziarie sensibili. Questo metodo è fondamentale per lo sviluppo di modelli avanzati di intelligenza artificiale per la valutazione del rischio, il trading algoritmico e l'assistenza clienti.

Generazione aumentata di recupero (RAG)

Le organizzazioni di tutti i settori stanno adottando l'IA generativa per migliorare le esperienze dei clienti e aumentare l’efficienza operativa. Per garantire che i modelli forniscano risposte aggiornate e fondate, la pipeline RAG è implementata nel flusso di lavoro dell'IA. La generazione di dati sintetici può aiutare le aziende a valutare la qualità della loro implementazione della RAG.

Ecosistema dei partner di dati sintetici

Scopri come il nostro ecosistema sta sviluppando le proprie applicazioni e servizi di dati sintetici basati sulle tecnologie NVIDIA.

Aziende di dati sintetici

Service Delivery Partner

Inizia

Crea la tua pipeline di generazione di dati sintetici per simulazioni robotiche, ispezioni industriali e veicoli autonomi utilizzando le API o gli SDK di Omniverse Cloud.

Risorse

Addestramento sui dati sintetici

Segui questo corso autodidatta per imparare a generare dati sintetici per l'addestramento di modelli di visione artificiale.

Documentazione dei dati sintetici

Consulta la documentazione di Omniverse Replicator per iniziare a generare dati sintetici.

Addestramento LLM sulla generazione di dati sintetici

Scopri i modelli aperti Llama 3.1 405B e Nemotron-4 340B che gli sviluppatori possono utilizzare per generare dati sintetici per addestrare i modelli di linguaggio di grandi dimensioni (LLM) per applicazioni commerciali.

Playlist di generazione di dati sintetici

Guarda le sessioni NVIDIA GTC sulla generazione di dati sintetici per saperne di più.