IA fisica

NVIDIA Cosmos

Accelera lo sviluppo dell'IA fisica con i modelli di base del mondo.

Panoramica

Cos'è NVIDIA Cosmos?

NVIDIA Cosmos™ è una piattaforma di modelli generativi di base del mondo (WFM) all'avanguardia, tokenizzatori avanzati, guardrail e una pipeline di elaborazione e gestione dei dati accelerata, progettati per accelerare lo sviluppo di sistemi con IA fisica come veicoli autonomi (AV) e robot.

Modelli di base del mondo Cosmos liberamente a disposizione della comunità di sviluppatori di IA fisica

Modelli all'avanguardia addestrati su milioni di ore di dati video di guida e robotica per democratizzare lo sviluppo dell'IA fisica, disponibili sotto licenza di modello aperto.

La piattaforma di modelli di base del mondo per accelerare lo sviluppo dell'IA fisica

La nuova piattaforma NVIDIA Cosmos accelera lo sviluppo di sistemi basati sull'IA fisica come robot e veicoli autonomi.

Vantaggi

Accelera lo sviluppo dell'IA fisica con i World Foundation Model

Cosmos fornisce agli sviluppatori un accesso aperto e facile a modelli di base del mondo e pipeline di dati altamente performanti, rendendo lo sviluppo dell'IA fisica accessibile a tutti.

Icona decorativa

Consapevoli della fisica

Suite di modelli video di prima generazione addestrati su 9.000 trilioni di token, tra cui 20 milioni di ore di dati di guida e robotica, che generano video di alta qualità da input multimodali come immagini, testo o video.

Icona decorativa

Aperto

I WFM e i tokenizzatori di Cosmos sono sottoposti alla NVIDIA Open Model License, che consente agli sviluppatori di tutto il mondo di creare sistemi di IA fisica su larga scala senza costi di ingresso elevati.

Icona decorativa

Accelera l'elaborazione e la gestione dei dati

Velocizza la gestione dei dati di 20 volte con la pipeline NVIDIA NeMo Curator di CUDA™-X e gli strumenti accelerati con l'intelligenza artificiale NVIDIA per l'elaborazione di oltre 100 PB di dati. Fornisce ottimizzazioni predefinite, riducendo al minimo il costo totale di proprietà (TCO) e accelerando il time-to-market.

Icona decorativa

Sviluppa modelli personalizzati

Cosmos tokenizer converte i dati visivi in token ad alta fedeltà con una compressione 8 volte migliore e un'elaborazione 12 volte più rapida.

NVIDIA NeMo™ offre un addestramento e un'ottimizzazione accelerati per creare modelli di IA generativa multimodale per l'IA fisica.

Modelli

Modelli di base del mondo NVIDIA Cosmos

Una famiglia di modelli pre-addestrati progettati appositamente per generare video e stati del mondo consapevoli della fisica per lo sviluppo dell'IA fisica.


Scopri di più sulle architetture dei modelli, le risorse di sviluppo e la disponibilità qui.

Modelli di base del mondo NVIDIA Cosmos
Icona decorativa

Famiglia di modelli all'avanguardia

  • Modelli autoregressivi e di diffusione per la generazione di Text-to-World e Video-to-World, disponibili con dimensioni dei parametri che vanno da 4 a 14 miliardi per soddisfare le varie esigenze.
  • Modello di upsampling di 12 miliardi di parametri per il perfezionamento dei prompt di testo, per una maggiore precisione e dettaglio negli output generati.
  • Modello di 7 miliardi di parametri progettato per la decodifica di sequenze video, ottimizzato per le applicazioni di realtà aumentata.
Icona decorativa

Guardrail incorporati

  • Pre-guard per filtrare marchi, contenuti NSFW e prompt dannosi.
  • Post-guard per rimuovere gli scenari discutibili.
  • Guardrail per sfocare i volti umani.
  • Filigrane digitali sui video sintetici generati dalle API di anteprima sul catalogo API NVIDIA.

Benchmark

Viaggio verso le prestazioni dell'IA fisica

NVIDIA sta collaborando con l’ecosistema della robotica e dei veicoli autonomi per sviluppare una serie di benchmark che riflettano i requisiti unici delle applicazioni di IA fisica a partire dai modelli di base del mondo.

I benchmark di Cosmos sono progettati per valutare la prossima generazione di modelli di mondo con criteri avanzati come la coerenza 3D e l'allineamento con la fisica, essenziali per la robotica e i sistemi autonomi.

Rispetto al VideoLDM (VLDM), un modello generativo di base per la sintesi video, i WFM di Cosmos eccellono in termini di precisione geometrica con minori errori di Sampson e una migliore stabilità temporale. I benchmark valutano anche i WFM basati su comportamenti fisici come la gravità e la dinamica di collisione.

I WFM di Cosmos superano costantemente i VLDM in termini di coerenza visiva, ottenendo tassi di successo nella stima delle pose fino a 14 volte superiori. Mentre i modelli di diffusione offrono una maggiore fedeltà immediata, i modelli autoregressivi garantiscono prestazioni eccellenti per i modelli personalizzati.

Generazione di dati sintetici

Scenari di utilizzo

Come gli sviluppatori utilizzano NVIDIA Cosmos

Scopri come gli sviluppatori di robotica, veicoli autonomi e IA visiva possono utilizzare Cosmos per migliorare il loro lavoro.

Ricerca di video

Cosmos aiuta gli sviluppatori a creare set di dati su misura per l'addestramento dei loro modelli di IA. Che si tratti di filmati di strade innevate per le auto a guida autonoma o di scenari di magazzini affollati destinati alla robotica, Cosmos semplifica l'etichettatura e la ricerca dei video grazie alla comprensione dei modelli spaziali e temporali, facilitando la preparazione dei dati di addestramento.

Ciò consente di risparmiare tempo e ridurre i costi e contribuisce a fornire modelli di IA altamente rilevanti e di impatto per l'uso nel mondo reale.

Generazione di dati sintetici

Ecosistema

Adottato dai principali innovatori di IA fisica

Gli sviluppatori di modelli dei settori della robotica, dei veicoli autonomi e dell'IA visiva utilizzano Cosmos per accelerare lo sviluppo dell’IA fisica.

Logo 1X Technologies
Logo AgileX Robotics
Logo Agility Robotics
Logo Figure AI
Logo Foretellix
Logo Fourier
Logo Galbot
Logo Hillbot
Logo IntBot
Logo Neura Robotics
Logo Skild AI
Logo Uber
Logo Virtual Incision
Logo Waabi
Logo Wayve
Logo Xpeng

Prossimi passi

Vuoi iniziare?

Prova un modello di base del mondo nel catalogo delle API NVIDIA o inizia a progettare i tuoi modelli del mondo utilizzando NVIDIA Cosmos.

Crea i tuoi modelli personalizzati

NVIDIA NeMo fornisce una pipeline completa per gestire, tokenizzare e ottimizzare i world model su qualsiasi piattaforma.

Inizia a gestire i dati video per i world model

Pipeline di elaborazione e gestione dei dati accelerata grazie a NVIDIA NeMo Curator e ottimizzata per le GPU dei data center NVIDIA.

Domande frequenti (FAQ)

Select Location
Middle East