Reinforcement learning

La tecnica di apprendimento robotico per sviluppare applicazioni robotiche adattabili ed efficienti.

Nissan

Image Credit: Agility, Apptronik, Fourier Intelligence, Unitree

Carichi di lavoro

Robotica

Settori

Tutti i settori

Obiettivo aziendale

Innovazione

Prodotti

NVIDIA Omniverse
NVIDIA Omniverse Enterprise
NVIDIA AI Enterprise

Potenziare i robot fisici con abilità complesse utilizzando l'apprendimento per rinforzo

Man mano che i robot assumono compiti sempre più complessi, i metodi di programmazione tradizionali diventano insufficienti. L'apprendimento per rinforzo (RL) è una tecnica di apprendimento automatico progettata per affrontare questa sfida programmando il comportamento del robot. Con RL in simulazione, i robot possono addestrarsi in qualsiasi ambiente virtuale attraverso tentativi ed errori, migliorando le proprie capacità di controllo, pianificazione del percorso, manipolazione e altro ancora.

Il modello RL viene ricompensato per le azioni desiderate, quindi si adatta e migliora costantemente. Ciò aiuta i robot ad affinare le abilità motorie grossolane e fini necessarie per compiti di automazione del mondo reale, come afferrare nuovi oggetti, camminare a quattro zampe e apprendere abilità manipolative complesse.

Migliorando continuamente le politiche di controllo basate sulle ricompense e analizzando le loro azioni, la RL può anche aiutare i robot ad adeguarsi a nuove situazioni e sfide impreviste, rendendoli più adattabili alle attività del mondo reale.

Formazione RL accelerata da GPU per la robotica

La formazione tradizionale basata su CPU per la RL dei robot può essere costosa, poiché spesso richiede migliaia di core per attività complesse che aumentano i costi per le applicazioni dei robot. Le GPU NVIDIA affrontano questa sfida con le loro capacità di elaborazione parallela, accelerando in modo significativo l'elaborazione dei dati sensoriali in ambienti di apprendimento per rinforzo abilitati alla percezione. Questo migliora significativamente le capacità dei robot di apprendere, adattarsi e svolgere compiti complessi in ambienti dinamici.

Le piattaforme di calcolo di NVIDIA, inclusi strumenti come Isaac Lab, sfruttano la potenza della GPU sia per le simulazioni fisiche che per i calcoli delle ricompense all'interno della pipeline di RL. Ciò elimina i colli di bottiglia e semplifica il processo, facilitando una transizione più agevole dalla simulazione all'implementazione nel mondo reale.

Isaac Lab per l'apprendimento per rinforzo

NVIDIA Isaac™ Lab è un framework modulare basato su NVIDIA Isaac Sim™ che semplifica i flussi di lavoro di addestramento dei robot, come il rinforzo e l'imitazione. Gli sviluppatori sono in grado di sfruttare le più recenti funzionalità di Omniverse™ per la formazione di politiche complesse con la percezione abilitata.

  • Assembla la scena: il primo passo è costruire una scena in Isaac Sim o Isaac Lab e importare le risorse del robot da URDF o MJCF. Applicare schemi fisici per la simulazione e integrare sensori per la formazione sulle politiche basate sulla percezione.
  • Definizione di task RL: una volta configurati la scena e il robot, il passo successivo è definire il task da completare e la funzione di ricompensa. L'ambiente (ad esempio, Manager-Based o Direct-Workflow) fornisce lo stato attuale dell'agente o le osservazioni ed esegue le azioni che fornisce. L'ambiente risponde agli agenti fornendo gli stati successivi.
  • Formazione: l'ultimo passaggio consiste nel definire gli iper-parametri per la formazione e l'architettura delle politiche. Isaac Lab fornisce quattro librerie RL per l'addestramento dei modelli con le GPU: StableBaselines3, RSL-RL, RL-Games e SKRL.
  • Scalabilità: per scalare la formazione su sistemi multi-GPU e multi-nodo, gli sviluppatori possono utilizzare OSMO per orchestrare attività di formazione multi-nodo su infrastrutture distribuite.

Il progetto GR00T offre agli sviluppatori un nuovo modo di sviluppare specificamente robot umanoidi. GR00T è un modello di base per scopi generali che può aiutare a comprendere il linguaggio, emulare i movimenti umani e acquisire rapidamente competenze attraverso l'apprendimento multimodale. Per ulteriori informazioni e accedere a GR00T, iscriviti al programma NVIDIA Humanoid Developer Program.

Ecosistema dei partner

Scopri come il nostro ecosistema sta costruendo le proprie applicazioni e i propri servizi di robotica basati sul rinforzo dell'apprendimento e sulle tecnologie NVIDIA.

Inizia

L'apprendimento per rinforzo per la robotica è ampiamente adottato dai ricercatori e dagli sviluppatori di oggi. Scopri di più su NVIDIA Isaac Lab per l'apprendimento dei robot.

Novità