Aprendizaje por Refuerzo

Técnica de aprendizaje de robots para desarrollar aplicaciones robóticas adaptables y eficientes.

Nissan

Image Credit: Agility, Apptronik, Fourier Intelligence, Unitree

Cargas de Trabajo

Robótica

Industrias

Todas las industrias

Objetivo de Negocio

Innovación

Productos

NVIDIA Omniverse
NVIDIA Omniverse Enterprise
NVIDIA AI Enterprise

Descripción General
Implementación Técnica
Ecosistema de Socios

Potencie a los Robots Físicos con Habilidades Complejas Mediante el Aprendizaje por Refuerzo

A medida que los robots asumen tareas más complejas, los métodos de programación tradicionales se vuelven insuficientes. El aprendizaje por refuerzo (RL) es una técnica de aprendizaje automático diseñada para abordar este desafío mediante la programación del comportamiento del robot. Con RL en simulación, los robots pueden entrenar en cualquier entorno virtual por ensayo y error, perfeccionando sus habilidades de control, planificación de rutas, manipulación y más.

El modelo RL es recompensado por las acciones deseadas, por lo que se adapta y mejora constantemente. Esto ayuda a los robots a desarrollar habilidades motoras gruesas y finas sofisticadas necesarias para las tareas de automatización del mundo real, como agarrar nuevos objetos, caminar cuadrúpedo y aprender habilidades de manipulación complejas.

Al refinar continuamente las políticas de control basadas en recompensas y analizar sus acciones, RL también puede ayudar a los robots a adaptarse a nuevas situaciones y desafíos imprevistos, haciéndolos más adaptables a las tareas del mundo real.

Entrenamiento de RL Scelerado por GPU para Robótica

El entrenamiento tradicional basado en CPU para el RL de robots puede ser costoso, a menudo requiere miles de núcleos para tareas complejas que aumentan los costos de las aplicaciones de robots. Las GPU de NVIDIA abordan este desafío con sus capacidades de procesamiento paralelo, lo que acelera significativamente el procesamiento de datos sensoriales en entornos de aprendizaje por refuerzo habilitados para la percepción. Esto mejora significativamente las capacidades de los robots para aprender, adaptarse y realizar tareas complejas en entornos dinámicos.

Entrenamiento de RL Acelerado por GPU para Robótica

Las plataformas de cómputo de NVIDIA, incluidas herramientas como Isaac Lab, aprovechan la potencia de la GPU tanto para simulaciones físicas como para cálculos de recompensas dentro del pipeline de RL. Esto elimina los cuellos de botella y agiliza el proceso, lo que facilita una transición más fluida de la simulación a la implementación en el mundo real.

Quick Links

¿Qué Es el Aprendizaje por Refuerzo?

La Solución de Tres Computadoras: Impulsando la Próxima Ola de Robótica de IA

La Próxima Ola de la IA: la IA Física

Más Información Sobre las Soluciones Robóticas de NVIDIA

Laboratorio Isaac para el Aprendizaje por Refuerzo

NVIDIA Isaac™ Lab es un framework modular creado sobre NVIDIA Isaac Sim™ que simplifica los workflows de entrenamiento de robots, como el aprendizaje por refuerzo e imitación. Los desarrolladores pueden aprovechar las últimas capacidades de Omniverse™ para entrenar políticas complejas con la percepción habilitada.

Crear una Escena: El primer paso es crear una escena en Isaac Lab e importar los activos del robot mediante URDF o MJCF. Aplique esquemas físicos para la simulación e integre sensores para la capacitación en políticas basadas en la percepción.
Definir las Tareas de RL: Una vez configurada la escena y el robot, el siguiente paso es definir la tarea de refuerzo que va a realizar el agente. El entorno (por ejemplo, basado en el administrador o en el workflow directo) proporciona el estado actual o las observaciones del agente y ejecuta las acciones que proporciona. A continuación, el entorno responde a los agentes proporcionando los siguientes estados.
Entrenar: El último paso es definir los hiperparámetros para el entrenamiento y la arquitectura de políticas. Isaac Lab proporciona cuatro bibliotecas RL para entrenar los modelos con GPU: StableBaselines3, RSL-RL, RL-Games y SKRL.
Escalado: Para escalar el entrenamiento a través de sistemas multi-GPU y multi-nodo, los desarrolladores pueden usar OSMO para la orquestación de estos trabajos en una infraestructura híbrida.

NVIDIA Isaac GR00T ofrece a los desarrolladores una nueva forma de desarrollar específicamente robots humanoides. GR00T es una iniciativa de investigación y una plataforma de desarrollo para modelos de base de robots de propósito general y pipelines de datos que pueden ayudar a comprender el lenguaje, emular los movimientos humanos y adquirir rápidamente habilidades a través del aprendizaje multimodal.

Para obtener más información y acceder a GR00T, solicite el Programa de Desarrolladores Humanoide de NVIDIA.

Quick Links

Primeros Pasos con NVIDIA Isaac Lab

Avance en el Aprendizaje de Robots con la Última Versión de NVIDIA Isaac

Cree un Pipeline de Generación de Movimiento Sintético para el Aprendizaje de Robots Humanoides

Acelera el Desarrollo de IA Física con NVIDIA Cosmos

Lea la Arquitectura de Referencia de Isaac Lab

Ecosistema de Socios

Vea cómo nuestro ecosistema está creando sus propias aplicaciones y servicios de robótica basados en el aprendizaje por refuerzo y las tecnologías de NVIDIA.

Enlaces Rápidos

Los Líderes de la Industria Adoptan NVIDIA Robotics para el Desarrollo de Decenas de Millones de Máquinas Autónomas Impulsadas por IA

Empeza Ahora

El aprendizaje por refuerzo para la robótica es ampliamente adoptado por los investigadores y desarrolladores de hoy en día. Obtén más información sobre NVIDIA Isaac Lab para el aprendizaje de robots hoy mismo.

Empezar Explora NVIDIA Isaac Sim

Noticia

March 18, 2025

NVIDIA Unveils Open Physical AI Dataset to Advance Robotics and Autonomous Vehicle Development

Teaching autonomous robots and vehicles how to interact with the physical world requires vast amounts of high-quality data. To give researchers and developers a head start, NVIDIA is releasing a massive, open-source dataset for building the next generation of physical AI. Announced at NVIDIA GTC, a global AI conference taking place this week in San Read Article

March 18, 2025

NVIDIA Open-Sources cuOpt, Ushering in New Era of Decision Optimization

Every second, businesses worldwide are making critical decisions. A logistics company decides which trucks to send where. A retailer figures out how to stock its shelves. An airline scrambles to reroute flights after a storm. These aren’t just routing choices — they’re high-stakes puzzles with millions of variables, and getting them wrong costs money and, Read Article

February 20, 2025

Into the Omniverse: How OpenUSD and Synthetic Data Are Shaping the Future for Humanoid Robots

The NVIDIA Isaac GR00T Blueprint for synthetic motion data significantly accelerates the data generation and training of humanoid robots.