IA física

NVIDIA Cosmos

Acelere el desarrollo de la IA física con modelos de mundo básicos.

Descripción

¿Qué es NVIDIA Cosmos?

NVIDIA Cosmos™ es una plataforma de modelos de mundo generativos básicos (WFM) de última generación, tokenizadores avanzados, barreras de protección y una canalización acelerada de procesamiento y selección de datos construida para acelerar el desarrollo de la IA física, en tecnologías como los vehículos autónomos (VA) y los robots.

Los modelos de mundo básicos de Cosmos están disponibles para la comunidad de desarrolladores de IA física

Modelos de vanguardia entrenados en millones de horas de datos de vídeo de conducción y robótica para democratizar el desarrollo de la IA física, disponibles mediante licencia de modelo abierto.

La plataforma de modelos de mundo básicos para acelerar el desarrollo de la IA física

El desarrollo de sistemas con IA física incorporada, como robots y vehículos autónomos, se acelera gracias a la nueva plataforma NVIDIA Cosmos.

Ventajas

Acelere el desarrollo de IA física con modelos de mundo básicos

Cosmos proporciona a los desarrolladores un acceso abierto y fácil a modelos de mundo básicos de alto rendimiento y canalizaciones de datos, haciendo que el desarrollo de la IA física sea accesible para todas las personas.

Icono decorativo

Basada en los principios de la física

Conjunto de modelos de vídeo de primera generación entrenados en 9000 billones de tókenes, entre los que se incluyen 20 millones de horas de robótica y de datos de conducción, generando vídeos de alta calidad a partir de entradas de datos multimodales como imágenes, texto o vídeo.

Icono decorativo

Abierto

Los WFM y los tokenizadores de Cosmos están sujetos a la licencia NVIDIA Open Model, lo cual permite que los desarrolladores de todo el mundo construyan sistemas de IA física a escala sin altos costes iniciales.

Icono decorativo

Acelerar el procesamiento y la selección de datos

Acelere por 20 la selección de datos gracias a la canalización NVIDIA NeMo Curator, que utiliza CUDATM-X y herramientas aceleradas por la IA de NVIDIA para procesar más de 100 PB de datos. Proporciona optimizaciones listas para usar, que minimizan el coste total de propiedad (TCO, por sus siglas en inglés) y aceleran el tiempo de comercialización.

Icono decorativo

Desarrollar modelos personalizados

El tokenizador Cosmos convierte datos visuales en tókenes de alta fidelidad con una compresión 8 veces mayor y un procesamiento 12 veces más rápido.

NVIDIA NeMo™ proporciona entrenamiento acelerado y personalización para construir modelos de IA generativa multimodal para la IA física.

Modelos

Modelos de mundo básicos de NVIDIA Cosmos

Una familia de modelos preentrenados diseñados para generar vídeos basados en la física y estados de mundo para el desarrollo de la IA física.


Obtenga más información sobre arquitecturas de modelos, recursos de desarrollo y disponibilidad aquí.

Modelos de mundo básicos de NVIDIA Cosmos
Icono decorativo

Familia de modelos de última generación

  • Modelos autorregresivos y de difusión para la generación de texto a mundo y vídeo a mundo, disponibles en tamaños de parámetros que van desde 4 a 14 mil millones para satisfacer diversas necesidades. Modelo de muestreo superior de
  • 12 mil millones de parámetros para refinar indicaciones de texto, ofreciendo una mayor precisión y detalle en las salidas generadas.
  • Modelo de 7 mil millones de parámetros diseñado para descodificar secuencias de vídeo, optimizado para aplicaciones de realidad aumentada.
Icono decorativo

Barreras de protección integradas

  • Protección previa para filtrar marcas, contenido NSFW (no seguro/apropiado para el trabajo) e indicaciones dañinas.
  • Protección previa para eliminar escenarios cuestionables.
  • Protección de seguridad para difuminar rostros humanos.
  • Marcas de agua digitales en vídeos sintéticos generados a partir de las interfaces API de vista previa en el catálogo de API de NVIDIA.

Pruebas de rendimiento

Transición al rendimiento de la IA física

NVIDIA está trabajando con el ecosistema de robótica y vehículos autónomos para desarrollar un conjunto de pruebas de referencia que reflejen los requisitos únicos de las aplicaciones de la IA física a partir de los modelos de mundo básicos.

Las pruebas de referencia de Cosmos están diseñadas para evaluar la próxima generación de modelos de mundo con criterios avanzados como la coherencia 3D y la alineación con la física, esenciales para la robótica y los sistemas autónomos.

En comparación con VideoLDM (VLDM), un modelo generativo de línea base para la síntesis de vídeo, los WFM de Cosmos destacan por su precisión geométrica con una menor tasa de error de Sampson y una mejor estabilidad temporal. Las pruebas de referencia también evalúan los WFM basados en comportamientos físicos como la gravedad y la dinámica de colisiones.

Los WFM de Cosmos superan constantemente a los VLDM en coherencia visual, logrando tasas de éxito de estimación de posturas hasta 14 veces más altas. Mientras que los modelos de difusión brindan una mayor fidelidad desde el principio, los modelos autorregresivos ofrecen un excelente rendimiento para modelos personalizados.

Generación de datos sintéticos

Casos de uso

Cómo usan los desarrolladores NVIDIA Cosmos

Vea cómo los desarrolladores de robótica, vehículos autónomos e IA de visión pueden usar Cosmos para hacer avanzar su trabajo.

Búsqueda de vídeo

Cosmos ayuda a los desarrolladores a crear conjuntos de datos adaptados para el entrenamiento de modelos de IA. Ya sea en imágenes de carreteras nevadas para automóviles autónomos o en escenarios de almacenes con una gran actividad para la robótica, Cosmos simplifica el etiquetado y la búsqueda de vídeos al asimilar los patrones espaciales y temporales, facilitando la preparación de datos de entrenamiento.

Esto ahorra tiempo, reduce costes y ayuda a proporcionar modelos de IA que son muy relevantes y tienen una gran repercusión para su uso en el mundo real.

Generación de datos sintéticos

Ecosistema

Adoptado por los principales innovadores en el campo de la IA física

Los desarrolladores de modelos de robótica, vehículos autónomos y sectores que emplean la IA de visión están utilizando Cosmos para acelerar el desarrollo de la IA física.

Logotipo de 1X Technologies
Logotipo de AgileX Robotics
Logotipo de Agility Robotics
Logotipo de Figure AI
Logotipo de Foretellix
Logotipo de Fourier
Logotipo de Galbot
Logotipo de Hillbot
Logotipo de IntBot
Logotipo de Neura Robotics
Logotipo de Skild AI
Logotipo de Uber
Logotipo de Virtual Incision
Logotipo de Waabi
Logotipo de Wayve
Logotipo de Xpeng

Próximos pasos

¿Listo para empezar?

Ponga a prueba un modelo básico de mundo en el catálogo de API de NVIDIA o empiece a construir sus modelos de mundo con NVIDIA Cosmos.

Cree sus modelos personalizados

NVIDIA NeMo proporciona una canalización de extremo a extremo para seleccionar, tokenizar y ajustar con precisión modelos de mundo en cualquier plataforma.

Comience a seleccionar datos de vídeo para modelos de mundo

Procesamiento de datos acelerado y canalización de selección con NVIDIA NeMo Curator y optimizado para las GPU destinadas a centros de datos de NVIDIA.

Preguntas frecuentes

Select Location
Middle East