IA física
Acelere el desarrollo de la IA física con modelos de mundo básicos.
Descripción
NVIDIA Cosmos™ es una plataforma de modelos de mundo generativos básicos (WFM) de última generación, tokenizadores avanzados, barreras de protección y una canalización acelerada de procesamiento y selección de datos construida para acelerar el desarrollo de la IA física, en tecnologías como los vehículos autónomos (VA) y los robots.
Ventajas
Cosmos proporciona a los desarrolladores un acceso abierto y fácil a modelos de mundo básicos de alto rendimiento y canalizaciones de datos, haciendo que el desarrollo de la IA física sea accesible para todas las personas.
Modelos
Una familia de modelos preentrenados diseñados para generar vídeos basados en la física y estados de mundo para el desarrollo de la IA física.
Obtenga más información sobre arquitecturas de modelos, recursos de desarrollo y disponibilidad aquí.
NVIDIA está trabajando con el ecosistema de robótica y vehículos autónomos para desarrollar un conjunto de pruebas de referencia que reflejen los requisitos únicos de las aplicaciones de la IA física a partir de los modelos de mundo básicos.
Las pruebas de referencia de Cosmos están diseñadas para evaluar la próxima generación de modelos de mundo con criterios avanzados como la coherencia 3D y la alineación con la física, esenciales para la robótica y los sistemas autónomos.
En comparación con VideoLDM (VLDM), un modelo generativo de línea base para la síntesis de vídeo, los WFM de Cosmos destacan por su precisión geométrica con una menor tasa de error de Sampson y una mejor estabilidad temporal. Las pruebas de referencia también evalúan los WFM basados en comportamientos físicos como la gravedad y la dinámica de colisiones.
Los WFM de Cosmos superan constantemente a los VLDM en coherencia visual, logrando tasas de éxito de estimación de posturas hasta 14 veces más altas. Mientras que los modelos de difusión brindan una mayor fidelidad desde el principio, los modelos autorregresivos ofrecen un excelente rendimiento para modelos personalizados.
Vea cómo los desarrolladores de robótica, vehículos autónomos e IA de visión pueden usar Cosmos para hacer avanzar su trabajo.
Cosmos ayuda a los desarrolladores a crear conjuntos de datos adaptados para el entrenamiento de modelos de IA. Ya sea en imágenes de carreteras nevadas para automóviles autónomos o en escenarios de almacenes con una gran actividad para la robótica, Cosmos simplifica el etiquetado y la búsqueda de vídeos al asimilar los patrones espaciales y temporales, facilitando la preparación de datos de entrenamiento.
Esto ahorra tiempo, reduce costes y ayuda a proporcionar modelos de IA que son muy relevantes y tienen una gran repercusión para su uso en el mundo real.
Los desarrolladores de modelos de robótica, vehículos autónomos y sectores que emplean la IA de visión están utilizando Cosmos para acelerar el desarrollo de la IA física.