L'IA physique

NVIDIA Cosmos

Accélérez le développement de l'IA physique avec des modèles de fondation du monde.

Les modèles de fondation du monde de Cosmos sont ouverts à la communauté des développeurs d'IA physique

De tout nouveaux modèles à la pointe de la technologie et entraînés avec des millions d'heures de données vidéo de conduite et de robotique sont désormais disponibles via un modèle de licence ouvert pour démocratiser le développement de l'IA physique.

La plateforme de modèles de fondation du monde pour accélérer le développement de l'IA physique

Le développement de systèmes intégrés d'IA physique, tels que les robots et les véhicules autonomes, est désormais accéléré par la nouvelle plateforme NVIDIA Cosmos.

Avantages

Accélérer le développement de l'IA physique avec des modèles de fondation du monde

Cosmos offre aux développeurs un accès ouvert et facile à des modèles de fondation du monde et des pipelines de données hautement performants, rendant le développement de l'IA physique accessible à tous.

Icône décorative

La physique consciente

Suite de modèles vidéo de première génération formés sur 9 000 milliards de jetons incluant 20 millions d'heures de données robotiques et de conduite et générant des vidéos de haute qualité à partir d'entrées multimodales comme des images, du texte ou de la vidéo.

Icône décorative

Ouvrir

Les WFM et les générateurs de jetons Cosmos sont sous licence NVIDIA Open Model, ce qui permet aux développeurs du monde entier de construire des systèmes d'IA physiques à grande échelle sans coûts d'entrée élevés.

Icône décorative

Accélérer le traitement et la conservation des données

Multipliez la conservation des données par 20 avec le pipeline NVIDIA NeMo Curator de CUDATM-X et les outils accélérés par l'IA de NVIDIA pour le traitement de plus de 100 Po de données. Ce dernier fournit des optimisations prêtes à l'emploi, minimisant le coût total de possession (TCO) et accélérant le délai de mise sur le marché.

Icône décorative

Développez des modèles personnalisés

Le générateur de jetons Cosmos convertit les données visuelles en jetons haute fidélité avec une compression 8 fois meilleure et un traitement 12 fois plus rapide.

NVIDIA NeMo™ offre un entraînement accéléré et un réglage précis pour créer des modèles d'IA générative multimodale pour l'IA physique.

Modèles

Modèles NVIDIA Cosmos World Foundation

Une famille de modèles pré-entraînés conçus spécialement pour générer des vidéos et des états du monde basés sur la physique consciente pour le développement physique de l'IA.


Pour en savoir plus sur les architectures de modèle, les ressources de développement et la disponibilité, cliquez ici.

Modèles NVIDIA Cosmos World Foundation
Icône décorative

Famille de modèles à la pointe de la technologie

  • Modèles autorégressifs et de diffusion pour la génération Text-to-World et Video-to-World, disponibles dans des tailles de paramètres allant de 4 à 14 milliards pour répondre à divers besoins.
  • Modèle de suréchantillonnage de 12 milliards de paramètres pour affiner les invites de texte, offrant une précision et des détails améliorés dans les sorties générées.
  • Modèle de 7 milliards de paramètres conçu pour le décodage de séquences vidéo, optimisé pour les applications de réalité augmentée.
Icône décorative

Garde-corps intégrés

  • Protéger préalablement pour filtrer les marques, le contenu NSFW et les messages nuisibles.
  • Protéger a posteriori pour supprimer les scénarios douteux.
  • Garde-corps pour brouiller les visages humains.
  • Filigranes numériques sur des vidéos synthétiques générées à partir des API de prévisualisation du catalogue d'API NVIDIA.

Benchmarks

Voyage vers la performance de l'IA physique

NVIDIA travaille avec l'écosystème de la robotique et des véhicules autonomes pour développer un ensemble de benchmarks qui reflètent les exigences uniques des applications physiques d'IA à partir de modèles de fondation du monde.

Les benchmarks Cosmos sont conçus pour évaluer la prochaine génération de modèles du monde avec des critères avancés comme la cohérence 3D et l'alignement physique, essentiels pour la robotique et les systèmes autonomes.

Comparés à VideoLDM (VLDM), un modèle générateur de référence pour la synthèse vidéo, les WFM Cosmos excellent dans le domaine de la précision géométrique avec un taux d'erreur Sampson plus faible et une meilleure stabilité temporelle. Les benchmarks évaluent également les modèles de fondation du monde basés sur des comportements physiques comme la gravité et la dynamique de collision.

Les modèles de fondation du monde Cosmos surpassent constamment les VLDM en matière de cohérence visuelle, atteignant des taux de réussite d'estimation de pose jusqu'à 14 fois plus élevés. Les modèles de diffusion offrent une meilleure fidélité dès l'emploi, mais les modèles autorégressifs offrent d'excellentes performances pour les modèles personnalisés.

Génération de données synthétiques

Cas d'utilisation

Comment les développeurs utilisent-ils NVIDIA Cosmos ?

Découvrez comment les développeurs spécialisés dans la robotique, les véhicules autonomes et de vision avec l'IA peuvent utiliser Cosmos pour faire progresser leur travail.

Recherche de vidéos

Cosmos aide les développeurs à créer des jeux de données sur mesure pour leur formation de modèles d'IA. Qu'il s'agisse de séquences de routes enneigées pour les véhicules autonomes ou de scènes d'entrepôt occupées pour la robotique, Cosmos simplifie le marquage et la recherche vidéo en comprenant les modèles spatiaux et temporels, ce qui facilite la préparation des données d'entraînement.

Cela permet de gagner du temps, de réduire les coûts et de fournir des modèles d'IA très pertinents et percutants pour une utilisation dans le monde réel.

Génération de données synthétiques

Écosystème

Adopté par les principaux innovateurs en IA physique

Les développeurs de modèles dans les secteurs de la robotique, des véhicules autonomes et de vision avec l'IA utilisent Cosmos pour accélérer le développement de l'IA physique.

Logo de 1X Technologies
Logo d'AgileX Robotics
Logo d'Agility Robotics
Logo de Figure AI
Logo de Foretellix
Logo de Fourier
Logo de Galbot
Logo d'Hillbot
Logo d'IntBot
Logo de Neura Robotics
Logo de Skild AI
Logo d'Uber
Logo de Virtual Incision
Logo de Waabi
Logo de Wayve
Logo de Xpeng

Prochaines étapes

Vous voulez vous lancer ?

Testez un modèle de fondation du monde dans le catalogue des API NVIDIA ou commencez à développer vos modèles de fondation du monde avec NVIDIA Cosmos.

Développez vos modèles personnalisés

NVIDIA NeMo fournit un pipeline de bout en bout pour organiser, tokeniser et affiner les modèles de fondation du monde sur n'importe quelle plateforme.

Commencer à organiser des données vidéo pour des modèles de fondation du monde

Traitement accéléré des données et pipeline de conservation alimentés par NVIDIA NeMo Curator et optimisés pour les GPU de datacenter NVIDIA.

Foire aux questions

Vous allez être redirigé vers une page NVIDIA hébergée en dehors de la France

Continuer
Select Location
Middle East