Accédez à de nouveaux modèles d’IA créés par la communauté avec une API optimisée et accélérée par NVIDIA, puis déployez vos applications n’importe où grâce aux microservices NVIDIA NIM pour l'inférence.
Intégrations
Mettez en œuvre rapidement vos projets avec des API aux performances reconnues.
Use NVIDIA APIs from your existing tools and applications with as little as three lines of code.
Travaillez avec vos frameworks de programmation de LLM favoris, tels que Langchain et LlamaIndex, et déployez facilement vos applications.
Les données alimentent les applications d'entreprise. Connectez des agents d'IA à des données d'entreprise en toute évolutivité grâce à un moteur de requêtes optimisé par l'IA qui utilise la génération augmentée par récupération (RAG) pour répondre aux attentes des employés en leur donnant accès à des ressources institutionnelles de manière instantanée et pertinente.
Accédez à tout ce dont vous avez besoin pour créer des applications d'IA générative à haute valeur ajoutée. Chaque modèle comprend des microservices de NVIDIA NIM et de ses partenaires, un ou plusieurs agents d'IA, un exemple de code, des instructions de personnalisation et un graphique Helm pour le déploiement.
Exécution multiplateformes
Composant de l'environnement logiciel NVIDIA AI Enterprise, NVIDIA NIM regroupe un ensemble de microservices pour l'inférence d’une grande simplicité d’utilisation vous permettant d’accélérer le déploiement des modèles de fondation sur n’importe quel Cloud ou Data Center tout en préservant la sécurité de vos données.
Déployez NIM pour votre modèle avec une seule commande. Vous pouvez également exécuter NIM avec des modèles ayant fait l'objet d'un réglage de précision.
Procédez à la mise en service de NIM en utilisant un moteur d’exécution sélectionné en fonction de votre infrastructure accélérée par NVIDIA.
Les développeurs peuvent intégrer des points de terminaison NIM auto-hébergés en ayant recours à quelques lignes de code seulement.
Déployez en toute transparence des microservices d'IA conteneurisés sur n'importe quelle infrastructure NVIDIA accélérée, que ce soit sur un appareil unique ou via des Data Centers.
Appuyez-vous sur des environnements d'exécution adaptés à la production avec des mises à jour de sécurité disponibles en continu, et exécutez vos applications commerciales avec des API stables tout en bénéficiant d’une assistance technique pour les entreprises.
Réduisez les coûts d’exploitation relatifs aux modèles en production, grâce à des environnements d’exécution d’IA continuellement optimisés pour fournir une faible latence et un rendement élevé sur une infrastructure accélérée par NVIDIA.
NVIDIA NIM fournit une latence et un débit immédiatement optimisés pour maximiser la génération de jetons, prendre en charge une grande densité d'utilisateurs aux heures de pointe et améliorer la réactivité de manière significative.
Configuration : Llama3.1-8B-instruct, 1x H100SXM ; 1 000 jetons d'entrée pour 1 000 jetons de sortie. Demandes simultanées : 200. Avec NIM : FP8 pour un débit de 6 354 jetons/s ; TTFT : 0,4 s, ITL : 31 ms. Sans NIM : FP8 pour un débit de 2 265 jetons/s ; TTFT : 1,1 s, ITL : 85 ms.
Personnalisation
NVIDIA NeMo™ est une plateforme de bout en bout dédiée au développement multifactoriel d’une IA générative sur mesure, qui comprend des outils pour l’entraînement, la personnalisation, la génération augmentée par récupération (RAG), le guardrailing, la conservation des données et le pré-entraînement des modèles, offrant ainsi aux entreprises une méthode simple, rentable et rapide pour adopter l’IA générative.
Acheter des Solutions
Cas d'utilisation
Prenez connaissance d'exemples soigneusement sélectionnés pour découvrir comment les API de NVIDIA peuvent prendre en charge des cas d’utilisation spécifiques à chaque secteur et accélérer le développement de l’IA.
Écosystème
Rejoignez nos partenaires de renom pour développer vos applications d’IA avec des modèles, des kits d’outils, des bases de données vectorielles,
des frameworks et une infrastructure de pointe reposant sur un écosystème leader du secteur.
Ressources
Consultez notre documentation technique pour commencer à prototyper et à développer vos applications d’IA d’entreprise avec les API de NVIDIA.