Implementar al instante la IA generativa con NVIDIA NIM

Explore los últimos modelos de IA creados por la comunidad con una API optimizada y acelerada por NVIDIA. Luego, impleméntelos en cualquier lugar con los microservicios de inferencia NVIDIA NIM.

Probar ahora Ver vídeo

Modelos

Probar ahora

Pruebe ya los modelos abiertos más destacados

Integraciones

La IA acelerada está a solo una llamada de API

Póngase en marcha rápidamente con API conocidas.

Compatibilidad fluida con bibliotecas populares

Use las API de NVIDIA desde sus herramientas y aplicaciones con tan solo tres líneas de código.

Cree con las herramientas que desee

Trabaje con sus marcos de programación LLM favoritos, incluidos LangChain y LlamaIndex, e implemente sus aplicaciones con facilidad.

Learn More About Building With These Tools and NVIDIA NIM

Acceder a información a partir de los datos empresariales

Los datos impulsan las aplicaciones empresariales modernas. Conecte los agentes de IA a los datos empresariales a escala con un motor de consultas de IA que utiliza generación aumentada de recuperación (RAG) para ofrecer a los empleados conocimiento institucional instantáneo y preciso.

Más información

NVIDIA Blueprints

Todo lo que necesita para crear aplicaciones de IA generativa impactantes. Cada plano incluye microservicios NVIDIA NIM y de partners, uno o más agentes de IA, código de ejemplo, instrucciones de personalización y un gráfico de Helm para la implementación.

Más información

Probarlo ahora

Ejecución en cualquier plataforma

Acelera tu implementación de IA con NVIDIA NIM

NVIDIA NIM, parte de NVIDIA AI Enterprise, es un conjunto de microservicios de inferencia fáciles de usar creados para acelerar la implementación de modelos de base en cualquier nube o centro de datos y para ayudar a proteger sus datos.

Implemente ahora

Accelerate Your AI Deployment With NVIDIA NIM

Más información sobre NVIDIA NIM

Aprenda a implementar NIM en cinco minutos

Implementar NIM

Implemente NIM para su modelo con un solo comando. También puede ejecutar NIM fácilmente con modelos ajustados.

Ejecutar inferencia

Ponga en marcha NIM con el motor de entorno de ejecución óptimo basado en su infraestructura acelerada por NVIDIA.

Desarrollar

Los desarrolladores pueden integrar extremos NIM alojados automáticamente con tan solo unas pocas líneas de código.

Deploy

Run

Build

docker run nvcr.io/nim/publisher_name/model_name

 
 curl -X 'POST' \ 
  'http://0.0.0.0:8000/v1/completions' \ 
  -H 'accept: application/json' \ 
  -H 'Content-Type: application/json' \ 
  -d '{ 
  "model" : "model_name", 
  "prompt" : "Once upon a time", 
  "max_tokens" : 64 
 }' 

 
 import openai 
 client = openai.OpenAI( 
  base_url = "YOUR_LOCAL_ENDPOINT_URL", 
  api_key="YOUR_LOCAL_API_KEY" 
 ) 
 chat_completion = client.chat.completions.create( 
  model="model_name", 
  messages=[{"role" : "user" , "content" : "Write me a love song" }], 
  temperature=0.7 
 ) 

Lanzamiento local o escalado con Kubernetes

Implemente microservicios de IA en contenedores en cualquier infraestructura acelerada de NVIDIA, desde un único dispositivo hasta un todo un centro de datos.

Manténgase protegido e implemente con confianza

Implementa de forma segura con confianza

Disfrute de tiempos de ejecución de producción, incluidas las actualizaciones de seguridad continuas y ejecute sus aplicaciones empresariales con API estables respaldadas por un soporte de categoría empresarial.

Rebaje continuamente los costes y la huella de carbono

Reduce los costes y tu huella de carbono

Reduzca el coste operativo de ejecutar modelos en producción con tiempos de ejecución de IA que se optimizan continuamente para baja latencia y alto rendimiento en infraestructura acelerada por NVIDIA.

Rendimiento

NVIDIA NIM ofrece un rendimiento y latencia optimizados para maximizar la generación de token, dar soporte a usuarios simultáneos en horas punta y mejorar la capacidad de respuesta.

Configuración: Llama3.1-8B-instruct, 1x H100SXM; entrada 1000 tokens, salida 1000 tokens. Peticiones simultáneas: 200. NIM ON: FP8. Rendimiento 6 354 tokens/s, TTFT 0.4 s, ITL: 31 ms. NIM OFF: FP8. rendimiento 2,265 tokens/s, TTFT 1.1 s, ITL: 85 ms

Personalización

Adapta microservicios NIM a tus necesidades específicas de dominio

Ajustar con NVIDIA NeMo

NVIDIA NeMo™ es una plataforma integral para desarrollar IA generativa personalizada en cualquier lugar. Incluye herramientas para entrenamiento, personalización y generación aumentada por recuperación (RAG, por sus siglas en inglés), barreras protectoras, selección de datos y preentrenamiento de modelos, ofreciendo a las empresas una forma fácil, rentable y rápida de adoptar IA generativa.

Leer el blog técnico

Empezar con los tutoriales

Vea los NIM de NVIDIA en acción

Habla con los datos de tu cadena de suministro usando NIM

Supercarga de software con RAG basado en eventos

Agentes de salud de IA generativa en tiempo real siempre disponibles

Los humanos digitales transforman sectores

Microservicios de IA generativa para cribado virtual

Cómo Comprar

Primeros pasos

Empieza a crear prototipos gratis

Empiece con las API sin servidor administradas por NVIDIA, fáciles de usar.

Acceda a una infraestructura de IA totalmente acelerada.
Asegúrese de que sus datos no se utilicen para el entrenamiento de modelos.
Empiece de forma gratuita con 1000 créditos de inferencia.

Descargar e implementar

Ejecute NVIDIA NIM para escalar modelos de IA optimizados en la nube o en el centro de datos de su elección.

Asegúrese de que los datos nunca salgan de su enclave seguro.
Transfiera sin problemas desde los puntos finales de la nube a las API autohospedadas sin cambios de código.
Use una licencia de NVIDIA AI Enterprise para producción o empiece de forma gratuita con el Programa de desarrolladores de NVIDIA.

Crear ahora

Casos de uso

Impulse su innovación

Descubra cómo las API de NVIDIA respaldan casos de uso del sector y ponga en marcha su desarrollo de IA con ejemplos prácticos.

Humanos digitales

Dé vida a personajes de juegos o cree avatares virtuales interactivos para mejorar el servicio al cliente, lo que dará a su aplicación la posibilidad de conectar en mayor profundidad con los usuarios.

Más información

Creación de contenidos

Cree contenidos de gran interés, personalizados y precisos, sobre la base de los conocimientos especializados y la propiedad intelectual de su empresa.

Más información

Producción biomolecular

Los modelos generativos biomoleculares y la potencia computacional de las GPU exploran de manera eficiente el espacio químico, generando rápidamente diversos conjuntos de moléculas pequeñas adaptadas a objetivos o propiedades específicos de los fármacos.

Más información

Ecosistema

Lleve la IA de su empresa más lejos, más rápido

Únete a colaboradores líderes para desarrollar tus aplicaciones de IA con modelos, kits de herramientas,
bases de datos vectoriales, entornos de trabajo e infraestructura de nuestro ecosistema.

Recursos

Desbloquee, mejore y optimice

LaunchPad

Desbloquee la IA con un laboratorio práctico

Sienta el poder de la IA con soluciones integrales gracias a laboratorios prácticos y guiados para chatbots, detección de fármacos y optimización de rutas basados en RAG.

Ir a LaunchPad

Deep Learning Institute

Perfeccione sus conocimientos de IA

Tanto si es un particular que quiere formarse a su propio ritmo como si es una organización que desea aportar nuevas habilidades a su plantilla, los cursos de DLI para IA generativa, ciencia de datos y mucho más le ayudarán en su labor.

Empezar la formación con DLI

AI Workbench

Empiece por algo pequeño. Escale a lo grande.

NVIDIA AI Workbench ofrece a los desarrolladores la flexibilidad de ejecutar modelos habilitados para API en contenedores locales o remotos con tecnología de GPU. De esta forma, se pueden crear flujos de trabajo de proyectos interactivos que van desde la experimentación hasta la creación de prototipos y las pruebas de concepto.

Más información sobre AI Workbench

Noticias

NVIDIA NIM en las noticias

Eche un vistazo a los últimos comunicados de prensa de NVIDIA para ver el impacto que NIM y la IA generativa están teniendo en diversos sectores, partners y clientes, entre otros.

Documentación

Consulte la documentación técnica para empezar a crear prototipos y aplicaciones de IA empresariales con las API de NVIDIA.

Documentos de API de NVIDIA Documentos de NVIDIA NIM