Descripción

¿En qué consiste la inferencia de IA?

La inferencia de IA sirve para implementar los modelos de IA preentrenados y generar nuevos datos, y es donde la IA ofrece sus resultados, impulsando la innovación en todos los sectores. Los modelos de IA están creciendo rápidamente en tamaño, complejidad y diversidad, poniendo a prueba los límites de lo que se considera posible. De cara al correcto uso de la inferencia de IA, las organizaciones necesitan un enfoque integral que admita el ciclo de vida de la IA de extremo a extremo y herramientas que permitan a los equipos cumplir con sus objetivos.

Implementar la IA generativa en producción

Explora las consideraciones clave para implementar y escalar la IA generativa en producción, incluido el papel crítico de la inferencia de la IA.

Ventajas

Explora las ventajas de NVIDIA AI para la inferencia acelerada

Estandarizar la implementación

Estandarizar la implementación

Estandariza la implementación de modelos en aplicaciones, marcos de IA, arquitecturas de modelos y plataformas.

Integra y escala con facilidad

Integra y escala con facilidad

Integra fácilmente con herramientas y plataformas en nubes públicas, en centros de datos locales y en el perímetro.

Menor coste

Menor coste

Consigue un alto rendimiento y utilización de la infraestructura de IA, reduciendo así los costes.

Alto rendimiento

Alto rendimiento

Disfruta del mejor rendimiento del sector con la plataforma que ha establecido múltiples récords en MLPerf

, el punto de referencia líder del sector para la IA.

Software

Explora nuestro software de inferencia de IA

NVIDIA AI Enterprise consta de NVIDIA NIM™, NVIDIA Triton™ Inference Server, NVIDIA® TensorRT™ y otras herramientas para simplificar la creación, el uso compartido y la implementación de aplicaciones de IA. Con el soporte, la estabilidad, la gestión y la seguridad de nivel empresarial, las empresas pueden acelerar el tiempo de obtención del valor mientras eliminan el tiempo de inactividad no planificado.

NVIDIA NIM: implementa la IA generativa al instante

El camino más rápido hacia la inferencia de IA generativa

NVIDIA NIM es un conjunto de microservicios fáciles de usar diseñados para implementar, de forma segura y fiable, inferencias de modelos de IA de alto rendimiento en todo tipo de nubes, centros de datos y estaciones de trabajo.

Servidor de inferencia NVIDIA Triton para todas las cargas de trabajo de IA

Servidor de inferencia unificado para todas tus cargas de trabajo de IA

El servidor de inferencia NVIDIA Triton es un software de servicio de inferencia de código abierto que ayuda a las empresas a consolidar la infraestructura de servicio de modelos de IA a medida, acortar el tiempo necesario para implementar nuevos modelos de IA en producción y aumentar la capacidad de inferencia y predicción de IA.

NVIDIA TensorRT

Un SDK para optimizar la inferencia y el tiempo de ejecución

NVIDIA TensorRT incluye un tiempo de ejecución de inferencia y optimizaciones de modelos que ofrecen baja latencia y alto rendimiento para las aplicaciones de producción. El ecosistema TensorRT incluye TensorRT, TensorRT-LLM, TensorRT Model Optimizer y TensorRT Cloud.

Hardware

Explora nuestra infraestructura de inferencia de IA

Consigue el mejor rendimiento de IA con el software de inferencia de IA de NVIDIA, optimizado para la infraestructura acelerada por NVIDIA. Las tecnologías NVIDIA H200, L40S y NVIDIA RTX™ ofrecen una velocidad y eficiencia excepcionales para las cargas de trabajo de inferencia de IA en centros de datos, nubes y estaciones de trabajo.

H200 potencia la IA generativa

GPU NVIDIA H200 con núcleos Tensor

La GPU NVIDIA H200 con núcleo Tensor potencia las cargas de trabajo de IA generativa y computación de alto rendimiento (HPC) con un rendimiento y capacidades de memoria revolucionarios. Al ser la primera GPU con HBM3e, la memoria más grande y rápida de la H200 impulsa la aceleración de la IA generativa y los modelos lingüísticos de gran tamaño (LLM) al tiempo que supone un avance para la computación científica para cargas de trabajo de HPC.

GPU NVIDIA L40S

GPU NVIDIA L40S

La combinación del software de servicio de inferencia de NVIDIA con la GPU L40S proporciona una plataforma poderosa para modelos entrenados listos para la inferencia. Con soporte para la escasez estructural y una amplia gama de precisiones, la L40S ofrece hasta 1,7 veces el rendimiento de inferencia de la GPU NVIDIA A100 Tensor Core.

La tecnología NVIDIA RTX lleva la IA a la computación visual

Tecnología NVIDIA RTX

La tecnología NVIDIA RTX lleva la IA a la computación visual, acelerando la creatividad, automatizando las tareas y optimizando los procesos de computación intensiva. Gracias a la potencia de los núcleos CUDA®, RTX mejora el renderizado en tiempo real, la IA, los gráficos y el rendimiento informático.

Casos de uso

Cómo se utiliza la inferencia de IA

Descubre cómo ayuda NVIDIA AI en casos de uso del sector y empieza tu desarrollo de IA conversacional con ejemplos seleccionados.

Humanos digitales

NVIDIA ACE es un conjunto de tecnologías que ayudan a los desarrolladores a dar vida a los humanos digitales. Entre los microservicios ACE están NVIDIA NIM: microservicios fáciles de implementar y de alto rendimiento, optimizados para ejecutarse en ordenadores con IA con NVIDIA RTX o en NVIDIA Graphics Delivery Network (GDN), una red global de GPU que ofrece procesamiento de humanos digitales de baja latencia a 100 países. 

Crea avatares digitales con IA generativa

Casos de éxito

Cómo los líderes del sector impulsan la innovación con la inferencia de IA

Plataforma de IA para empresas de telecomunicaciones con NVIDIA DGX Cloud
Amdocs

Acelera el rendimiento de la IA generativa y reduce los costes

Descubre cómo Amdocs creó amAIz, una plataforma de IA generativa específica de dominio para empresas de telecomunicaciones, que utiliza los microservicios de inferencia NVIDIA DGX™ Cloud y NVIDIA NIM para mejorar la latencia, aumentar la precisión y reducir los costes.

Reconocimiento óptico de caracteres con inferencia Triton
Snapchat

Mejorar la compra de ropa con la IA

Descubre cómo Snapchat mejoró la experiencia de compra de ropa y el reconocimiento óptico de caracteres capaz de reconocer los emoji con el servidor de inferencia Triton para escalar, reducir costes y acelerar el tiempo de producción.

Inferencia 5 veces más rápida con TensorRT
Amazon

Acelera la satisfacción del cliente

Descubre cómo Amazon mejoró la satisfacción del cliente acelerando por cinco su inferencia gracias a TensorRT.

Recursos

Lo último en recursos de inferencia por IA

AI Factories Are Redefining Data Centers and Enabling the Next Era of AI
March 18, 2025
AI is fueling a new industrial revolution — one driven by AI factories. Unlike traditional data centers, AI factories do more than store and process data — they manufacture intelligence at scale, transforming raw data into real-time insights. For enterprises and countries around the world, this means dramatically faster time to value — turning AI Read Article
Telecom Leaders Call Up Agentic AI to Improve Network Operations
March 18, 2025
Global telecommunications networks can support millions of user connections per day, generating more than 3,800 terabytes of data per minute on average. That massive, continuous flow of data generated by base stations, routers, switches and data centers — including network traffic information, performance metrics, configuration and topology — is unstructured and complex. Not surprisingly, traditional Read Article
New NVIDIA Software for Blackwell Infrastructure Runs AI Factories at Light Speed
March 18, 2025
The industrial age was fueled by steam. The digital age brought a shift through software. Now, the AI age is marked by the development of generative AI, agentic AI and AI reasoning, which enables models to process more data to learn and reason to solve complex problems. Just as industrial factories transform raw materials into Read Article

Próximos pasos

¿Listo para empezar?

Explora todo lo necesario para empezar a desarrollar tu aplicación de IA, incluidas las últimas documentaciones, tutoriales, blogs técnicos y mucho más.

Ponte en contacto con nosotros

Ponte en contacto con nosotros

Habla con un especialista en productos NVIDIA sobre cómo pasar del piloto a la producción con la seguridad, la estabilidad de las API y el soporte de NVIDIA AI Enterprise.

Obtén lo último en IA de NVIDIA

Obtén lo último en IA de NVIDIA

Suscríbete para obtener las últimas noticias, actualizaciones y mucho más de NVIDIA.

Select Location
Middle East