Descripción General

¿Qué Es la Inferencia de IA?

La inferencia de IA es el lugar donde se implementan los modelos de IA preentrenados para generar nuevos datos y donde la IA ofrece resultados, lo que impulsa la innovación en todas los sectores. Los modelos de IA se expanden rápidamente en tamaño, complejidad y diversidad, ampliando el horizonte de lo posible. Para utilizar con éxito la inferencia de IA, las organizaciones necesitan un enfoque de pila completa que admita el ciclo de vida integral de la IA y herramientas que les permitan a los equipos cumplir sus objetivos.

Implementación de IA Generativa en Producción

Explore las principales consideraciones a la hora de implementar y escalar la IA generativa en producción, incluido el papel fundamental de la inferencia de IA.

Beneficios

Explore los Beneficios de la IA de NVIDIA para la Inferencia Acelerada

Estandarice la Implementación

Estandarice la Implementación

Estandarice la implementación de modelos en aplicaciones, frameworks de IA, arquitecturas de modelos y plataformas.

Integre y Escale Con Facilidad

Integre y Escale Con Facilidad

Integre fácilmente con herramientas y plataformas en instancias de cloud públicas, en data centers locales y en el edge.

Menor Costo

Menor Costo

Disfrute de un alto caudal y nivel de utilización de la infraestructura de IA, reduciendo así el costo.

Gran Desempeño

Gran Desempeño

Disfrute del mejor desempeño del sector con la plataforma que establece múltiples récords en MLPerf de forma constante, el punto de referencia líder del sector para la IA.

Software

Descubra Nuestro Software de Inferencia de IA

NVIDIA AI Enterprise consta de NVIDIA NIM™, Servidor de Inferencia NVIDIA Triton™, NVIDIA® TensorRT™ y otras herramientas para simplificar la creación, el intercambio y la implementación de aplicaciones de IA. Con soporte, estabilidad, capacidad de administración y seguridad de nivel empresarial, las empresas pueden acelerar el tiempo de generación de valor al tiempo que eliminan el tiempo de inactividad no planificado.

NVIDIA NIM: Implemente la IA Generativa Al Instante

El Camino Más Rápido Hacia la Inferencia de IA Generativa

NVIDIA NIM es un conjunto de microservicios fáciles de usar, hechos para la implementación segura y confiable de inferencia de modelos de IA de alto desempeño en clouds, data centers y workstations.

Servidor de Inferencia NVIDIA Triton para Todas las Cargas de Trabajo de IA

Servidor de Inferencia Unificado para Todas Sus Cargas de Trabajo de IA

El Servidor de Inferencia NVIDIA Triton es un software de inferencia de código abierto que ayuda a las empresas a consolidar una infraestructura de servicio de modelos de IA personalizada, acortar el tiempo necesario para implementar nuevos modelos de IA en producción y aumentar la capacidad de inferencia y predicción de IA.

NVIDIA TensorRT

Un SDK para Optimizar la Inferencia y el Tiempo de Ejecución

NVIDIA TensorRT incluye un tiempo de ejecución de inferencia y optimizaciones de modelos que ofrecen baja latencia y alto rendimiento para las aplicaciones de producción. El ecosistema de TensorRT incluye TensorRT, TensorRT-LLM, TensorRT Model Optimizer y TensorRT Cloud.

Hardware

Explore Nuestra Infraestructura de Inferencia de IA

Disfrute de un desempeño de IA incomparable con el software de inferencia de IA de NVIDIA, optimizado para la infraestructura acelerada por NVIDIA. Las tecnologías NVIDIA H200, L40S y NVIDIA RTX™ ofrecen una velocidad y eficiencia excepcionales para las cargas de trabajo de inferencia de IA en data centers, clouds y workstations.

H200 Ootencia la IA Generativa

GPU NVIDIA H200 Tensor Core

La GPU NVIDIA H200 Tensor Core potencia las cargas de trabajo de IA generativa y computación de alto desempeño (HPC) con revolucionarias capacidades de desempeño y memoria. Como la primera GPU con HBM3e, la memoria de la H200, más grande y rápida, impulsa la aceleración de la IA generativa y los grandes modelos de lenguaje

GPU NVIDIA L40S

GPU NVIDIA L40S

La combinación de la pila completa de software de inferencia de NVIDIA con la GPU L40S proporciona una potente plataforma para modelos entrenados listos para la inferencia. Con soporte para la escasez estructural y una amplia gama de precisiones, el L40S ofrece hasta 1,7 veces el desempeño de inferencia de la GPU NVIDIA A100 Tensor Core.

La tecnología NVIDIA RTX lleva la IA a la computación visual

Tecnología NVIDIA RTX

La tecnología NVIDIA RTX lleva la IA a la computación visual, acelerando la creatividad mediante la automatización de tareas y la optimización de procesos de computación intensiva. Con el poder de los núcleos CUDA®, RTX mejora la renderización en tiempo real, la IA, los gráficos y el rendimiento de la computación.

Presentación de NVIDIA Project DIGITS

NVIDIA Project DIGITS lleva el poder de Grace Blackwell a las computadoras de escritorio de los desarrolladores. El superchip GB10, combinado con 128 GB de memoria de sistema unificado, permite a los investigadores de IA, científicos de datos y estudiantes trabajar con modelos de IA localmente con hasta 200 mil millones de parámetros.

Casos de Uso

Cómo Se Utiliza la Inferencia de IA

Descubre cómo la IA de NVIDIA admite casos de uso del sector y ponga rápidamente en marcha su desarrollo de IA con ejemplos seleccionados.

Humanos Digitales

NVIDIA ACE es un paquete de tecnologías que ayudan a los desarrolladores a dar vida a los humanos digitales. Varios microservicios de ACE son NIM de NVIDIA: microservicios fáciles de implementar, de alto rendimiento, optimizados para ejecutarse en PC NVIDIA RTX con IA o en NVIDIA Graphics Delivery Network (GDN), una red global de GPU que proporciona procesamiento humano digital de baja latencia a 100 países. 

Cree avatares digitales con la IA Generativa

Historias de Clientes

Cómo Impulsan la Innovación los Líderes del Sector con la Inferencia de IA

Plataforma de IA para empresas de telecomunicaciones, con NVIDIA DGX Cloud
Amdocs

Acelera el Desempeño de la IA Generativa y Reduzca los Costos

Lea cómo Amdocs creó amAIz, una plataforma de IA generativa específica de un dominio para las empresas de telecomunicaciones, mediante el uso de microservicios de inferencia NVIDIA DGX™ Cloud y NVIDIA NIM para mejorar la latencia, aumentar la precisión y reducir los costos.

Reconocimiento Óptico de Caracteres Gracias a la Inferencia de Triton
Snapchat

Mejora de la Compra de Ropa con IA

Descubra cómo Snapchat mejoró la experiencia de compra de ropa y el reconocimiento óptico de caracteres compatible con emojis mediante el Servidor de Inferencia Triton para escalar, reducir los costos y acelerar el tiempo de producción.

Inferencia 5 veces más rápida con TensorRT
Amazon

Acelere la Satisfacción del Cliente

Descubra cómo Amazon mejoró la satisfacción del cliente al acelerar su inferencia 5 veces más rápido con TensorRT.

Recursos

Lo Último en Recursos de Inferencia de IA

From Browsing to Buying: How AI Agents Enhance Online Shopping
April 03, 2025
Online shopping puts a world of choices at people’s fingertips, making it convenient for them to purchase and receive orders — all from the comfort of their homes.
AI Factories Are Redefining Data Centers and Enabling the Next Era of AI
March 18, 2025
AI is fueling a new industrial revolution — one driven by AI factories. Unlike traditional data centers, AI factories do more than store and process data — they manufacture intelligence at scale, transforming raw data into real-time insights. For enterprises and countries around the world, this means dramatically faster time to value — turning AI Read Article
Telecom Leaders Call Up Agentic AI to Improve Network Operations
March 18, 2025
Global telecommunications networks can support millions of user connections per day, generating more than 3,800 terabytes of data per minute on average. That massive, continuous flow of data generated by base stations, routers, switches and data centers — including network traffic information, performance metrics, configuration and topology — is unstructured and complex. Not surprisingly, traditional Read Article

Próximos Pasos

¿Listo para Empezar?

Explore todo lo que necesita para comenzar a desarrollar su aplicación de IA, incluyendo la documentación más reciente, los tutoriales, blogs técnicos y mucho más.

Contáctenos

Contáctenos

Hable con un especialista en productos NVIDIA sobre el paso de la fase de pruebas a la de producción con la seguridad, la estabilidad de las API y el soporte de NVIDIA AI Enterprise.

Descubre las Últimas Novedades Sobre IA de NVIDIA

Descubre las Últimas Novedades Sobre IA de NVIDIA

Regístrate para recibir las últimas noticias, actualizaciones y más información de NVIDIA.

Select Location
Middle East