Soluciones de inferencia de IA

Inferencia de IA más rápida y precisa

Impulse un rendimiento innovador a escala de centros de datos con sus aplicaciones y servicios habilitados por IA.

Explorar software

Descargar el libro electrónico | Pruebas de referencia de rendimiento | Para desarrolladores

Descripción
Ventajas
Software
Hardware
Casos de uso
Casos de éxito
Recursos
Próximos pasos

Descripción

Descripción
Ventajas
Software
Hardware
Casos de uso
Casos de éxito
Recursos
Próximos pasos

Empezar

Descripción

¿En qué consiste la inferencia de IA?

La inferencia de IA sirve para implementar los modelos de IA preentrenados y generar nuevos datos, y es donde la IA ofrece sus resultados, impulsando la innovación en todos los sectores. Los modelos de IA están creciendo rápidamente en tamaño, complejidad y diversidad, poniendo a prueba los límites de lo que se considera posible. De cara al correcto uso de la inferencia de IA, las organizaciones necesitan un enfoque integral que admita el ciclo de vida de la IA de extremo a extremo y herramientas que permitan a los equipos cumplir con sus objetivos en la era de las nuevas leyes de escalado.

Cómo empezar con la inferencia de IA

Explore una serie de charlas dirigidas por expertos sobre la plataforma de inferencia de IA de NVIDIA, incluido su hardware y software, y su compatibilidad con casos de uso en servicios financieros.

Ver seminarios web

Hágase con lo último en inferencia de IA de NVIDIA

Suscríbase para obtener las últimas noticias, actualizaciones y mucho más sobre inferencia de IA.

Mantente informado

Ventajas

Explora las ventajas de NVIDIA AI para la inferencia acelerada

Estandarizar la implementación

Estandariza la implementación de modelos en aplicaciones, marcos de IA, arquitecturas de modelos y plataformas.

Integra y escala con facilidad

Integra fácilmente con herramientas y plataformas en nubes públicas, en centros de datos locales y en el perímetro.

Menor coste

Consigue un alto rendimiento y utilización de la infraestructura de IA, reduciendo así los costes.

Alto rendimiento

Disfruta del mejor rendimiento del sector con la plataforma que ha establecido múltiples récords en MLPerf

, el punto de referencia líder del sector para la IA.

Software

Explora nuestro software de inferencia de IA

NVIDIA AI Enterprise consta de NVIDIA NIM™, NVIDIA Triton™ Inference Server, NVIDIA® TensorRT™ y otras herramientas para simplificar la creación, el uso compartido y la implementación de aplicaciones de IA. Con el soporte, la estabilidad, la gestión y la seguridad de nivel empresarial, las empresas pueden acelerar el tiempo de obtención del valor mientras eliminan el tiempo de inactividad no planificado.

NVIDIA NIM: implementa la IA generativa al instante

El camino más rápido hacia la inferencia de IA generativa

NVIDIA NIM es un conjunto de microservicios fáciles de usar diseñados para implementar, de forma segura y fiable, inferencias de modelos de IA de alto rendimiento en todo tipo de nubes, centros de datos y estaciones de trabajo.

Más información sobre NVIDIA NIM

Servidor de inferencia NVIDIA Triton para todas las cargas de trabajo de IA

Servidor de inferencia unificado para todas tus cargas de trabajo de IA

El servidor de inferencia NVIDIA Triton es un software de servicio de inferencia de código abierto que ayuda a las empresas a consolidar la infraestructura de servicio de modelos de IA a medida, acortar el tiempo necesario para implementar nuevos modelos de IA en producción y aumentar la capacidad de inferencia y predicción de IA.

Más información sobre el servidor de inferencia Triton

Un SDK para un rendimiento de inferencia líder en el sector

NVIDIA TensorRT incluye un tiempo de ejecución de inferencia y optimizaciones de modelos que ofrecen baja latencia y alto rendimiento para las aplicaciones de producción. El ecosistema TensorRT incluye TensorRT, TensorRT-LLM, TensorRT Model Optimizer y TensorRT Cloud.

Más información sobre TensorRT

Escalado de modelos de IA a través de la nube

Inferencia sin servidor NVIDIA DGX Cloud

Una solución de inferencia de IA sin servidor que acelera la innovación de IA con escalado automático, utilización de GPU eficiente en costes, flexibilidad multinube y escalabilidad perfecta.

Más información sobre la inferencia sin servidor DGX Cloud

Hardware

Explora nuestra infraestructura de inferencia de IA

Consigue el mejor rendimiento de IA con el software de inferencia de IA de NVIDIA, optimizado para la infraestructura acelerada por NVIDIA. Las tecnologías NVIDIA H200, L40S y NVIDIA RTX™ ofrecen una velocidad y eficiencia excepcionales para las cargas de trabajo de inferencia de IA en centros de datos, nubes y estaciones de trabajo.

Plataforma NVIDIA Blackwell

La arquitectura Blackwell de NVIDIA define la próxima fase evolutiva de la IA generativa y de la computación acelerada, con rendimiento, eficiencia y escalado sin precedentes. Blackwell incorpora seis tecnologías de transformación que contribuirán a avanzar en el en el procesamiento de datos, la automatización del diseño electrónico, la ingeniería asistida por ordenador y la computación cuántica.

Más información sobre Blackwell

GPU NVIDIA H200 con núcleos Tensor

La GPU NVIDIA H200 con núcleo Tensor potencia las cargas de trabajo de IA generativa y computación de alto rendimiento (HPC) con un rendimiento y capacidades de memoria revolucionarios. Al ser la primera GPU con HBM3e, la memoria más grande y rápida de la H200 impulsa la aceleración de la IA generativa y los modelos lingüísticos de gran tamaño (LLM) al tiempo que supone un avance para la computación científica para cargas de trabajo de HPC.

Más información sobre H200

GPU NVIDIA L40S

La combinación del software de servicio de inferencia de NVIDIA con la GPU L40S proporciona una plataforma poderosa para modelos entrenados listos para la inferencia. Con soporte para la escasez estructural y una amplia gama de precisiones, la L40S ofrece hasta 1,7 veces el rendimiento de inferencia de la GPU NVIDIA A100 Tensor Core.

Más información sobre L40S

Estación de trabajo de IA NVIDIA RTX

Las estaciones de trabajo NVIDIA RTX destacan en inferencia de IA e impulsan los flujos de trabajo de IA aumentada con soluciones escalables. Estas estaciones de trabajo, ideales para implementar modelos de IA con parámetros más pequeños o precisión reducida, permiten una inferencia de IA local eficiente para grupos de trabajo o departamentos.

Más información sobre las estaciones de trabajo de IA RTX

Presentamos NVIDIA DGX Spark

DGX Spark lleva la potencia de NVIDIA Grace Blackwell™ a los ordenadores de sobremesa de los desarrolladores. El superchip GB10, combinado con 128 GB de memoria de sistema unificada, permite a investigadores de IA, científicos de datos y estudiantes trabajar con modelos de IA de forma local con hasta 200 000 millones de parámetros.

Más información

Casos de uso

Cómo se utiliza la inferencia de IA

Compruebe cómo la inferencia de NVIDIA AI apoya los casos de uso del sector y empiece su desarrollo con ejemplos seleccionados.

Humanos digitales
Generación de contenido
Generación biomolecular
Detección de fraude
Chatbot de IA
Análisis de vulnerabilidades de seguridad

Humanos digitales

NVIDIA ACE es un conjunto de tecnologías que ayudan a los desarrolladores a dar vida a los humanos digitales. Entre los microservicios ACE están NVIDIA NIM: microservicios fáciles de implementar y de alto rendimiento, optimizados para ejecutarse en ordenadores con IA con NVIDIA RTX o en NVIDIA Graphics Delivery Network (GDN), una red global de GPU que ofrece procesamiento de humanos digitales de baja latencia a 100 países.

Más información sobre los humanos digitales

Pruébalo ahora

Crea avatares digitales con IA generativa

Generación de contenido

Con la IA generativa puedes generar contenido altamente relevante, personalizado y preciso, basado en la experiencia del dominio y la IP patentada de tu empresa.

Más información sobre la generación de contenido

Más información sobre la generación de imágenes

IA generativa para la creación de contenido

Generación biomolecular

Los modelos generativos biomoleculares y el poder computacional de las GPU exploran eficientemente el espacio químico, generando con rapidez diversos conjuntos de pequeñas moléculas adaptadas a objetivos o propiedades de fármacos específicos.

Más información sobre la generación biomolecular

IA generativa biomolecular para cribado virtual

Detección de fraude

Las instituciones financieras necesitan poder detectar y prevenir las actividades fraudulentas más sofisticadas, como el robo de identidad, la apropiación de cuentas o el blanqueo de capitales. Las aplicaciones con IA pueden minimizar los falsos positivos en la detección de fraudes en transacciones, mejorar la precisión en la verificación de identidad para los requisitos KYC (siglas en inglés de «conoce a tu cliente») y hacer más efectivos los esfuerzos contra el blanqueo de capitales. mejorar la experiencia del cliente y la salud financiera de tu empresa.

Más información sobre la detección de fraudes

Chatbot de IA

El objetivo de las organizaciones es crear chatbots de IA más inteligentes utilizando generación aumentada por recuperación (RAG). Gracias a la RAG, los chatbots pueden responder de forma precisa a preguntas específicas de un sector mediante la recuperación de información procedente de la base de conocimientos de una organización y ofrecer respuestas en tiempo real y en lenguaje natural. Estos chatbots pueden servir para mejorar la atención al cliente, personalizar los avatares de IA, gestionar el conocimiento empresarial, agilizar la contratación de empleados, brindar asistencia de TI inteligente, crear contenido y mucho más.

Más información sobre los chatbots de IA

Análisis de vulnerabilidades de seguridad

La resolución de problemas de seguridad de software cada vez es más difícil, ya que el número de errores de seguridad notificados en la base de datos de vulnerabilidades y exposiciones comunes (CVE) alcanzó un máximo histórico en 2022. Al usar la IA generativa, es posible mejorar la defensa contra vulnerabilidades mientras se disminuye la carga de los equipos de seguridad.

Más información sobre el análisis de vulnerabilidades de seguridad

Explora todos los casos de uso

Casos de éxito

Cómo los líderes del sector impulsan la innovación con la inferencia de IA

Más historias de clientes

Plataforma de IA para empresas de telecomunicaciones con NVIDIA DGX Cloud

Amdocs

Acelera el rendimiento de la IA generativa y reduce los costes

Descubre cómo Amdocs creó amAIz, una plataforma de IA generativa específica de dominio para empresas de telecomunicaciones, que utiliza los microservicios de inferencia NVIDIA DGX™ Cloud y NVIDIA NIM para mejorar la latencia, aumentar la precisión y reducir los costes.

Leer el caso de práctico

Reconocimiento óptico de caracteres con inferencia Triton

Snapchat

Mejorar la compra de ropa con la IA

Descubre cómo Snapchat mejoró la experiencia de compra de ropa y el reconocimiento óptico de caracteres capaz de reconocer los emoji con el servidor de inferencia Triton para escalar, reducir costes y acelerar el tiempo de producción.

Leer el caso de práctico

Inferencia 5 veces más rápida con TensorRT

Amazon

Acelera la satisfacción del cliente

Descubre cómo Amazon mejoró la satisfacción del cliente acelerando por cinco su inferencia gracias a TensorRT.

Leer el caso de práctico

Recursos

Lo último en recursos de inferencia por IA

Blogs
Sesiones
Formación
Vídeos

$Math Test? No Problems: NVIDIA Team Scores Kaggle Win With Reasoning Model$

April 15, 2025

Math Test? No Problems: NVIDIA Team Scores Kaggle Win With Reasoning Model

The final days of the AI Mathematical Olympiad’s latest competition were a transcontinental relay for team NVIDIA. Every evening, two team members on opposite ends of the U.S. would submit an AI reasoning model to Kaggle — the online Olympics of data science and machine learning. They’d wait a tense five hours before learning how Read Article

Seguir leyendo

April 03, 2025

From Browsing to Buying: How AI Agents Enhance Online Shopping

Online shopping puts a world of choices at people’s fingertips, making it convenient for them to purchase and receive orders — all from the comfort of their homes.

Seguir leyendo

March 18, 2025

AI Factories Are Redefining Data Centers and Enabling the Next Era of AI

AI is fueling a new industrial revolution — one driven by AI factories. Unlike traditional data centers, AI factories do more than store and process data — they manufacture intelligence at scale, transforming raw data into real-time insights. For enterprises and countries around the world, this means dramatically faster time to value — turning AI Read Article

Seguir leyendo

Ver más blogs

Ver más sesiones

Da tus primeros pasos en la inferencia con NVIDIA LaunchPad

¿Ya tienes un proyecto de IA? Haz una solicitud para obtener experiencia práctica en las pruebas y la creación de prototipos de tus soluciones de IA.

Solicitar

Explora las rutas de aprendizaje de la IA generativa y los LLM

Mejora tus habilidades técnicas en IA generativa y en modelos lingüísticos de gran tamaño con nuestras completas rutas de aprendizaje.

Explorar ahora

Empieza con la inferencia generativa de IA en NVIDIA LaunchPad

Acelera tu viaje hacia la IA generativa gracias al acceso inmediato y a corto plazo a los microservicios de inferencia NVIDIA NIM y a los modelos de IA, totalmente gratis.

Empezar

Ver más formación

Implementación de IA generativa en producción con NVIDIA NIM

Accede al potencial de la IA generativa con NVIDIA NIM. Este vídeo muestra cómo los microservicios NVIDIA NIM pueden transformar tu implementación de IA en un potente centro de producción.

Ver el vídeo (01:55)

Las 5 razones por las que Triton está simplificando la inferencia

El servidor de inferencia Triton simplifica la implementación de modelos de IA a escala en producción. El software de servicio de inferencia de código abierto permite a los equipos implementar modelos de IA entrenados desde cualquier marco, desde el almacenamiento local o la plataforma en la nube, en cualquier infraestructura basada en GPU o CPU.

Ver el vídeo (01:59)

UneeQ

NVIDIA presenta NIM

¿Alguna vez se ha preguntado de qué es capaz la tecnología NIM de NVIDIA? Adéntrese en el mundo de los robots y los humanos digitales para ver qué pueden hacer los NIM.

Ver el vídeo (13:42)

Ver más vídeos

Próximos pasos

¿Listo para empezar?

Explora todo lo necesario para empezar a desarrollar tu aplicación de IA, incluidas las últimas documentaciones, tutoriales, blogs técnicos y mucho más.

Ponte en contacto con nosotros

Habla con un especialista en productos NVIDIA sobre cómo pasar del piloto a la producción con la seguridad, la estabilidad de las API y el soporte de NVIDIA AI Enterprise.

Contactar

Obtén lo último en IA de NVIDIA

Suscríbete para obtener las últimas noticias, actualizaciones y mucho más de NVIDIA.

Mantente al día

Próximos pasos

¿Listo para empezar?

Explore todo lo necesario para empezar a desarrollar tu aplicación de IA, incluidas las últimas documentaciones, tutoriales, blogs técnicos y mucho más.

Empezar a desarrollar

Póngase en contacto con nosotros

Hable con un especialista en productos de NVIDIA sobre cómo pasar de la fase piloto a la de producción con la seguridad, la estabilidad de las API y el soporte de NVIDIA AI Enterprise.

Contacto

Hágase con lo último en inferencia de IA de NVIDIA

Suscríbase para obtener las últimas noticias empresariales, los anuncios y mucho más de NVIDIA.

Manténgase informado

Inferencia de IA más rápida y precisa

Descripción

¿En qué consiste la inferencia de IA?

Cómo empezar con la inferencia de IA

Hágase con lo último en inferencia de IA de NVIDIA

Ventajas

Explora las ventajas de NVIDIA AI para la inferencia acelerada

Estandarizar la implementación

Integra y escala con facilidad

Menor coste

Alto rendimiento

Software

Explora nuestro software de inferencia de IA

El camino más rápido hacia la inferencia de IA generativa

Servidor de inferencia unificado para todas tus cargas de trabajo de IA

Un SDK para un rendimiento de inferencia líder en el sector

Inferencia sin servidor NVIDIA DGX Cloud

Hardware

Explora nuestra infraestructura de inferencia de IA

Plataforma NVIDIA Blackwell

GPU NVIDIA H200 con núcleos Tensor

GPU NVIDIA L40S

Estación de trabajo de IA NVIDIA RTX

Presentamos NVIDIA DGX Spark

Casos de uso

Cómo se utiliza la inferencia de IA

Humanos digitales

Casos de éxito

Cómo los líderes del sector impulsan la innovación con la inferencia de IA

Acelera el rendimiento de la IA generativa y reduce los costes

Mejorar la compra de ropa con la IA

Acelera la satisfacción del cliente

Recursos

Lo último en recursos de inferencia por IA

(17 sessions)

Próximos pasos

¿Listo para empezar?

Ponte en contacto con nosotros

Obtén lo último en IA de NVIDIA

Próximos pasos

¿Listo para empezar?

Póngase en contacto con nosotros

Hágase con lo último en inferencia de IA de NVIDIA

Reciba las últimas noticias de NVIDIA sobre inferencia de AI