GPU NVIDIA H200 Tensor Core

Supercarga de cargas de trabajo de IA y HPC.

Quiero estar informado cuando este producto esté disponible.

Hoja de Datos | Especificaciones | Rendimiento del Producto del Data Center

Introducción

La GPU Más Poderosa del Mundo

La GPU NVIDIA H200 Tensor Core sobrealimenta las cargas de trabajo de IA generativas y de computación de alto rendimiento (HPC) con capacidades de rendimiento y memoria que cambian el juego. Como la primera GPU con HBM3E, la memoria más grande y rápida del H200 alimenta la aceleración de la IA generativa y los grandes modelos de lenguaje (LLM) al tiempo que avanza la computación científica para las cargas de trabajo de HPC.

NVIDIA Impulsa Hopper, la Plataforma de Computación de IA Líder del Mundo

Según la arquitectura NVIDIA Hopper ™, la NVIDIA HGX H200 presenta la GPU NVIDIA H200 Tensor Core con memoria avanzada para manejar cantidades masivas de datos para IA generativas y cargas de trabajo de computación de alto rendimiento.

Lea el Comunicado de Prensa

Destacados

Experiencia en el Siguiente Nivel de Rendimiento

Inferencia Llama2 70B

1.9X Mas Rapido

Inferencia GPT-3 175B

1.6X Mas Rapido

Computación de Alto Rendimiento

110X Mas Rapido

Beneficios

Mayor Rendimiento y Memoria Más Grande y Más Rápida

Basada en la arquitectura NVIDIA Hopper, la NVIDIA H200 es la primera GPU que ofrece 141 gigabytes (GB) de la memoria HBM3E a 4.8 terabytes por segundo (TB/s), que casi duplica la capacidad de la GPU NVIDIA H100 Tensor Core con 1.4 veces más ancho de banda de memoria. La memoria más grande y rápida del H200 acelera la IA generativa y las LLM, al tiempo que avanza la computación científica para cargas de trabajo HPC con una mejor eficiencia energética y un menor costo total de propiedad.

Up to 1.6 Higher Inference Performance with NVIDIA H200

Desbloquea Ideas con Inferencia de LLM de Alto Rendimiento

En el panorama en constante evolución de la IA, las empresas confían en LLM para abordar una amplia gama de necesidades de inferencia. Un acelerador de inferencia de IA debe entregar el rendimiento más alto en el TCO más bajo cuando se implementa a escala para una base de usuarios masiva.

La H200 aumenta la velocidad de inferencia en hasta 2 veces en comparación con las GPU H100 al manejar LLM como LLAMA2.

Explore la Plataforma de Inferencia de IA de NVIDIA

Supercargue de Computación de Alto Rendimiento

El ancho de banda de memoria es crucial para las aplicaciones HPC, ya que permite una transferencia de datos más rápida, reduciendo los cuellos de botella de procesamiento complejos. Para aplicaciones HPC intensivas en memoria, como simulaciones, investigación científica e IA, el ancho de banda de memoria superior de H200 asegura que se puedan acceder y manipular los datos de manera eficiente, lo que lleva a 110 veces un tiempo más rápido a los resultados en comparación con las CPU.

Más Información Sobre Computación de Alto Rendimiento

Supercharge High-Performance Computing with NVIDIA H200

Better Energy Efficiency and Cost with NVIDIA H200

Rendimiento medido preliminar, sujeto a cambios.
Llama2 70B: ISL 2K, OSL 128 | Rendimiento | 1 GPU H100 BS 8 | 1 GPU H200 BS 32

Reduzca la Energía y TCO

Con la introducción de H200, la eficiencia energética y el TCO alcanzan nuevos niveles. Esta tecnología de vanguardia ofrece un rendimiento incomparable, todo dentro del mismo perfil de potencia que la H100. Las AI factories y los sistemas de supercomputación que no solo son más rápidos sino también más ecológicos, ofrecen una ventaja económica que impulsa a la IA y la comunidad científica hacia adelante.

Más Información Sobre la Computación Sostenible

Aceleración de la IA para los Servidores Empresariales Convencionales con H200 NVL

NVIDIA H200 NVL es ideal para diseños de estantes empresariales de menor consumo energético y refrigerados por aire que requieren configuraciones flexibles, lo que permite acelerar cada carga de trabajo de IA y HPC, independientemente del tamaño. Con hasta cuatro GPU conectadas por NVIDIA NVLink™ y un aumento de memoria de 1,5 veces, la inferencia de grandes modelos de lenguage (LLM) puede acelerarse en hasta 1,7 veces y las aplicaciones de HPC lograr 1,3 veces más desempeño en comparación con H100 NVL.

Listo para la Empresa: el Software de IA Agiliza el Desarrollo y la Implementación

NVIDIA H200 NVL viene con una suscripción de cinco años a NVIDIA AI Enterprise y simplifica la forma en que creas una plataforma empresarial preparada para la IA. H100 acelera el desarrollo y la implementación de IA para soluciones de IA generativa listas para la producción, incluida la visión por computadora, la IA de voz, la generación aumentada de recuperación (RAG) y más. NVIDIA AI Enterprise incluye NVIDIA NIM™^,un conjunto de microservicios fáciles de usar diseñados para acelerar la implementación de IA generativa empresarial. Juntas, las implementaciones tienen seguridad, capacidad de administración, estabilidad y soporte de nivel empresarial. Esto da como resultado soluciones de IA optimizadas para el rendimiento que ofrecen un valor empresarial más rápido e información procesable.

Activa Tu Licencia de NVIDIA AI Enterprise

Especificaciones