El motor del centro de datos de próxima generación
A medida que los modelos explotan en complejidad, la computación acelerada y la eficiencia energética se están volviendo críticas para satisfacer las demandas de la IA. La CPU NVIDIA Grace™ es una innovadora CPU Arm® con un rendimiento y una eficiencia sin concesiones. Se puede combinar perfectamente con una GPU para impulsar la computación acelerada o implementarse como una CPU autónoma potente y eficiente. La CPU NVIDIA Grace es la base de los centros de datos de próxima generación y se puede utilizar en varias configuraciones para distintas necesidades del centro de datos.
Echa un vistazo a la alineación de Grace
NVIDIA GB200 NVL72
El superchip NVIDIA GB200 Grace Blackwell combina dos GPU Blackwell Tensor Core y una CPU Grace y puede ampliarse hasta el GB200 NVL72, un sistema masivo de 72 GPU conectadas por NVIDIA® NVLink®, para proporcionar una inferencia en tiempo real 30 veces más rápida para modelos de lenguaje de gran tamaño.
La plataforma NVIDIA GB200 NVL2 lleva la nueva era de la computación a todos los centros de datos, ofreciendo así un rendimiento sin precedentes para la inferencia convencional de modelos lingüísticos de gran tamaño (LLM), la búsqueda de bases de datos vectoriales y el procesamiento de datos.
NVIDIA Grace Hopper Superchip combina las arquitecturas Grace y Hopper utilizando NVIDIA® NVLink®-C2C a fin de ofrecer un modelo de memoria coherente con CPU y GPU para aplicaciones aceleradas de computación de alto rendimiento (HPC) e IA.
NVIDIA Grace CPU Superchip NVIDIA Grace CPU Superchip
NVIDIA Grace CPU Superchip utiliza la tecnología NVLink-C2C para ofrecer 144 núcleos Arm® Neoverse V2 y 1 terabyte por segundo (TB/s) de ancho de banda de memoria.
Recibe las noticias más recientes sobre los productos NVIDIA Grace
Descubre cómo las CPU Grace potencian los superordenadores de gran memoria más recientes.
NVIDIA GB200 NVL72 para inferencia de billones de parámetros en tiempo real
NVIDIA GB200 NVL72 Grace Blackwell Superchip es la arquitectura para la próxima generación de IA, que acelera los modelos de lenguaje de billones de parámetros en tiempo real.
NVIDIA y SoftBank reinventan los centros de datos 5G con IA generativa
El superchip NVIDIA Grace Hopper™ basado en Arm, la DPU BlueField®-3 y el SDK Aerial™ impulsan una arquitectura revolucionaria para la IA generativa y las comunicaciones 5G/6G.
Nueva ola de superordenadores energéticamente eficientes
Echa un vistazo a los últimos superordenadores Arm de alta eficiencia energética para la climatología, la investigación médica y otros campos, impulsados por la CPU Grace de NVIDIA.
Los superchips NVIDIA GH200 Grace Hopper ya están en plena producción
Los sistemas GH200 se suman a las más de 400 configuraciones que los fabricantes de sistemas de todo el mundo están lanzando para satisfacer la creciente demanda de IA generativa.
Creación más rápida de centros de datos acelerados con NVIDIA MGX
Descubra cómo QCT y Supermicro están adoptando diseños modulares para construir de forma rápida y rentable múltiples configuraciones de centros de datos para una amplia gama de aplicaciones de IA, computación de alto rendimiento (HPC) y 5G.
Obtén más información sobre las últimas innovaciones técnicas
Acelera las conexiones de CPU a GPU con NVLink-C2C
Resolver los mayores problemas de IA y HPC requiere una memoria de alta capacidad y de elevado ancho de banda (HBM). NVIDIA NVLink-C2C ofrece 900 GB/s de ancho de banda bidireccional entre la CPU NVIDIA Grace y las GPU NVIDIA. La conexión ofrece un espacio de direcciones de memoria unificado y coherente con la caché que combina la memoria de la GPU HBM y del sistema para simplificar la programabilidad. Esta conexión coherente de elevado ancho de banda entre la CPU y las GPU es clave para acelerar las soluciones a los problemas más complejos del mañana.
Aprovecha la memoria de la CPU de alto ancho de banda con LPDDR5X
NVIDIA Grace es la primera CPU del servidor en aprovechar la memoria LPDDR5X con fiabilidad de clase servidor a través de mecanismos como el código de corrección de errores (ECC) para satisfacer las demandas del centro de datos, al tiempo que ofrece el doble de ancho de banda de memoria y hasta 10 veces mejor eficiencia energética en comparación con la memoria del servidor actual. La solución LPDDR5X, junto con la memoria caché de último nivel de gran rendimiento y alto rendimiento de NVIDIA Grace, ofrece el ancho de banda necesario para los modelos grandes, al tiempo que reduce la potencia del sistema para maximizar el rendimiento de la próxima generación de cargas de trabajo.
Acelera el rendimiento y la eficiencia con los núcleos Arm Neoverse V2 y la estructura de coherencia escalable de NVIDIA
A medida que las capacidades computacionales en paralelo de las GPU siguen avanzando, las cargas de trabajo todavía pueden quedar limitadas por tareas en serie ejecutadas en la CPU. Una CPU rápida y eficiente es un componente crítico del diseño del sistema para permitir la máxima aceleración de las cargas de trabajo. La CPU NVIDIA Grace integra los núcleos Arm Neoverse V2 con la estructura de coherencia escalable de NVIDIA para ofrecer un alto rendimiento en un diseño de bajo consumo, lo que facilita a los científicos e investigadores hacer el trabajo de su vida.
Impulsa la IA generativa con la memoria de GPU HBM3 y HBM3e
La IA generativa consume mucha memoria y recursos de computación. El superchip NVIDIA GB200 utiliza 380 GB de memoria HBM, lo que proporciona más de 4,5 veces el ancho de banda de memoria de la GPU NVIDIA H100 Tensor Core. La memoria de alto ancho de banda de Grace Blackwell se conecta con la memoria de la CPU a través de NVLink-C2C para proporcionar casi 860 GB de memoria de acceso rápido a la GPU, y ofrece la capacidad de memoria y el ancho de banda necesarios para manejar las cargas de trabajo de IA generativa y computación acelerada más complejas del mundo.