CPU NVIDIA Grace Superchip

CPU NVIDIA Grace

La CPU innovadora para el data center moderno.

Diseñado para Satisfacer las Necesidades de Desempeño y Eficiencia de los Data Centers de IA Actuales

La CPU NVIDIA Grace™ ha sido diseñada para un nuevo tipo de data center que procesa enormes cantidades de datos para producir inteligencia con la máxima eficiencia energética. Estos data centers ejecutan diversas cargas de trabajo, como IA, análisis de datos, aplicaciones de nube de hiperescala y computación de alto rendimiento (HPC). Para satisfacer las necesidades de data center más exigentes, Grace ofrece el doble de desempeño por vatio, el doble de densidad de empaquetado y el mayor ancho de banda de memoria en comparación con los servidores líderes de la actualidad.

La CPU Grace combina 72 núcleos Arm® Neoverse™ V2 de alto rendimiento y de bajo consumo energético, conectados con NVIDIA Scalable Coherency Fabric (SCF), la cual ofrece 3.2TB/s de ancho de banda de bisección, el doble de las CPU tradicionales, para ofrecer el máximo rendimiento y mantener una compatibilidad total con el ecosistema de Arm. Grace es la primera CPU de data center en utilizar memoria LPDDR5X de alta velocidad de clase de servidor, con un amplio subsistema de memoria que ofrece hasta 500GB/s de ancho de banda a una quinta parte de la potencia de la memoria DDR tradicional a un costo similar.

CPU NVIDIA Grace para Desarrolladores

Explore nuestras herramientas para desarrolladores creadas para la cartera de CPU NVIDIA Grace. Encuentre recursos, instrucciones, drivers y más.

Conoce la CPU NVIDIA Grace

CPU NVIDIA Grace Superchip

CPU NVIDIA Grace Superchip

La CPU NVIDIA Grace Superchip está compuesta por dos chips de CPU Grace conectados coherentemente a través de NVIDIA NVLinkTM Chip-to-Chip (C2C) a 900GB/s. Incluye 144 núcleos Neoverse V2 en un solo módulo, con memoria LPDDR5X de tipo servidor que ofrece hasta 1TB/s de ancho de banda de memoria. La CPU Grace Superchip contiene el centro de un servidor de dos zócalos en un módulo compacto y ofrece dos veces el desempeño con el mismo consumo de energía que las CPU de servidor tradicionales con memoria DDR5.

CPU NVIDIA Grace C1

CPU NVIDIA Grace C1

NVIDIA Grace C1 es una plataforma de servidor de un solo zócalo y alto desempeño optimizada para plataformas escalables y en el edge, que incluyen nube a hiperescala, CDN, almacenamiento, telecomunicaciones y otras plataformas de alto desempeño que no afecta el desempeño ni el ancho de banda. Esta plataforma ofrece un desempeño x86 de alta gama y es configurable de 140W a 250W para la CPU Grace y la memoria LPDDR5X en comparación con más de 400W para plataformas x86 similares. La estructura de coherencia escalable diseñada por NVIDIA permite que la CPU Grace ofrezca el doble de eficiencia energética en comparación con las plataformas líderes de x86.

Destacados

Duplica la Producción del Data Center o Reduce el Uso de Energía a la Mitad con la CPU Grace

Análisis de Gráficos

Tres veces

Análisis de Datos

Dos veces

Clima

Dos veces

Microservicios

1.6 veces

NVIDIA Grace Superchip 480GB de LPDDR5X, AMD EPYC 9654 768GB de DDR5. Sistema operativo: Ubuntu 22.04 Compiladores: GCC 12.3, a menos que se indique a continuación. La alimentación para la eficiencia energética incluye potencia medida de CPU + memoria. Graph Analytics: The Gap Benchmarks Suite BFS arXiv:1508.03619 [cs.DC], 2015. Data Analytics: HiBench+K-means Spark (HiBench 7.1.1, Hadoop 3.3.3, Spark 3.3.0; Grace: NVHPC 24.5, x86: Intel 2021.4) Weather: ICON QUBICC 80 km resolution NVHPC 24.5 (Grace) ICC 2021.4 (x86) Microservices: Google Protobufs (Commit 7cd0b6fbf1643943560d8a9fe553fd206190b27f | N instances in parallel)

Análisis de Gráficos de la CPU NVIDIA Grace Superchip

Análisis de Gráficos

NVIDIA Grace CPU Superchip conecta los núcleos Arm Neoeverse V2 con una estructura de coherencia escalada y personalizada de NVIDIA que ofrece un desempeño increíblemente rápido para cargas de trabajo como GapBS Breadth First Search, que hace hincapié en la comunicación y la sincronización de núcleo a núcleo. NVIDIA Grace ofrece más de dos veces más desempeño a nivel de servidor y una eficiencia energética tres veces mejor en comparación con los sistemas líderes de x86.

Análisis de Datos de la CPU NVIDIA Grace Superchip

Análisis de Datos

A medida que los datos continúan creciendo, las empresas necesitan maximizar el aprendizaje de sus datos para competir. El paquete HiBench prueba el agrupamiento K-means para descubrir conocimientos y hacer minería de datos y aprovecha la memoria de alto ancho de banda y baja potencia en la CPU NVIDIA Grace. La CPU Grace es dos veces más eficiente en cuanto a consumo de energía en comparación con las CPU x86 líderes del mercado actual.

Modelos de predicción meteorológica para computación de alto rendimiento (HPC)

Clima

Los modelos de predicción meteorológica son un caso de uso importante para la computación de alto rendimiento (HPC) y son críticos para comprender y responder a los patrones climáticos cambiantes causados por el cambio climático. La memoria LPDDR5X de alto ancho de banda y eficiencia energética de la CPU Grace, que ofrece hasta 500GB/s de ancho de banda en solo 16W, permite que Grace realice casi el doble de trabajo con el mismo consumo de energía en comparación con las soluciones x86 existentes.

La CPU NVIDIA Grace ofrece un nivel líder de desempeño y eficiencia energética

Microservicios

Los microservicios son una colección de pequeños servicios independientes que permiten que los data centers se expandan fácilmente para satisfacer la demanda. También ofrecen flexibilidad para administrar servicios individuales sin afectar a toda la aplicación. Google Protobufs mide la rapidez con la cual el sistema puede serializar y analizar los datos necesarios para intercambiar datos entre sistemas que son esenciales para la ejecución de microservicios. El alto desempeño y la eficiencia energética de la CPU NVIDIA Grace ofrecen un nivel líder de desempeño y eficiencia energética para maximizar el rendimiento del data center.

Funciones

Avances Tecnológicos

Núcleos Arm Neoverse V2

Núcleos Arm Neoverse V2

En el centro de la CPU Grace se encuentran los núcleos de CPU ARM Neoverse V2, el núcleo del data center de mayor desempeño de ARM en el mercado actual. Los núcleos Neoverse V2 están optimizados para ofrecer un desempeño líder por núcleo y a la vez proporcionan una eficiencia increíble en comparación con las CPU tradicionales. La CPU Grace integra 72 núcleos y, cuando se combina con la memoria LPDDR5X y con NVIDIA Scaled Coherency Fabric, ofrece el doble de desempeño con el mismo consumo de energía que las CPU x86 principales.

NVIDIA Scalable Coherency Fabric

NVIDIA Scalable Coherency Fabric

NVIDIA Scalable Coherency Fabric (SCF) es una trama de malla y una arquitectura de caché distribuida diseñada por NVIDIA para satisfacer los desafíos de expandir núcleos y ancho de banda de una manera eficiente en términos de energía y superficie. SCF proporciona más de 3,2TB/s de ancho de banda de bisección total, el doble que las CPU tradicionales, para mantener el flujo de datos entre los núcleos de la CPU, la memoria y la E/S del sistema. SCF reduce los cuellos de botella en aplicaciones con alto nivel de movimiento de datos, como el análisis de gráficos, en las que NVIDIA Grace ofrece hasta el doble de desempeño en comparación con los servidores x86 líderes.

Memoria LPDDR5X

Memoria LPDDR5X

NVIDIA Grace es la primera CPU de servidor que utiliza memoria LPDDR5X con fiabilidad de tipo servidor a través de mecanismos como el código de corrección de errores (ECC). La memoria LPDDR5X de NVIDIA Grace equilibra costos, potencia, ancho de banda y capacidad. Ofrece hasta 500GB/s en solo unos 16W, aproximadamente una quinta parte de la potencia de la memoria DDR5 convencional.

Zócalo Simple y Doble

Zócalo Simple y Doble

La cartera de CPU NVIDIA Grace incluye el superchip Grace que proporciona el núcleo de un servidor de doble zócalo con 144 núcleos Neoverse V2 y hasta 960GB de LPDDR5X en un solo módulo compacto, que requiere solo 500W para la CPU y la memoria. Para proporcionar más flexibilidad, la CPU Grace C1 ofrece un desempeño increíble con 72 núcleos Neoverse V2 conectados por una trama de coherencia escalable de NVIDIA increíblemente rápida, en una configuración de un solo zócalo optimizada para implementaciones en la nube, almacenamiento, edge y telecomunicaciones, para ofrecer hasta el doble del rendimiento por vatio que los servidores x86 convencionales.

Noticias

CPU NVIDIA Grace Superchip

La CPU NVIDIA Grace Ofrece un Desempeño para Data Centers de Clase Mundial y una Eficiencia Energética Innovadora

NVIDIA diseñó la CPU NVIDIA Grace como un nuevo tipo de CPU para data centers de alto rendimiento, creada para ofrecer una eficiencia energética innovadora y optimizada para un desempeño a escala de data center.

NVIDIA Grace CPU Superchip y NVIDIA Grace C1

La CPU NVIDIA Grace se Integra con el Ecosistema del Software Arm

A medida que los data centers se enfrentan a restricciones de potencia crecientes, es crucial acelerar tantas cargas de trabajo como sea posible y ejecutar el resto en la computación más eficiente posible. La CPU Grace está optimizada para manejar tareas aceleradas y solo de CPU, lo que ofrece hasta el doble de desempeño con la misma alimentación que las CPU convencionales.

CPU NVIDIA Grace Superchip

Destacado: Petrobras Acelera los Solucionadores Lineales para la Simulación de Reservorios con la CPU NVIDIA Grace

Este blog demuestra cómo la CPU NVIDIA Grace se destaca en la resolución de sistemas lineales dentro de este workflow, con el logro de Petrobras de un tiempo de solución hasta 4.5 veces más rápido, una eficiencia energética 4.3 veces mayor y una escalabilidad 1.5 veces más elevada en comparación con las CPU basadas en x86 alternativas.

Especificaciones

Especificaciones de CPU Grace

  NVIDIA Grace CPU C1 NVIDIA Grace CPU Superchip
Configuration 1x Grace CPU 2x Grace CPU
Core Count 72 Arm Neoverse V2 Cores with 4x 128b SVE2 144 Arm Neoverse V2 Cores with 4x 128b SVE2
L1 cache 64KB i-cache + 64KB d-cache per core 64KB i-cache + 64KB d-cache per core
L2 cache 1MB per core 1MB per core
L3 cache 114MB 228MB
LPDDR5X size 120GB, 240GB and 480GB on-module memory options available 240GB, 480GB and 960GB options available
Memory bandwidth Up to 384 GB/s for 480GB
Up to 512 GB/s for 120GB, 240GB
Up to 768 GB/s for 960GB
Up to 1024 GB/s for 240GB, 480GB
NVLink-C2C bandwidth n/a Up to 900 GB/s
PCIe Links Up to 4x PCIe Gen 5x16 with option to bifurcate Up to 8x PCIe Gen 5x16 with option to bifurcate
Select Location
Middle East