Inferencia LLM y eficiencia energética: TTL = 50 milisegundos (ms) en tiempo real, FTL = 5000 ms, 32 000 entradas/1000 salidas, NVIDIA HGX™ H100 ampliado sobre InfiniBand (IB) frente a GB200 NVL72, entrenamiento de 1,8 T MOE HGX H100 ampliado IB frente a GB200 NVL72 escalado sobre IB.
Tamaño del grupo: 30.000
Consulta 4 de TPC-H: GB200 frente a Intel Xeon 8480+
Rendimiento proyectado sujeto a cambios.