Mientras buscan alcanzar los descubrimientos de la próxima generación, los científicos confían en la simulación a fin de comprender mejor las moléculas complejas para descubrir fármacos, la física para detectar nuevas fuentes de energía y los datos atmosféricos para realizar mejores predicciones de los patrones climáticos extremos. Las principales aplicaciones y simulaciones aprovechan NVIDIA Magnum IO para acelerar el tiempo de comprensión. Magnum IO expone motores de aceleración a nivel de hardware y descargas inteligentes, como RDMA, NVIDIA GPUDirect y NVIDIA SHARP, al tiempo que refuerza el alto ancho de banda y la latencia ultrabaja de las GPU en redes con NVIDIA InfiniBand y NVIDIA NVLink.
En entornos de clientes múltiples, las aplicaciones de usuario pueden no estar conscientes de la inferencia indiscriminada del tráfico de aplicaciones vecino. Magnum IO, en la plataforma NVIDIA Quantum-2 InfiniBand más reciente, cuenta con capacidades nuevas y mejoradas para mitigar el impacto negativo en el rendimiento de un usuario. Esto ofrece resultados óptimos, así como las implementaciones de HPC y ML más eficientes a cualquier escala.
Aplicaciones de HPC y Bibliotecas de Magnum IO
El rendimiento de VASP mejora significativamente cuando MPI se reemplaza por NCCL. LA UCX acelera las aplicaciones de computación científica, como VASP, Chroma, MIA-AI, Fun3d, CP2K y Spec-HPC2021, para acelerar los tiempos de ejecución en las frecuencias de trabajo.
NVIDIA HPC-X aumenta la disponibilidad de la CPU, la escalabilidad de aplicaciones y la eficiencia del sistema para mejorar el rendimiento de las aplicaciones, que se distribuye mediante varios ISV de HPC. NCCL, UCX y HPC-X forman parte del HPC-SDK.
Las Transformaciones Rápidas de Fourier (FFT) se usan ampliamente en una variedad de campos, que van desde la dinámica molecular, el procesamiento de señales y la dinámica de fluidos computacional (CFD) hasta las aplicaciones multimedia y de ML inalámbricas. Al usar la Biblioteca de Memoria Compartida de NVIDIA (NVSHMEM)™, cuFFTMp es independiente de la implementación de MPI y opera más cerca de la velocidad de la luz, lo cual es fundamental ya que el rendimiento puede variar significativamente de un MPI a otro.
La biblioteca Lattice Quantum Chromodynamics del Análisis de Datos Cualitativo (QUDA) puede usar NVSHMEM para la comunicación y así reducir los gastos generales de la sincronización de la CPU y la GPU, y mejorar la superposición de la computación y la comunicación. Esto reduce las latencias y mejora la escalabilidad fuerte.
Múltiples Nodos de Múltiples GPU: Uso de FFT NVIDIA cuFFTMp a escala
La Visualización de Volumen Interactiva Más Grande: Simulación De Aterrizaje en Marte de la NASA de 150 TB