Para hacer descubrimientos de próxima generación, los científicos dependen de la simulación para comprender mejor las moléculas complejas de cara al descubrimiento de fármacos, de la física en busca de nuevas fuentes de energía y de los datos atmosféricos con objeto de predecir mejor los patrones climáticos extremos. Las principales aplicaciones y simulaciones aprovechan NVIDIA Magnum IO para acelerar el tiempo de obtención de información. Magnum IO expone motores de aceleración a nivel de hardware y descargas inteligentes, como RDMA, NVIDIA GPUDirect y NVIDIA SHARP, a la vez que refuerza el ancho de banda alto y la latencia ultrabaja de las GPU en red NVIDIA InfiniBand y NVIDIA NVLink.
En los entornos multiinquilino, las aplicaciones de usuario pueden no ser conscientes de la interferencia indiscriminada del tráfico de aplicaciones vecinas. Magnum IO, en la última plataforma NVIDIA Quantum 2 InfiniBand, presenta capacidades nuevas y mejoradas para mitigar el impacto negativo en el rendimiento del usuario. Esto ofrece resultados óptimos, así como las implementaciones de HPC y aprendizaje automático más eficientes a cualquier escala.
Bibliotecas Magnum IO y aplicaciones HPC
El rendimiento de VASP mejora significativamente cuando se sustituye MPI por NCCL. UCX acelera aplicaciones de computación científica, como VASP, Chroma, MIA-AI, Fun3d, CP2K y Spec-HPC2021, para conseguir tiempos de ejecución más rápidos.
NVIDIA HPC-X aumenta la disponibilidad de la CPU, la escalabilidad de las aplicaciones y la eficiencia del sistema para mejorar el rendimiento de las aplicaciones, que están distribuidos por varios ISV de HPC. NCCL, UCX y HPC-X forman parte del HPC-SDK.
Las transformaciones rápidas de Fourier (FFT) se utilizan ampliamente en diversos campos, desde la dinámica molecular, el procesamiento de señales y la dinámica de fluidos computacional (CFD) hasta aplicaciones inalámbricas multimedia y de ML. Al utilizar la biblioteca de memoria compartida de NVIDIA (NVSHMEM)™, cuFFTMp es independiente de la implementación de MPI y funciona más cerca de la velocidad de la luz, lo que es fundamental, ya que el rendimiento puede variar significativamente de un MPI a otro.
La biblioteca de cromodinámica cuántica reticular de análisis de datos cualitativo (QUDA) puede usar NVSHMEM para la comunicación a fin de reducir las sobrecargas de la sincronización de CPU y GPU, y mejorar la superposición de computación y comunicación. Esto reduce las latencias y mejora un escalado potente.
Multinodo Multi-GPU: uso de NVIDIA cuFFTMp FFT a escala
La visualización de volúmenes interactiva más grande del mundo: simulación de aterrizaje en Marte de la NASA (150 TB)