In der modernen Forschung nutzen Wissenschaftler Simulationen, um zur Erforschung neuer Arzneimittel komplexe Moleküle besser zu untersuchen, neue Energiequellen in der Physik zu erschließen und mit atmosphärischen Daten extreme Wetterverhältnisse besser vorherzusagen. Bei führenden Simulationen und Anwendungen wird NVIDIA Magnum IO genutzt, um schneller zu Erkenntnissen zu gelangen. Magnum IO nutzt hardwarebasierte Beschleunigungsengines und Smart Offloads wie RDMA, NVIDIA GPUDirect und NVIDIA SHARP. Gleichzeitig wird die hohe Bandbreite und die extrem niedrige Latenz von NVIDIA InfiniBand und NVIDIA NVLink GPUs im Netzwerk ausgeschöpft.
In Umgebungen mit mehreren Mandanten kann es vorkommen, dass Benutzeranwendungen die wahllosen Störungen durch den Datenverkehr benachbarter Anwendungen nicht bemerken. In Kombination mit der neuesten NVIDIA Quantum-2 InfiniBand-Plattform bietet Magnum IO neue und verbesserte Funktionen zur Minderung der negativen Auswirkungen auf die Leistung für den Benutzer. So können optimale Ergebnisse erzielt sowie äußerst effiziente HPC- und ML-Bereitstellungen in jeder Größenordnung ermöglicht werden.
Magnum IO-Bibliotheken und HPC-Anwendungen
Die Leistung von VASP verbessert sich deutlich, wenn MPI durch NCCL ersetzt wird. UCX beschleunigt wissenschaftliche Computing-Anwendungen wie VASP, Chroma, MIA-AI, Fun3d, CP2K und Spec-HPC2021 für schnellere Wall-Clock-Laufzeiten.
NVIDIA HPC-X erhöht die CPU-Verfügbarkeit, Anwendungsskalierbarkeit und Systemeffizienz für verbesserte Anwendungsleistung, die über verschiedene HPC-ISVs verteilt wird. NCCL, UCX und HPC-X sind Teil des HPC-SDK.
Fast Fourier Transforms (FFTs) werden häufig in einer Vielzahl von Bereichen eingesetzt, von Molekulardynamik über Signalverarbeitung und numerische Strömungssimulation (CFD) bis hin zu drahtlosen Multimedia- und ML-Anwendungen. Durch die Verwendung der NVIDIA Shared Memory Library (NVSHMEM)™ ist cuFFTMp unabhängig von der MPI-Implementierung und arbeitet fast in Lichtgeschwindigkeit. Das ist ausschlaggebend, da die Leistung von einem MPI zum anderen stark variieren kann.
Die QUDA Lattice-Quantenchromodynamik-Bibliothek (Qualitative Data Analysis) kann NVSHMEM für die Kommunikation verwenden, um den Aufwand für die CPU- und GPU-Synchronisation zu reduzieren und Rechen- sowie Kommunikationsüberlappungen zu verbessern. Dadurch wird die Latenz reduziert und starkes Skalieren verbessert.
Mehrere Knoten und GPUs: Verwendung von NVIDIA cuFFTMp FFTs in großem Maßstab
Größte interaktive Volumenvisualisierung – Simulierte Landung einer Mars-Sonde für die NASA, 150 TB