Pour réaliser de nouvelles découvertes scientifiques, les chercheurs ont aujourd’hui recours à des simulations avancées afin d'étudier des systèmes moléculaires complexes pour la découverte de médicaments, d'utiliser de nouveaux modèles physiques pour identifier de nouvelles sources d'énergie ou d'analyser de grands volumes de données atmosphériques pour mieux anticiper les phénomènes climatiques extrêmes. Les principaux outils de simulation et applications tirent parti de NVIDIA Magnum IO pour réduire les délais d’accès aux données. L’environnement logiciel Magnum IO met en œuvre des moteurs d’accélération au niveau matériel et un déchargement intelligent du trafic réseau grâce à des technologies telles que RDMA, NVIDIA GPUDirect et NVIDIA SHARP, tout en optimisant la bande passante et en réduisant la latence avec les solutions NVIDIA InfiniBand et NVIDIA NVLink pour l’optimisation de la mise en réseau.
Dans les environnements mutualisés, il se peut que certaines applications soient impactées par les interférences aléatoires du trafic avec des applications voisines. Magnum IO, qui s’appuie sur la plateforme NVIDIA Quantum-2 InfiniBand, dispose de nouvelles capacités avancées pour atténuer tout impact négatif sur les performances des utilisateurs. Cela permet d’obtenir des résultats optimaux et de déployer efficacement des applications HPC et ML à tous les niveaux.
Bibliothèques Magnum IO et applications HPC
Les performances de VASP augmentent de manière considérable suite au remplacement de MPI par NCCL. UCX accélère les applications de calcul scientifique telles que VASP, Chroma, MIA-AI, Fun3d, CP2K et Spec-HPC2021, contribuant ainsi à réduire les délais d’exécution des opérations Wall-Clock.
NVIDIA HPC-X optimise la disponibilité du CPU, l’évolutivité des applications et l’efficacité du système pour accélérer les performances des applications de calcul haute performance, peu importe leur éditeur. NCCL, UCX et HPC-X font partie intégrante du kit de développement de NVIDIA pour le HPC.
Les calculs FFT (Fast Fourier Transforms) sont utilisés dans de nombreux domaines allant de la dynamique moléculaire au traitement des signaux en passant par la mécanique des fluides numérique, les réseaux sans fil et l’apprentissage automatique. Grâce à l’utilisation de NVSHMEM™ (bibliothèque de NVIDIA pour la mémoire partagée), cuFFTMp est indépendant de l’implémentation MPI et fonctionne au plus près de la vitesse de la lumière, ce qui est essentiel car les performances peuvent varier considérablement d’une MPI à l’autre.
QUDA (Qualitative Data Analysis) est une bibliothèque Lattice de chromodynamique quantique qui peut utiliser NVSHMEM pour le processus de communication afin de réduire les surcharges relatives à la synchronisation du CPU et du GPU, mais aussi d’améliorer les superpositions liées aux calculs et aux communications. Cela permet de réduire la latence et d’améliorer la mise à l’échelle.
Approche multi-GPU et multi-nœuds : utilisation évolutive des FFT avec NVIDIA cuFFTMp
Visualisation de volume à haut degré d’interactivité : simulation du programme d’atterrisseurs martiens de la NASA (150 To)