VDI : configuration GRID vPC testée sur un serveur équipé de deux serveurs Intel Xeon Gold 6148 (20c, 2,4 GHz) ; environnement logiciel GRID vPC avec T4-1B (64 VM) ; VMware ESXi 6.7 ; logiciel NVIDIA vGPU (410.91/412.16) ; Windows 10 (1803) ; 2 vCPU, 4 Go de RAM ; résolution 1920x1080 avec un seul moniteur. Expérience utilisateur sous VMware Horizon 7.6 mesurée avec un outil de benchmarking interne de NVIDIA mesurant les trames distantes avec des applications de productivité telles que Microsoft PowerPoint, Word, Excel, Chrome et des logiciels de visualisation PDF ou de lecture vidéo.
Apprentissage automatique : utilisation des nœuds CPU (61 Go de mémoire, 8 vCPU, plateforme 64 bits) avec Apache Spark. Jeu de données 200 Go CSV (données préparées avec des raccords et des transformations variables). Configuration du serveur GPU : CPU dual-socket Xeon E5-2698 v4 à 3,6 GHz, 20 GPU T4 sur 5 nœuds avec 4 GPU T4 chacun. Exécution sur réseau InfiniBand. Les données CPU pour XGBoost et les étapes de conversion des données ont été estimées selon les données mesurées pour 20 nœuds CPU. Le temps d’exécution a été réduit de 60 % pour normaliser l’entraînement avec de plus petits jeux de données sur T4.
Entraînement et inférence pour le Deep Learning : serveurs CPU avec CPU dual-socket Xeon E5-2698 v4 à 3,6 GHz ; serveurs GPU avec 2x T4 pour l’entraînement, 1x T4 pour l’inférence, conteneur NGC 18.11-py3 avec CUDA 10.0.130 ; NCCL 2.3.7, cuDNN 7.4.1.5 ; cuBLAS 10.0.130 | Pilotes NVIDIA : 384.145.