VDI: GRID vPC getestet auf einem Server mit 2 Intel Xeon Gold 6148 (20 Kerne, 2,4 GHz), GRID vPC mit T4-1B (64 VMs), VMware ESXi 6.7, NVIDIA vGPU-Software (410.91/412.16), Windows 10 (1803), 2 vCPUs, 4 GB RAM, Auflösung 1920 x 1080 Pixel, einzelner Monitor, VMware Horizon 7.6. Die Benutzererfahrung wurde mit einem NVIDIA-Benchmarking-Tool gemessen. Es misst an Endnutzer ausgelieferte Frames, auf denen Produktivitätsanwendungen fürs Büro ausgeführt wurden, wie Microsoft PowerPoint, Word, Excel, Chrome, PDF-Ansichtsprogramme und Videowiedergabeprogramme.
Maschinelles Lernen: CPU-Knoten (61 GB Speicher, 8 vCPUs, 64-Bit-Plattform), Apache Spark. 200 GB CSV-Datensatz; die Datenaufbereitung umfasst Verknüpfungen und die Variablentransformation. GPU-Serverkonfiguration: Dual-Sockel-Xeon E5-2698 v4 mit 3,6 GHz, 20 T4-GPUs auf 5 Knoten mit je 4 T4-GPUs. Die CPU-Daten für Schritte mit XGBoost und die Datenkonvertierung, die allesamt auf dem InfiniBand-Netzwerk ausgeführt wurden, wurden basierend auf gemessenen Daten für 20 CPU-Knoten geschätzt. Dabei wurde die Ausführungszeit um 60 % verringert für die Normalisierung für das Training mit kleineren Datensätzen auf dem T4.
Deep-Learning-Training und -Inferenz: GPU: Dual-Sockel-Xeon E5-2698 v4 mit 3,6GHz. GPU-Server: 2 T4 für Training, 1 T4 für Inferenz, NGC 18.11-py3-Container mit CUDA 10.0.130; NCCL 2.3.7, cuDNN 7.4.1.5; cuBLAS 10.0.130 | NVIDIA-Treiber: 384.145.