Die Volta Tensor-Recheneinheiten der ersten Generation wurden speziell für Deep Learning entwickelt und bieten bahnbrechende Leistung mit einer Mixed-Precision-Matrixmultiplikation in FP16 und FP32 und bis zu 12-fach höheren Spitzen-Teraflops (TFLOPS) für das Training und 6-fach höheren Spitzen-TFLOPS für Inferenz gegenüber der Vorgängergeneration NVIDIA Pascal™. Dank dieses wichtigen Merkmals weist Volta beim Training und bei der Inferenz eine dreimal höhere Leistung auf als Pascal.
Jede der 640 Tensor-Recheneinheiten des Tesla V100-Grafikprozessors verwendet eine 4-x-4-Matrix. Die zugehörigen Datenpfade wurden speziell so gestaltet, dass der Gleitkomma-Berechnungsdurchsatz der weltweit schnellste ist und eine hohe Energieeffizienz erzielt wird.