GPU NVIDIA A30 Tensor Core

Accelerazione di calcolo versatile per i server aziendali tradizionali.

Inferenza con IA e calcolo mainstream per ogni azienda

Porta le prestazioni accelerate in ogni carico di lavoro aziendale con la GPU NVIDIA A30 Tensor Core. Con i Tensor Core dell'architettura NVIDIA Ampere e Multi-Instance GPU (MIC), offre accelerazioni in modo sicuro su diversi carichi di lavoro, tra cui l'inferenza con IA su larga scala e le applicazioni HPC. Combinando una larghezza di banda di memoria veloce e un basso consumo energetico in un fattore di forma PCIe, ottimale per i server mainstream, la A30 consente di creare un data center elastico e offre il massimo valore per le aziende.

La soluzione per data center per l'IT moderno

L'architettura NVIDIA Ampere fa parte della piattaforma unificata NVIDIA EGX™, che integra elementi fondamentali tra hardware, rete, software, librerie, applicazioni e modelli IA ottimizzati dal catalogo NVIDIA NGC™. Come piattaforma IA e HPC completa più potente per data center, consente ai ricercatori di fornire risultati in tempo reale e distribuire rapidamente soluzioni nell'ambiente di produzione in modo scalabile.

Training su Deep Learning

Training con IA: velocità effettiva fino a 3 volte superiore rispetto alla v100 e 6 volte superiore rispetto alla T4

NVIDIA A30 Tensor Core con Tensor Float (TF32)

Il training di modelli con IA per sfide di livello superiore come l'IA conversazionale richiede un'enorme potenza di calcolo e scalabilità.

I Tensor Core nella NVIDIA A30 con precisione Tensor Float (TF32) offrono prestazioni 10 volte superiori rispetto alla NVIDIA T4, senza alcuna alterazione del codice, e un ulteriore incremento pari a 2 volte con precisione mista e FP16, garantendo un aumento della produttività pari a 20 volte. Con NVIDIA® NVLink®, PCIe Gen4, networking NVIDIA Mellanox® e l'SDK NVIDIA Magnum IO™, è possibile scalare a migliaia di GPU. 

I Tensor Core e MIG consentono di utilizzare la A30 per i carichi di lavoro in modo dinamico durante il giorno. Può essere utilizzata per l'inferenza nel picco di produzione, mentre parte della GPU può essere riutilizzata per ri-addestrare rapidamente quegli stessi modelli durante le ore non di punta.

NVIDIA stabilisce vari record di prestazioni nel MLPerf, il benchmark di settore per il training con IA. 

Inferenza su deep learning

La A30 introduce straordinarie funzionalità per ottimizzare i carichi di lavoro di inferenza. Accelera una gamma completa di precisioni, dalla FP64 alla TF32 e INT4. Supportando fino a quattro MIG per GPU, A30 consente a più reti di operare contemporaneamente in partizioni hardware sicure con qualità del servizio garantita (QoS). Inoltre, il supporto per la densità strutturale offre prestazioni fino a 2 volte superiori oltre ad altri guadagni in termini di prestazioni in inferenza della A30.  

Sui modelli di intelligenza artificiale conversazionale all'avanguardia, la A30 accelera la velocità effettiva di inferenza in tempo reale 3 volte di più rispetto alla GPU NVIDIA V100 Tensor Core di generazione precedente. 

Nella classificazione delle immagini in tempo reale (che <richiede una latenza di 7 ms), la A30 accelera la velocità effettiva 7 volte rispetto alla NVIDIA T4.

Le prestazioni IA leader di mercato di NVIDIA sono state dimostrate nel benchmark MLPerf Inference. Con NVIDIA Triton™ Inference Server, che distribuisce l'IA facilmente su larga scala, la A30 porta le prestazioni più all'avanguardia in ogni impresa. 

Inferenza con AI: velocità effettiva fino a 3 volte superiore rispetto alla V100 nell'IA conversazionale in tempo reale

Inferenza su deep learning NVIDIA

Inferenza con AI: velocità effettiva più di 3 volte superiore rispetto alla T4 nella classificazione delle immagini

Inferenza su deep learning NVIDIA

Calcolo ad alte prestazioni

HPE: velocità effettiva fino a 1,1 volte superiore rispetto alla V100 e 8 volte superiore rispetto alla T4

NVIDIA A30 è dotato di doppia precisione (FP64)

Per arrivare a scoperte all'avanguardia, gli scienziati cercano di capire meglio il mondo che ci circonda.

La NVIDIA A30 include l'architettura NVIDIA Ampere Tensor Cores a FP64 che offre il più grande passo avanti nelle prestazioni HPC dall'introduzione delle GPU. Con 24 gigabyte (GB) di memoria GPU e una larghezza di banda di 933 gigabyte al secondo (GB/s), i ricercatori possono risolvere rapidamente calcoli a doppia precisione. Le applicazioni HPC possono inoltre sfruttare la precisione TF32 per ottenere un throughput superiore per operazioni di moltiplicazione a matrici intense a precisione singola.

La combinazione di Tensor Core FP64 e MIG consente agli istituti di ricerca di partizionare in modo sicuro la GPU per consentire a più ricercatori di accedere alle risorse di calcolo con QoS garantita e il massimo utilizzo della GPU. Le aziende che distribuiscono l'IA possono utilizzare le funzionalità di inferenza della A30 durante i periodi di picco della domanda, quindi riutilizzare gli stessi server di calcolo per i carichi di lavoro di training con IA e HPC durante i periodi più leggeri. 

Analisi di dati ad alte prestazioni

Gli esperti di dati devono poter analizzare, visualizzare e convertire enormi set di dati in informazioni. Tuttavia, le soluzioni scale-out spesso si trasformano in una palude poiché i set di dati sono disseminati su più server. 

I server accelerati con A30 offrono la necessaria potenza di calcolo, oltre a un'enorme memoria HBM2, con una banda superiore a 933 GB/sec, e scalabilità con NVLink, per affrontare questi carichi di lavoro. Insieme a InfiniBand, NVIDIA Magnum IO e la suite RAPIDS™ di librerie open-source, tra cui RAPIDS Accelerator per Apache Spark, la piattaforma per data center NVIDIA è in grado di accelerare questi enormi carichi di lavoro a livelli senza precedenti in termini di prestazioni ed efficienza.

Analisi accelerata da NVIDIA GPU

Analisi di dati ad alte prestazioni

Analisi accelerata da NVIDIA GPU

Gli esperti di dati devono poter analizzare, visualizzare e convertire enormi set di dati in informazioni. Tuttavia, le soluzioni scale-out spesso si trasformano in una palude poiché i set di dati sono disseminati su più server. 

I server accelerati con A30 offrono la necessaria potenza di calcolo, oltre a un'enorme memoria HBM2, con una banda superiore a 933 GB/sec, e scalabilità con NVLink, per affrontare questi carichi di lavoro. Insieme a InfiniBand, NVIDIA Magnum IO e la suite RAPIDS™ di librerie open-source, tra cui RAPIDS Accelerator per Apache Spark, la piattaforma per data center NVIDIA è in grado di accelerare questi enormi carichi di lavoro a livelli senza precedenti in termini di prestazioni ed efficienza.

Scopri di più sull'analisi dei dati ›

Utilizzo a livello di impresa

La A30 con MIG massimizza l'utilizzo dell'infrastruttura GPU accelerata.

La A30 con MIG massimizza l'utilizzo dell'infrastruttura GPU accelerata. Con MIG, una GPU A30 può essere partizionata in ben quattro istanze indipendenti, consentendo a più utenti di accedere all'accelerazione con GPU.

MIG funziona con Kubernetes, container e virtualizzazione server basata su hypervisor. MIG consente ai gestori dell'infrastruttura di offrire una GPU di dimensioni adeguate con qualità del servizio garantita (QoS) per ogni processo, estendendo la portata delle risorse di elaborazione accelerate a tutti gli utenti.

NVIDIA AI Enterprise

NVIDIA AI Enterprise, una suite cloud-native end-to-end di software di intelligenza artificiale e analisi dei dati, è certificata per l'esecuzione su A30 in un'infrastruttura virtuale basata su hypervisor con VMware vSphere. Ciò consente la gestione e il ridimensionamento dei carichi di lavoro di intelligenza artificiale in un ambiente cloud ibrido. 

NVIDIA-Certified Systems mainstream

Gli NVIDIA-Certified Systems™ con NVIDIA A30, riuniscono accelerazione di calcolo e rete NVIDIA sicura ad alta velocità nei server del data center aziendale, e sono costruiti e venduti dai partner OEM di NVIDIA. Questo programma consente ai clienti di identificare, acquisire e distribuire sistemi per applicazioni di intelligenza artificiale moderne tradizionali e diversificate dal catalogo NGC NVIDIA su un'unica infrastruttura ad alte prestazioni, economica e scalabile.

Specifiche della GPU A30 Tensor Core

FP64 5,2 TeraFLOPS
FP64 Tensor Core 10,3 TeraFLOPS
FP32 10,3 TeraFLOPS
TF32 Tensor Core 82 teraFLOPS | 165 teraFLOPS*
BFLOAT16 Tensor Core 165 teraFLOPS | 330 teraFLOPS*
FP16 Tensor Core 165 teraFLOPS | 330 teraFLOPS*
INT8 Tensor Core 330 TOPS | 661 TOPS*
INT4 Tensor Core 661 TOPS | 1321 TOPS*
Motori multimediali 1 OFA (optical flow accelerator)
1 decodificatore JPEG (NVJPEG)
4 decodificatori video (NVDEC)
Memoria della GPU 24 GB HBM2
Banda di memoria GPU 933GB/s
Interconnessione PCIe Gen4: 64 GB/s
NVLINK di terza generazione: 200 GB/s**
Form Factor Doppio slot, full-height, full-length (FHFL)
TDP (Thermal Design Power) 165 W
Multi-Instance GPU (MIG) 4 istanze GPU a 6 GB ciascuna
2 istanze GPU a 12 GB ciascuna
1 istanza GPU a 24 GB
Supporto software Virtual GPU (vGPU) NVIDIA AI Enterprise
NVIDIA Virtual Compute Server

Vedi gli ultimi dati del benchmark MLPerf

Dentro l'architettura NVIDIA Ampere

Esplora le tecnologie all'avanguardia dell'architettura NVIDIA Ampere.