Pubblica amministrazione

Utilizzare l'IA e l'elaborazione accelerata per eliminare sprechi, frodi e furti

Obiettivo della ricerca

Rendere più efficienti le valutazioni della lettura utilizzando il riconoscimento vocale per aiutare i bambini a far crescere il loro amore per l'apprendimento in modo che possano costruire un futuro più luminoso.

Cliente

IRS

Partner

Cloudera

Scenario di utilizzo

Scienza dei dati

Tecnologia

NVIDIA AI Enterprise
NVIDIA RAPIDS

L'IRS sta sfruttando strumenti di intelligenza artificiale, apprendimento automatico e applicazioni per il rilevamento delle frodi accelerate dalle GPU NVIDIA

Come ogni altro settore, i requisiti di throughput dei dati del settore pubblico sono cresciuti in modo esponenziale. Ad aggravare la sfida rappresentata dalla gestione delle maggiori esigenze di dati, le agenzie governative devono essere in grado di svolgere il loro lavoro eliminando in modo efficiente sprechi, frodi e abusi per garantire l'uso etico dei soldi dei contribuenti.

Il Government Accountability Office (GAO) ha recentemente individuato 36 operazioni che devono essere trasformate per tenere il passo con i requisiti di gestione dei dati, tra cui le aree ad alto rischio che influenzano il commercio, l'economia e la sicurezza della nazione. 

Senza un'infrastruttura IT adeguata, le agenzie governative faticano a esplorare e analizzare in modo efficiente grandi corpi di dati, rendendo necessario il frequente intervento umano. Ciò rende difficile per le agenzie eseguire effettivamente le operazioni basate sui dati necessarie per mantenere la fiducia del pubblico.

Per superare queste sfide, l'IRS sta sfruttando gli strumenti IA accelerati dalle applicazioni di infrastruttura NVIDIA, apprendimento automatico e il rilevamento delle frodi.

Applicazioni per il rilevamento delle frodi accelerate dalle GPU NVIDIA

CPU e lavoro manuali non sono sufficienti

Per contrastare le frodi fiscali e smascherare i malintenzionati, gli ispettori dell'IRS dovevano analizzare decenni di dati, collegare gli individui a transazioni sospette e tracciare le transazioni attraverso passaggi multipli su di un grafico. 

La missione dei data scientist dell'IRS era quella di setacciare un set di dati di oltre 3 terabyte e di individuare dei pattern per smascherare le frodi. Sfortunatamente, la potenza di calcolo disponibile era insufficiente. Eseguendola per tutta la notte su una grande banca di CPU, non è stato possibile completare l'attività. Il team ha tentato di scomporre i set di dati, server per server, ma ha dovuto ricucire i sottoinsiemi di dati per far funzionare la soluzione. Nonostante l'attento lavoro manuale, non è stato possibile ottenere la piena visibilità del rilevamento delle frodi in tempo reale. 

Per migliorare le attività incentrate sui dati come questa, l'IRS sta implementando strumenti IA ad alta potenza, apprendimento automatico e applicazioni in grado di esporre rapidamente frodi e furti di identità. 

Aumentando la velocità di 20 volte, l'IRS è riuscita a esporre le frodi

La nuova combinazione di infrastruttura di calcolo e soluzioni software ha permesso all'IRS di implementare rapidamente e facilmente l'IA e l'apprendimento automatico su larga scala. Con Cloudera in esecuzione su GPU NVIDIA, i carichi di lavoro sono stati velocizzati immediatamente fino a 5 volte senza modifiche al codice. Ma c'era ancora spazio per i miglioramenti.

Cloudera ha chiesto a un team di scienziati dei dati NVIDIA di esaminare il codice dell'IRS. Ne è emerso che alcune attività con strutture di dati particolarmente complesse erano ancora in esecuzione sulle CPU. NVIDIA ha scritto un nuovo codice per gestire queste attività e lo ha inserito nell'interfaccia software di Spark per NVIDIA RAPIDS™, la libreria aperta per l'esecuzione dell'analisi dei dati sulle GPU.

Quando il team dell'IRS ha eseguito il nuovo codice sulle GPU in un cluster Spark distribuito, ha registrato un notevole aumento di velocità di 20 volte superiore. 

Sviluppando carichi di lavoro che utilizzano Apache Spark e l'analisi dei grafici, i team di ingegneri hanno creato immensi grafici con nodi ed edge. Grazie ai bot IA e agli algoritmi di apprendimento automatico che analizzano i grafici, gli ispettore sono stati in grado di collegare gli individui alle istituzioni e, successivamente, a realtà più grandi che coprono anni e decenni. Questi insight hanno contribuito a smascherare rapidamente modelli che indicavano frodi.

Gli stessi set di dati che prima richiedevano settimane o mesi per essere raggruppati ed elaborati ora richiedono solo ore o minuti. I test hanno rivelato un miglioramento di 10 volte nei flussi di lavoro di ingegneria e scienza dei dati con una riduzione del 50 percento dei costi infrastrutturali. 

Basarsi sui successi per proteggere meglio i contribuenti

Con una migliore infrastruttura di calcolo e l'implementazione dell'IA, l'IRS sta tagliando i costi e proteggendo meglio i contribuenti prevenendo le frodi e il furto di identità. 

Sulla base dei successi ottenuti nella redazione dei dati e nell'analisi dei dati, l'IRS prevede di accelerare i lavori di inferenza IA e utilizzare l'infrastruttura Spark-GPU per affrontare l'elaborazione del linguaggio naturale e altre attività di analisi. 

Nel settore pubblico, ci sono innumerevoli opportunità per migliorare le prestazioni con l'IA e il calcolo accelerato. Altre agenzie governative che monitorano le transazioni al fine di mitigare gli sprechi, i furti e le frodi possono seguire l'esempio dell'IRS e modernizzare l'infrastruttura e il software per raggiungere uno standard più elevato di efficienza operativa e di servizio pubblico. 

“L’integrazione tra Cloudera e NVIDIA ci consentirà di utilizzare le informazioni basate sui dati per potenziare i casi d’uso mission critical. Attualmente stiamo implementando questa integrazione e stiamo già assistendo a miglioramenti nella velocità oltre 20 volte superiori alla metà del costo per i nostri flussi di lavoro di ingegneria dei dati e scienza dei dati.

Joe Asaldi,
Capo tecnico dell'unità Ricerca e Analisi e Statistica Applicata, IRS

Risultati

  • L'esecuzione 20 volte più veloce degli esperimenti dei data scientist

  • Costo inferiore del 50% dei flussi di lavoro di ingegneria e scienza dei dati

Continua ad apprendere

Dai un'occhiata più da vicino a come NVIDIA sta aiutando ad accelerare l'innovazione nel settore pubblico.