Öffentlicher Sektor

KI und beschleunigtes Computing zur Bekämpfung von Verschwendung, Betrug und Diebstahl

Ziel

Effizientere Lesebewertungen mithilfe von Spracherkennung, um Kindern die Freude am Lesen zu vermitteln, damit sie eine bessere Zukunft für sich gestalten können.

Kunde

Internal Revenue Service

Partner

Cloudera

Anwendungsfall

Datenwissenschaft

Technologie

NVIDIA AI Enterprise
NVIDIA RAPIDS

Der IRS nutzt KI-Tools, maschinelles Lernen und Anwendungen zur Betrugserkennung, die von NVIDIA GPUs beschleunigt werden

Wie in jeder Branche sind auch bei der Regierung die Anforderungen für den Datendurchsatz exponentiell gestiegen. Die Herausforderung, den wachsenden Datenbedarf zu bewältigen, wird noch dadurch verschärft, dass Regierungsbehörden ihre Arbeit erledigen und gleichzeitig Verschwendung, Betrug und Missbrauch effizient im Keim ersticken müssen, um die ethische Verwendung von Steuergeldern zu gewährleisten.

Das Government Accountability Office (GAO) hat kürzlich 36 Operationen identifiziert, die verändert werden müssen, um mit den Anforderungen an das Datenmanagement Schritt zu halten, einschließlich Hochrisikobereiche, die den Handel, die Wirtschaft und die Sicherheit des Landes betreffen. 

Ohne eine angemessene IT-Infrastruktur haben Regierungsbehörden Schwierigkeiten, große Datenmengen effizient zu untersuchen und zu analysieren, was häufig menschliches Eingreifen erforderlich macht. Daher ist es für Behörden schwierig, die datengesteuerten Operationen auszuführen, die zur Aufrechterhaltung des öffentlichen Vertrauens erforderlich sind.

Um diese Herausforderungen zu bewältigen, nutzt der IRS KI-Tools, die von NVIDIA-Infrastruktur, maschinellem Lernen und Anwendungen zur Betrugserkennung beschleunigt werden.

Durch NVIDIA GPUs beschleunigte Anwendungen zur Betrugserkennung

CPUs und manuelle Leistungen reichen nicht aus

Zur Bekämpfung von Steuerbetrug und zur Aufdeckung böswilliger Akteure müssen Ermittler des IRS Daten aus Jahrzehnten analysieren, Personen mit verdächtigen Transaktionen in Verbindung bringen und Transaktionen über mehrere Schritte und mehrere Sprünge in einem Diagramm verfolgen.  

Vor diesem Hintergrund wurde ein Datenwissenschaflter des IRS damit beauftragt, einen Datensatz von mehr als 3 Terabyte zu durchforsten und Muster zu identifizieren, die Betrug aufdecken. Leider war die verfügbare Rechenleistung nicht ausreichend. Der Auftrag wurde eine ganze Nacht lang auf einer großen Bank von CPUs ausgeführt und konnte nicht abgeschlossen werden. Das Team versuchte, die Datensätze Server für Server zu entschlüsseln, war aber gezwungen, Datenuntergruppen manuell zusammenzufügen, damit die Lösung funktionierte. Selbst bei all dem sorgfältigen manuellen Aufwand war es nicht möglich, vollständige Einblicke in die Betrugserkennung in Echtzeit zu erhalten. 

Um datenorientierte Aufgaben wie diese zu erleichtern, implementiert der IRS leistungsstarke KI-Tools, maschinelles Lernen und Anwendungen, die in der Lage sind, Betrug und Identitätsdiebstahl schnell aufzudecken. 

Eine 20-fache Beschleunigung half dem IRS, Betrug aufzudecken

Mit der neuen Kombination aus Recheninfrastruktur und Softwarelösungen konnte der IRS schnell und einfach KI und maschinelles Lernen in großem Umfang implementieren. Mit Cloudera auf NVIDIA-GPUs wurden die Workloads sofort bis zu 5-mal schneller und ohne Codeänderungen ausgeführt. Aber es gab noch Raum für Verbesserungen.

Cloudera beauftragte ein Team von  NVIDIA-Datenwissenschaftlern, den IRS-Code zu untersuchen. Sie stellten fest, dass einige Aufgaben mit besonders komplexen Datenstrukturen immer noch auf CPUs ausgeführt wurden. NVIDIA schrieb neuen Code für die Bearbeitung dieser Aufgaben und fügte ihn in die Software-Schnittstelle von Spark für NVIDIA RAPIDS™ ein, die offene Bibliothek für die Ausführung von Datenanalysen auf GPUs.

Als das IRS-Team den neuen Code auf GPUs in einem verteilten Spark-Cluster ausführte, stellte es eine bemerkenswerte Beschleunigung um das 20-fache fest. 

Durch die Entwicklung von Workloads, die Apache Spark und Graphenanalyse verwenden, haben Engineeringteams immense Graphen mit Knoten und Edges erstellt. Mifhilfe von KI-Bots und Algorithmen für maschinelles Lernen zur Analyse von Grafiken konnten Ermittler Einzelpersonen mit Institutionen und anschließend mit größeren Unternehmen über Jahre und Jahrzehnte hinweg in Verbindung bringen. Diese Erkenntnisse halfen dabei, Muster schnell aufzudecken, die auf Betrug hindeuten.

Dieselben Datensätze, die früher Wochen oder Monate zur Zusammenstellung und Verarbeitung in Anspruch nahmen, benötigen jetzt nur noch Stunden oder Minuten. Die Tests haben eine 10-fache Verbesserung bei den Engineering- und Datenwissenschafts-Workflows mit einer 50-prozentigen Senkung der Infrastrukturkosten ergeben. 

Erfolgreicher Schutz für Steuerzahler

Mit einer verbesserten Recheninfrastruktur und KI-Implementierung kann der IRS Kosten senken und den Steuerzahler besser vor Betrug und Identitätsdiebstahl schützen. 

Auf der Grundlage seines Erfolgs bei der Datenaufbereitung und Datenanalyse plant der IRS, KI-Inferenzaufträge zu beschleunigen und die Infrastruktur der Spark-GPU zu nutzen, um die Verarbeitung natürlicher Sprache und andere Analyseaufgaben zu bewältigen 

Überall in der Regierung gibt es zahlreiche Möglichkeiten, die Leistung mit KI und beschleunigtem Computing zu verbessern. Andere Regierungsbehörden, die Transaktionen zur Minderung von Verschwendung, Diebstahl und Betrug verfolgen, können dem Beispiel des IRS folgen und Infrastruktur und Software modernisieren, um einen höheren Standard für die betriebliche Effizienz und den öffentlichen Dienst zu erreichen. 

„Die Integration von Cloudera und NVIDIA wird uns in die Lage versetzen, datengestützte Erkenntnisse für unternehmenskritische Anwendungsfälle zu nutzen. Wir implementieren diese Integration derzeit und sehen bereits mehr als 20-fache Geschwindigkeitsverbesserungen bei der Hälfte der Kosten für unsere Datenentwicklung und Datawissenschafts-Workflows.“

Joe Asaldi
Technical Branch Chief of Research and Applied Analytics and Statistics, IRS

Ergebnisse

  • 20-fache Beschleunigung der Experimente von Datenwissenschaftlern

  • 50 Prozent weniger Kosten für Workflows in den Bereichen Datenwissenschaft und Datenentwicklung

Mehr erfahren

Schauen Sie sich genauer an, wie NVIDIA dazu beiträgt, Innovationen im öffentlichen Sektor zu beschleunigen.