La nueva combinación de infraestructura informática y soluciones de software permitió a la Agencia Tributaria implementar rápida y fácilmente la IA y el aprendizaje automático a escala. Con Cloudera ejecutándose en GPU NVIDIA, las cargas de trabajo inmediatamente se ejecutaron hasta 5 veces más rápido sin cambios de código. Pero todavía había margen de mejora.
Cloudera pidió a un equipo de científicos de datos de NVIDIA que examinara el código de la Agencia Tributaria. Determinaron que algunas tareas con estructuras de datos particularmente complejas todavía se estaban ejecutando en las CPU. NVIDIA escribió código nuevo para gestionar esos trabajos y lo insertó en la interfaz de software de Spark para NVIDIA RAPIDS™, la biblioteca abierta para ejecutar análisis de datos en GPU.
Cuando el equipo de la Agencia Tributaria ejecutó el nuevo código en GPU en un clúster distribuido de Spark, experimentaron un notable aumento de la velocidad, en unas 20 veces.
Al desarrollar cargas de trabajo que utilizan Apache Spark y análisis de gráficos, los equipos de ingeniería crearon gráficos inmensos con nodos y bordes. Con bots de IA y algoritmos de aprendizaje automático que analizaban gráficos, los investigadores pudieron conectar personas con instituciones y, posteriormente, con grupos más grandes que abarcaban años y décadas. Esta información ayudó a exponer rápidamente los patrones reveladores de fraude.
Los mismos conjuntos de datos que solían tardar semanas o meses en juntarse y procesarse, ahora solo tardan horas o minutos. Las pruebas revelaron una mejora de 10 veces en los flujos de trabajo de ingeniería y ciencia de datos con una reducción del 50 por ciento en los costes de infraestructura.