Sector público

Uso de IA e informática acelerada para erradicar el despilfarro, el fraude y el robo

Objetivo

Aumentar la eficacia de las evaluaciones de lectura con reconocimiento de voz para fomentar el amor por el conocimiento de los niños, para que ayudarles a construir un futuro más brillante.

Cliente

Agencia tributaria

Partner

Cloudera

Caso de uso

Ciencia de datos

Tecnología

NVIDIA AI Enterprise
NVIDIA RAPIDS

La Agencia Tributaria aprovecha las herramientas de IA, el aprendizaje automático y las aplicaciones de detección de fraudes aceleradas por GPU NVIDIA

Al igual que cualquier otro sector, los requisitos de rendimiento de datos de la administración han crecido exponencialmente. Agravando el desafío de gestionar las crecientes necesidades de datos, las agencias gubernamentales deben desarrollar su labor sin dejar de estar atentos al despilfarro, el fraude y los abusos, para garantizar el uso ético del dinero de los contribuyentes.

La Oficina de Responsabilidad Gubernamental (GAO) identificó recientemente 36 operaciones que deben transformarse para mantenerse al día con los requisitos de gestión de datos, incluidas áreas de alto riesgo que afectan al comercio, la economía y la seguridad de la nación. 

Sin una infraestructura de TI adecuada, las agencias gubernamentales han tenido dificultades para explorar y analizar eficientemente grandes cantidades de datos, lo que hace necesaria la intervención humana frecuente. Esto dificulta que las agencias ejecuten efectivamente las operaciones basadas en datos necesarias para mantener la confianza del público.

Para superar estos desafíos, la Agencia Tributaria aprovecha las herramientas de IA aceleradas por la infraestructura de NVIDIA, el aprendizaje automático y las aplicaciones de detección de fraudes.

Aplicaciones de detección de fraude aceleradas por GPU NVIDIA

Las CPU y las labores manuales no dan la talla

Para combatir el fraude fiscal y descubrir los malos actores, los investigadores de la Agencia Tributaria deben analizar décadas de datos, vincular a personas con transacciones sospechosas y rastrear transacciones a través de múltiples pasos y múltiples saltos en un gráfico. 

Con esta misión, un científico de datos de la Agencia Tributaria se encargó de peinar un conjunto de datos de más de 3 terabytes e identificar patrones para exponer el fraude. Desafortunadamente, la potencia de computación disponible era insuficiente. Ni ejecutando el trabajo toda la noche en un gran banco de CPU pudo completarse el trabajo. El equipo intentó desglosar los conjuntos de datos, servidor por servidor, pero se vieron obligados a juntar manualmente subconjuntos de datos para conseguir que la solución funcionara. Incluso tras todo ese cuidadoso esfuerzo manual, no fue posible lograr una visibilidad completa para la detección de fraudes en tiempo real. 

Para mejorar las tareas centradas en datos como esta, la Agencia Tributaria está implementando herramientas de IA de alta potencia, aprendizaje automático y aplicaciones capaces de exponer rápidamente el fraude y el robo de identidad. 

Un aumento de 20 veces la velocidad ayudó a la Agencia Tributaria a destapar el fraude

La nueva combinación de infraestructura informática y soluciones de software permitió a la Agencia Tributaria implementar rápida y fácilmente la IA y el aprendizaje automático a escala. Con Cloudera ejecutándose en GPU NVIDIA, las cargas de trabajo inmediatamente se ejecutaron hasta 5 veces más rápido sin cambios de código. Pero todavía había margen de mejora.

Cloudera pidió a un equipo de científicos de datos de NVIDIA que examinara el código de la Agencia Tributaria. Determinaron que algunas tareas con estructuras de datos particularmente complejas todavía se estaban ejecutando en las CPU. NVIDIA escribió código nuevo para gestionar esos trabajos y lo insertó en la interfaz de software de Spark para NVIDIA RAPIDS™, la biblioteca abierta para ejecutar análisis de datos en GPU.

Cuando el equipo de la Agencia Tributaria ejecutó el nuevo código en GPU en un clúster distribuido de Spark, experimentaron un notable aumento de la velocidad, en unas 20 veces. 

Al desarrollar cargas de trabajo que utilizan Apache Spark y análisis de gráficos, los equipos de ingeniería crearon gráficos inmensos con nodos y bordes. Con bots de IA y algoritmos de aprendizaje automático que analizaban gráficos, los investigadores pudieron conectar personas con instituciones y, posteriormente, con grupos más grandes que abarcaban años y décadas. Esta información ayudó a exponer rápidamente los patrones reveladores de fraude.

Los mismos conjuntos de datos que solían tardar semanas o meses en juntarse y procesarse, ahora solo tardan horas o minutos. Las pruebas revelaron una mejora de 10 veces en los flujos de trabajo de ingeniería y ciencia de datos con una reducción del 50 por ciento en los costes de infraestructura. 

Aprovechar el éxito para proteger mejor a los contribuyentes

Con una infraestructura informática mejorada y la implementación de IA, la Agencia Tributaria está reduciendo los costos y protegiendo mejor a los contribuyentes al evitar el fraude y el robo de identidad.  

Sobre la base de su éxito en la preparación de datos y el análisis de datos, la Agencia Tributaria planea acelerar los trabajos de inferencia de IA y utilizar la infraestructura Spark-GPU para abordar el procesamiento de lenguaje natural y otros trabajos de análisis.  

En toda la Administración, hay innumerables oportunidades para mejorar el rendimiento con IA y computación acelerada. Otras agencias gubernamentales que rastrean transacciones para mitigar los desechos, robos y fraudes pueden seguir el ejemplo de la Agencia Tributaria y modernizar la infraestructura y el software para lograr un mayor estándar de eficiencia operativa y servicio público. 

«La integración de Cloudera y NVIDIA nos permitirá utilizar información basada en datos para impulsar casos de uso de misión crítica. Estamos implementando esta integración en la actualidad, y ya estamos viendo más de 20 mejoras de velocidad a la mitad del coste para nuestros flujos de trabajo de ingeniería de datos y ciencia de datos».

Joe Asaldi,
jefe de rama técnica de investigación y análisis y estadística aplicados, Agencia Tributaria

Resultados

  • Un aumento en 20 veces la velocidad de ejecución de los experimentos de científicos de datos

  • 50 por ciento menos coste de los flujos de trabajo de ciencia de datos e ingeniería de datos

Seguir aprendiendo

Echa un vistazo a cómo NVIDIA está ayudando a acelerar la innovación en el sector público.