Cette nouvelle combinaison d’infrastructures informatiques et de solutions logicielles a permis à l’IRS de mettre rapidement et facilement en œuvre l’IA et l’apprentissage automatique de manière évolutive. Avec Cloudera exécuté sur des GPU de NVIDIA, les charges de travail ont immédiatement été jusqu’à 5 fois plus rapides avec les changements de code. Mais une marge d’amélioration persistait.
Cloudera a fait appel à une équipe de spécialistes des données de NVIDIA pour examiner le code IRS. Celle-ci a déterminé que certaines tâches liées à des structures de données particulièrement complexes continuaient à être exécutées sur des CPU. NVIDIA a créé un nouveau code pour gérer ces tâches et l’a inséré dans l’interface logicielle de Spark pour NVIDIA RAPIDS™, sa bibliothèque ouverte pour l’analyse des données sur GPU.
Lorsque l’équipe de l’IRS a transféré le nouveau code sur des GPU dans un cluster distribué de Spark, elle a constaté une vitesse multipliée par 20.
En développant des charges de travail utilisant Apache Spark et des analyses graphiques, les équipes d’ingénierie ont créé des graphiques immenses avec des nœuds et des limites. Grâce à l’analyse des graphiques par des robots basés sur l’IA et des algorithmes d’apprentissage automatique, les enquêteurs ont pu relier des individus à des institutions et, par la suite, à de grandes entités sur des années et des décennies. Ces observations ont permis d’exposer rapidement des schémas frauduleux.
Les jeux de données qui nécessitaient des semaines voire des mois pour s’associer et lancer des procédures le font désormais en quelques heures ou minutes. Les tests ont révélé une efficacité multipliée par 10 des workflows d’ingénierie et de sciences des données, ainsi qu’une réduction de 50 % des coûts d’infrastructure.