Services financiers

De plusieurs mois à quelques minutes : Wealthsimple accélère l'inférence et la fourniture de modèles d'apprentissage automatique

Objectif

Wealthsimple est une entreprise canadienne de services de gestion de placements en ligne de premier plan avec plus de 15 milliards de dollars en actifs sous gestion. La société s'est tournée vers la plateforme d'inférence IA de NVIDIA pour accélérer le délai de commercialisation de ses modèles d'apprentissage automatique (ML) utilisés pour offrir des expériences haut de gamme à ses clients.

Client

Wealthsimple

Partenaire

Amazon Web Services (AWS)

Cas d'utilisation

IA générative

Produits

Serveur d’inférence NVIDIA Triton

145 millions de prédictions : le succès à grande échelle grâce à la plateforme d'inférence IA de NVIDIA

Wealthsimple utilise une technologie de pointe pour proposer une suite complète de produits financiers à la fois simples et sophistiqués dans les domaines de l'investissement géré, du trading autonome, des crypto-monnaies, des déclarations d'impôts, des dépenses et de l'épargne. Sa mission consiste à aider chaque personne à atteindre la liberté financière, peu importe de qui il s'agit et de combien cette personne dispose. Cependant, la plateforme de gestion financière canadienne s'est retrouvée confrontée à un défi courant : l'absence d'une plateforme d'inférence IA standardisée conduisait les équipes d'ingénierie à mettre en moyenne plusieurs mois à déployer de nouveaux modèles d'apprentissage automatique en production, empêchant du même coup l'entreprise de fournir des services d'investissement basés sur l'apprentissage automatique à ses clients. Elle a alors décidé de déployer la plateforme d'inférence IA de NVIDIA, ce qui a déclenché une dynamique de réussites remarquables.

Aujourd'hui, Wealthsimple gère plus de 30 milliards de dollars canadiens en actifs et prend en charge plus de 30 modèles d'IA ayant généré plus de 145 millions de prédiction au cours des 12 derniers mois. Fait marquant : sur l'année et demie écoulée depuis l'implémentation de la plateforme de NVIDIA, l'équipe ingénierie n'a été confrontée à aucun ticket d'assistance ayant trait à l'inférence IA, preuve de l'extrême fiabilité et du peu de maintenance que requiert la plateforme.

La plateforme de gestion a récemment atteint une nouvelle étape clé : les développeurs de modèles ont réussi à déployer leur premier modèle d'apprentissage automatique sans aucune aide en ingénierie. La présence de la plateforme d'inférence IA de NVIDIA a permis à l'équipe d'ingénierie de Wealthsimple de procéder en douceur à une transition vers une fourniture de l'apprentissage automatique en tant que service à destination d'autres équipes, et d'éviter ainsi de devoir détourner de précieuses ressources en science des données de leurs projets importants. À la suite à ce changement, le délai de livraison des modèles est passé de plusieurs mois à 15 minutes, soit une amélioration qui change radicalement la donne pour l'entreprise.

Création d'expériences haut de gamme avec la personnalisation optimisée par le ML

Les modèles de ML jouent un rôle central chez Wealthsimple : ils contribuent à détecter les fraudes, à analyser les transactions suspectes et à optimiser les expériences d'intégration pour les nouveaux clients. La principale société canadienne de technologie financière utilise également des moteurs de recommandation pour améliorer l'expérience client : de quoi garantir un service de tout premier ordre pour les nouveaux utilisateurs. La plateforme d'inférence IA de NVIDIA permet à Wealthsimple de déployer des modèles qui prédisent le service à laquelle un virement institutionnel doit être envoyé au sein d'une structure financière particulière. Une information qui accélère considérablement les processus de transaction pour les clients.

Avant d'adopter le serveur d'inférence Triton™ de NVIDIA, qui fait partie de la plateforme d'inférence IA de la firme, l'entreprise a testé un produit alternatif et connu un temps de disponibilité de 95 %, ce qui a causé des retards pouvant aller jusqu'à plusieurs semaines pour 5 % des virements électroniques de ses clients. Le serveur d'inférence Triton, en revanche, a permis un temps de disponibilité de 99,999 %, avec un impact évident : les prédictions incorrectes ne se traduisent plus par des semaines de retard lorsque les clients cherchent à accéder à leurs fonds.

Wealthsimple s'est lancé dans cette transition révolutionnaire en commençant par une expérimentation des modèles sur CPU, avant de rapidement opter pour un déploiement de ses modèles sur des GPU de NVIDIA, un processus facilité par le serveur d'inférence Triton et ses capacités indépendantes du matériel qui fonctionnent à la fois sur des CPU et des GPU. Aujourd'hui, Wealthsimple exécute des modèles basés sur des GPU NVIDIA A10G dans le Cloud AWS et exploite l'image-machine AWS optimisée par des GPU de NVIDIA pour améliorer l'efficacité et promouvoir l'innovation.

Le serveur d'inférence Tritonest disponible avec NVIDIA AI Enterprise, pour une sécurité, une stabilité et une assistance professionnelles.

À propos de Wealthsimple

Wealthsimple est l'une des plateformes de gestion de fonds les plus fiables et dynamiques au Canada. L'entreprise propose une suite complète de produits financiers à la fois simples et sophistiqués dans les domaines de l'investissement géré, du trading autonome, des crypto-monnaies, des déclarations d'impôts, des dépenses et de l'épargne. Wealthsimple dessert actuellement 3 millions de Canadiens et détient plus de 30 milliards de dollars d'actifs. L'entreprise, dont le siège social est installé à Toronto, au Canada, a été fondée en 2014 par une équipe d'experts financiers et d'entrepreneurs en technologie.

"La plateforme d'inférence IA de NVIDIA a été le pilier de la réussite de notre organisation en matière d'apprentissage automatique. Elle a révolutionné le déploiement de notre modèle, réduit les interruptions et nous a permis de fournir un service inégalé à nos clients."

Mandy Gu
Responsable senior du développement logiciel chez Wealthsimple

Résultats

  • Réduction du temps de déploiement des modèles, qui passe de plusieurs mois à 15 minutes
  • Augmentation du temps de disponibilité de l'inférence de 95 % à 99,999 %
  • Réduction de la latence du service d'inférence de 20 %
  • 145 millions de prédictions au cours des 12 derniers mois sans besoin d'assistance informatique

Découvrez comment la plateforme d'inférence IA de NVIDIA peut faire passer votre cas d'utilisation de l'IA de l'expérimentation à la production.