Servicios Financeiros

De Meses a Minutos: Wealthsimple Acelera la Entrega e Inferencia del Modelo de Machine Learning

Objetivo

Wealthsimple es una empresa canadiense líder en servicios de gestión de inversiones en línea con más de 15.000 millones de dólares en activos bajo gestión. La empresa recurrió a la plataforma de inferencia de IA de NVIDIA para acelerar el tiempo de comercialización de sus modelos de machine learning (ML) utilizados para ofrecer experiencias excepcionales a los clientes.

Cliente

Wealthsimple

Pareja

Amazon Web Services (AWS)

Caso de uso

Inferencia de IA

Productos

Servidor de Inferencia NVIDIA Triton

145 Millones de Predicciones: Aumento del Éxito con la Plataforma de Inferencia de IA de NVIDIA

Wealthsimple utiliza tecnología de punta para ofrecer un conjunto completo de productos financieros simples y sofisticados que abarcan inversiones administradas, operaciones "hágalo usted mismo", criptomonedas, declaración de impuestos, gastos y ahorros. Su misión es ayudar a todos a alcanzar la libertad financiera, sin importar quiénes sean o cuánto tengan. Sin embargo, la plataforma canadiense de gestión de dinero se enfrentaba a un desafío común. Sin una plataforma de inferencia de IA estandarizada, los equipos de ingeniería tardaron en promedio varios meses en implementar nuevos modelos de machine learning en producción, lo que impidió el éxito de la empresa en la prestación de servicios de inversión basados en ML a sus clientes. La empresa decidió implementar la plataforma de inferencia de IA de NVIDIA, lo que dio como resultado una serie de logros notables.

Hoy en día, Wealthsimple, que gestiona más de 20 mil millones de dólares canadienses en activos, admite más de 30 modelos de IA que generaron más de 145 millones de predicciones en los últimos 12 meses. En particular, en el último año y medio desde que implementó la plataforma de inferencia de IA de NVIDIA, la organización de ingeniería de la plataforma no ha encontrado ni un solo ticket de TI relacionado con la inferencia de IA, un testimonio del bajo mantenimiento y la alta confiabilidad de la plataforma.

 Recientemente, la plataforma de gestión de dinero logró otro hito. Los desarrolladores de modelos pudieron implementar su primer modelo de machine learning sin ningún soporte de ingeniería. Con la plataforma de inferencia de IA de NVIDIA implementada, la organización de ingeniería de Wealthsimple ha realizado una transición fluida para ofrecer ML como servicio a otros equipos, evitando el desvío de valiosos recursos de ciencia de datos de proyectos críticos. Tras el cambio, el tiempo de entrega del modelo se redujo de meses a menos de 15 minutos, un avance revolucionario para la organización.

Creación de Experiencias Diferenciadas con Personalización Impulsada por ML

Los modelos de machine learning desempeñan un papel fundamental en Wealthsimple , detectando fraudes, analizando transacciones sospechosas y optimizando las experiencias de incorporación para nuevos clientes. La fintech canadiense líder también utiliza motores de recomendación para mejorar la experiencia de los clientes, garantizando un servicio de primer nivel para los nuevos usuarios. La plataforma de inferencia de IA de NVIDIA permite a Wealthsimple implementar modelos que predicen la división, dentro de una institución financiera en particular, a la que se debe enviar una transferencia institucional. Esto acelera significativamente los procesos de transacciones para sus clientes.

Antes de adoptar el Servidor de Inferencia NVIDIA Triton™, parte de la plataforma de inferencia de IA de NVIDIA, la empresa experimentó con un producto de inferencia de framework de IA nativo alternativo y experimentó un tiempo de actividad del 95%. Esto provocó retrasos de hasta varias semanas en el 5% de las transferencias electrónicas de sus clientes. El Servidor de Inferencia Triton cambió las reglas del juego al ofrecer un impresionante tiempo de actividad del 99,999%. El impacto es claro, ya que cada predicción incorrecta ya no se traduce en semanas de retrasos para que los clientes accedan a sus fondos.

Wealthsimple inició este viaje transformador con la experimentación de modelos en CPU y pronto evolucionó para implementar sus modelos en GPU NVIDIA. Esto fue facilitado por el Servidor de Inferencia Triton con capacidades independientes del hardware que se ejecutan tanto en GPU como en CPU. Hoy en día, Wealthsimple ejecuta modelos impulsados por GPU NVIDIA A10G en la nube de AWS, aprovechando la imagen de máquina AWS optimizada para GPU NVIDIA para impulsar la eficiencia y la innovación.

El Servidor de Inferencia Triton está disponible con NVIDIA AI Enterprise, que ofrece seguridad, estabilidad y soporte de nivel empresarial.

Acerca de Wealthsimple

Wealthsimple es una de las plataformas de administración de dinero más confiables y de más rápido crecimiento en Canadá. La empresa ofrece un conjunto completo de productos financieros simples y sofisticados que abarcan inversiones administradas, operaciones de bricolaje, criptomonedas, declaración de impuestos, gastos y ahorros. Wealthsimple actualmente presta servicios a 3 millones de canadienses y posee más de 20 mil millones de dólares en activos. La empresa fue fundada en 2014 por un equipo de expertos financieros y emprendedores tecnológicos, y tiene su sede en Toronto, Canadá.

"La plataforma de inferencia de IA de NVIDIA ha sido el eje de la historia de éxito del machine learning de nuestra organización, revolucionando la implementación de nuestro modelo, reduciendo el tiempo de inactividad y permitiéndonos ofrecer un servicio incomparable a nuestros clientes".

Mandy Gu
Gerente Senior de Desarrollo de Software en Wealthsimple

Resultados

  • Reducción de los tiempos de implementación del modelo de varios meses a 15 minutos.
  • Aumento del tiempo de actividad de inferencia del 95% al 99,999%
  • Reducción de la latencia del servicio de inferencia en un 20%
  • Sirviendo 145 millones de predicciones en los últimos 12 meses sin tickets de TI

Obtenga más información sobre cómo la plataforma de inferencia de IA de NVIDIA puede ayudarle a llevar los casos de uso de IA de la experimentación a la producción.