Venta Minorista

Amazon Acelera la Satisfacción del Cliente con Servidor de Inferencia NVIDIA Triton y NVIDIA TensorRT

Objectivo

Amazon mejora la experiencia del cliente con un corrector ortográfico en tiempo real impulsado por IA para la búsqueda de productos.

Cliente

Amazon

Caso de Uso

Búsqueda en TIempo Real

Tecnología

NVIDIA TensorRT, Servidor de Inferencia NVIDIA Triton, T5, Triton Model Analyzer

Revisión Ortográfica en Tiempo Real para Una Búsqueda de Productos Mejorada

Amazon.com, uno de los sitios web de comercio electrónico más visitados del mundo, permite a los clientes comprar sin esfuerzo utilizando un modelo de IA que corrige automáticamente las palabras mal escritas en las consultas de búsqueda. Amazon mide el éxito de sus resultados de búsqueda acelerados basándose en la latencia (la rapidez con la que el corrector ortográfico corrige un error tipográfico) y el rendimiento (el número de sesiones exitosas).

Soluciones NVIDIA

Para lograr los resultados deseados, Amazon utiliza el modelo de procesamiento de lenguaje natural (NLP) Text-To-Text Transfer Transformer (T5) para la corrección ortográfica. Para acelerar la corrección de texto, aprovechan el software de inferencia de IA de NVIDIA, incluido el Servidor de Inferencia NVIDIA Triton™ y NVIDIA® TensorRT™, un SDK para inferencia de deep learning de alto rendimiento.

Resultados de Amazon

Resultados

  • Aceleración de inferencia 5 veces mayor con NVIDIA TensorRT y Servidor de Inferencia NVIDIA Triton

  • Inferencia en tiempo real (<50 ms)

Amazon implementó con éxito el modelo T5 NLP para la corrección ortográfica automática, acelerado por el Servirdor de Inferencia Triton y TensorRT. Las soluciones de NVIDIA ofrecieron respectivamente menos de 50 ms de latencia de inferencia y 5 veces el rendimiento del modelo T5, utilizando GPU NVIDIA en Amazon Web Services (AWS). El Triton Model Analyzer también redujo el tiempo necesario para encontrar la configuración de inferencia óptima de semanas a horas. Con la IA, los compradores en línea ahora pueden encontrar los productos que buscan de manera más rápida y sencilla, lo que aumenta la satisfacción general del cliente de Amazon.

Acerca de Amazon

Amazon.com, Inc. es una empresa de tecnología multinacional estadounidense que se centra en el comercio electrónico.

“Se trata de la experiencia del cliente y la barra de búsqueda es el punto de entrada para nuestros clientes en todo el mundo. Con Model Analyzer lo que antes nos llevaba dos o tres semanas lo podemos hacer en menos de un día. Demostramos que los modelos generativos funcionan mejor en las GPU NVIDIA, eso quedó claro. Si puedo llevar una latencia de milisegundos a modelos más grandes, puedo hacer felices a más clientes. NVIDIA se centra en lo correcto: optimizar el rendimiento, y son excelentes socios, rápidos y receptivos en cuanto a funciones”.


Desarrollador Sénior de Machine Learning

Amazon