“É tudo uma questão de experiência do cliente, e a barra de pesquisa é o ponto de entrada para nossos clientes em todo o mundo. Com o Model Analyzer, o que costumava levar duas ou três semanas, podemos fazer em menos de um dia. Demonstramos que os modelos generativos funcionam melhor em GPUs NVIDIA, isso ficou claro. Se eu conseguir trazer latência de milissegundos para modelos maiores, poderei deixar mais clientes satisfeitos. A NVIDIA se concentra na coisa certa: otimizar o desempenho, e eles são excelentes parceiros, rápidos e responsivos em recursos.”