Perplexity ha adottato NVIDIA NeMo, facendo affidamento sulla sua affidabilità, flessibilità e facilità d'uso per creare modelli personalizzati per il proprio motore di risposte online. Sono state utilizzate diverse tecniche di elaborazione dati e di allineamento avanzato dei modelli supportate da NeMo:
- Ottimizzazione supervisionata: le capacità di NeMo nella gestione di dati distribuiti su più nodi hanno permesso a Perplexity di scalare i propri processi di addestramento in modo efficiente.
- Ottimizzazione diretta delle preferenze (DPO): questo ha permesso a Perplexity di migliorare le prestazioni dei modelli preaddestrati per allinearli alle preferenze umane, adattando i modelli alle esigenze degli utenti.
- Ottimizzazione delle politiche prossimali (PPO): questa tecnica di allineamento ha consentito di migliorare i risultati dei modelli di addestramento per attività complesse, come giocare e controllare dei robot, con risultati migliori.
Nel giro di pochi giorni dal lancio di una nuova versione open source, il team ha potuto ottenere un nuovo modello Sonar migliorato del 20% rispetto al modello di ricerca di base.
Perplexity ha applicato l'ottimizzazione a modelli innovativi, tra cui le famiglie di modelli Llama e Mistral, e sfrutta la generazione aumentata di recupero per fornire risposte precise e concise basate sui dati recuperati. Questo livello di personalizzazione ha permesso a Perplexity di ottenere un'elevata precisione e pertinenza nelle proprie applicazioni IA.
Inoltre, la facilità d'uso di NeMo, l'ampia gamma di architetture di modelli supportate e l'elevato throughput di addestramento hanno consentito a Perplexity di sperimentare e trovare rapidamente i modelli più ottimizzati per le proprie applicazioni.