NVIDIA Clara™ Discovery è una raccolta di framework, strumenti, applicazioni e modelli pre-addestrati accelerati da GPU per la ricerca farmacologica computazionale. Progettata per supportare i flussi di lavoro interdisciplinari, Clara Discovery aiuta scienziati e ricercatori a commercializzare farmaci più velocemente e consente nuove possibilità di ricerca sui meccanismi delle malattie.
Gli algoritmi di deep learning basati su GPU e i modelli trasformativi accelerano ogni fase della ricerca farmacologica. Dal training di modelli linguistici di grandi dimensioni (LLM) che comprendono lo spazio chimico alle simulazioni di dinamica molecolare, la previsione della struttura proteica e la progettazione di farmaci generativi, nuove tecniche di deep learning stanno rivoluzionando il modo in cui gli scienziati esplorano l'universo chimico in continua espansione.
Credit: Mahendra awale, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0 , via Wikimedia Commons
Annunciato alla GTC, BioNeMo è un framework applicativo e servizio cloud basato su IA costruito su NVIDIA NeMo Megatron per addestrare e distribuire modelli IA di trasformatori biomolecolari di livello supercomputing. BioNeMo include modelli linguistici di grandi dimensioni pre-addestrati ed è calibrato per il linguaggio delle proteine, del DNA e del sistema di inserimento lineare molecolare semplificato (SMILES).
Il framework di training per grandi modelli di linguaggio chimico, MegaMoIBART permette la generazione di molecole nell’ordine dei grandeza del supercomputing basato su IA con elevata validità e unicità.
La ricerca farmacologica abbraccia molti flussi di lavoro, dall'esplorazione dell'universo chimico alla previsione delle strutture proteiche, alla scansione dei farmaci candidati e alla simulazione delle molecole. Guida le innovazioni all'avanguardia in queste aree con i potenti strumenti di Clara Discovery, disponibili nel catalogo NVIDIA NGC™.
I modelli linguistici di grandi dimensioni basati su Transformer stanno creando nuove possibilità per l'esplorazione in tempo reale dell'universo chimico. BioNeMo è un framework specifico per il training e la distribuzione di LLM biomolecolari nell'ordine del supercomputing basato su NeMo Megatron. Contiene i modelli di trasformazione MegaMolBART, ESM-1b e ProtT5.
MegaMolBARTè un modello di chimica generativa addestrato su 1,4 miliardi di molecole (stringhe SMILES) e può essere utilizzato per una vasta gamma di applicazioni chimico-informatiche nella ricerca farmacologica, quali previsione delle reazioni, ottimizzazione molecolare e generazione ex novo di molecole di piccole dimensioni.
ProtT5 e ESM-1b hanno dimostrato che il pre-training non supervisionato può essere utilizzato per generare integrazioni apprese che contengono proprietà per prevedere la struttura proteica, la funzione, la posizione cellulare, l'imprevedibilità dell'acqua, il legame a membrana, le regioni conservanti e variabili e altro ancora.
Gli approcci basati su deep learning come RELION stanno alimentando l'automazione ad alta produttività della microscopia elettronica criogenica (cryo-EM) per la determinazione della struttura proteica. RELION implementa un approccio bayesiano empirico per l'analisi della cryo-EM per perfezionare ricostruzioni 3D singole o multiple e medie di classe 2D.
Per comprendere le strutture proteiche con dettagli atomistici, strumenti come MELD possono essere utilizzati per dedurre strutture da dati sparsi, ambigui o rumorosi. MELD sfrutta i dati in un framework bayesiano basato sulla fisica per migliorare la determinazione della struttura proteica.
Immagine gentilmente concessa da Rommie Amaro e dalla University of California San Diego
Con l'IA e il computing accelerato, milioni di farmaci candidati possono essere confrontati con un bersaglio rigido di proteine. AutoDock è una crescente raccolta di metodi per il docking computazionale e lo screening virtuale per l'uso nella ricerca farmacologica basata sulla struttura e l'esplorazione dei meccanismi biomolecolari di base.
I framework di dinamica molecolare basati su GPU possono simulare i meccanismi fondamentali delle cellule e calcolare con quanta forza un farmaco candidato si legherà al bersaglio proteico previsto. Il potenziale del machine learning permette di raggiungere una migliore precisione a livello meccanico in termini di stima quantistica di forze ed energie e sta cambiando radicalmente le tecniche di simulazione molecolare.
Clara Discovery include una vasta gamma di strumenti e framework per la simulazione molecolare, tra cui GROMACS, NAMD, Tinker-HP, VMD, TorchANI e DeePMD-Kit.
Clara Discovery è ottimizzato per l'esecuzione su NVIDIA DGX™ A100, il sistema IA più avanzato del mondo che offre cinque petaFLOPS di prestazioni. Progettato appositamente per tutti i carichi di lavoro di computing accelerato su larga scala, DGX A100 offre ai ricercatori più rapido per trovare soluzioni e un'infrastruttura unificata e facile da implementare per supportare la nuova generazione della ricerca farmacologica.
Vedi le prestazioni dell'applicazione HPC
Leggi il white paper Pharma POD
Scopri la piattaforma computazionale avanzata di Schrodinger
CPU vs GPU: NVIDIA Clara Parabricks, Relion, Autodock-GPU, NVIDIA RAPIDS, Amber, NAMD, VMD, Gromacs, NVIDIA Clara Imaging, BERT Training
Informativa sulla privacy NVIDIA