NVIDIA Clara™ Discovery regroupe une collection de frameworks, d’outils, d’applications et de modèles pré-entraînés, optimisés et accélérés par GPU pour la découverte de médicaments assistée par ordinateur. Conçue pour prendre en charge les workflows multidisciplinaires, la plateforme Clara Discovery aide les scientifiques et les chercheurs à accélérer la mise sur le marché des médicaments et offre de nouvelles possibilités pour la recherche sur les mécanismes pathologiques.
Les algorithmes de Deep Learning et les modèles de transformateurs accélérés par GPU sont en mesure d’accélérer chaque phase de la découverte de médicaments. De l’entraînement de grands modèles de langage qui intègrent l’espace chimique jusqu’aux simulations de dynamique moléculaire, en passant par la prédiction de structures protéiques et la conception générative de médicaments, de nouvelles techniques de Deep Learning révolutionnent la façon dont les scientifiques explorent l’univers chimique en perpétuelle évolution.
Credit: Mahendra awale, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0 , via Wikimedia Commons
Annoncé à la GTC, BioNemo est un framework d’applications et un service Cloud basé sur NVIDIA NeMo Megatron pour l’entraînement et le déploiement de modèles d’IA dotés de capacités de calcul intensif pour les transformateurs biomoléculaires. BioNeMo, qui est livré avec de grands modèles de langage pré-entraînés, est adapté au langage des protéines, de l’ADN et du système d’entrée de ligne à entrée moléculaire simplifié (SMILES).
Framework d’entraînement pour les grands modèles de langage chimique, MegaMoIBART permet de générer des molécules avec des capacités de calcul intensif basées sur l’IA, mais aussi des niveaux sans précédent de validité et d’unicité.
La recherche pharmaceutique s’applique à de nombreux workflows allant de l’exploration de l’univers chimique à la prédiction des structures protéiques, en passant par l’analyse de médicaments candidats et la simulation de molécules. Faites de nouvelles découvertes dans ces domaines grâce aux puissants outils de Clara Discovery, disponibles dans le catalogue NVIDIA NGC™.
Les grands modèles de langage basés sur des transformateurs créent de nouvelles possibilités pour l’exploration en temps réel de l’univers chimique. Basé sur NeMo Megatron, BioNeMo est un framework spécifique à un domaine pour l’entraînement et le déploiement de grands modèles de langage biomoléculaires à l’échelle des supercalculateurs. Il contient les modèles de transformateurs MegaMolBART, ESM-1b et ProtT5.
MegaMolBART est un modèle de chimie générative entraîné sur 1,4 milliard de molécules (chaînes SMILES) et pouvant être utilisé pour une grande variété d’applications de chimio-informatique dans des champs d’application tels que la prédiction de réactions, l’optimisation moléculaire ou la génération de molécules "de novo" pour les petites molécules.
ProtT5 et ESM-1b ont démontré qu’un pré-entraînement non supervisé peut être utilisé pour générer des intégrations adéquates contenant des propriétés susceptibles de prédire la structure protéique, la fonction, l’emplacement cellulaire, la solubilité dans l’eau, l’état membranaire, les régions conservées et variables, et bien plus encore.
Des approches basées sur le Deep Learning comme RELION permettent une automatisation à haut rendement de la cryo-microscopie électronique (cryo-ME) pour la détermination des structures protéiques. RELION met en œuvre une approche empirique bayésienne pour l’analyse de cryo-ME afin d’affiner des reconstructions 3D uniques ou multiples ainsi que des moyennes de classes 2D.
Pour comprendre les structures protéiques avec des détails atomistiques, des outils tels que MELD peuvent être utilisés afin de déduire des structures à partir de données rares, ambigües ou bruyantes. MELD exploite les données dans un framework bayésien basé sur la physique afin d’améliorer la détermination des structures protéiques.
Image fournie par Rommie Amaro et l’Université de Californie de San Diego
Grâce à l’IA et au calcul accéléré, des millions de médicaments candidats peuvent être évalués par rapport à une cible protéique rigide. AutoDock est une collection croissante de méthodes d’amarrage numérique et de dépistage virtuel pour la recherche pharmaceutique et l’exploration des mécanismes de base de la structure biomoléculaire basées sur la structure.
Les frameworks de dynamique moléculaire accélérés par GPU peuvent simuler les mécanismes fondamentaux des cellules et calculer dans quelle mesure un médicament candidat se lie à la cible protéique à laquelle il est destiné. Les potentiels d’apprentissage automatique, qui affichent des promesses de précision, d’énergies et de forces au niveau de la mécanique quantique, révolutionnent les simulations moléculaires.
Clara Discovery inclut une grande variété d’outils et de frameworks pour la simulation moléculaire, parmi lesquels GROMACS, NAMD, Tinker-HP, VMD, TorchANI et DeePMD-Kit.
La plateforme Clara Discovery est optimisée pour une exécution sur NVIDIA DGX™ A100, le système d’IA le plus avancé au monde offrant jusqu’à cinq pétaflops de puissance de calcul. Spécifiquement conçu pour l’accélération des charges de calcul avec une évolutivité incomparable, DGX A100 fournit aux chercheurs les délais de développement les plus courts de l’industrie, et il offre aux équipes informatiques une infrastructure unifiée et facile à déployer à même de prendre en charge la nouvelle génération de la recherche pharmaceutique.
Découvrez les performances des applications HPC
Accéder au livre blanc Pharma POD
En savoir plus sur la plateforme de calcul avancée de Schrödinger
CPU vs GPU : NVIDIA Clara Parabricks, Relion, Autodock-GPU, NVIDIA RAPIDS, Amber, NAMD, VMD, Gromacs, NVIDIA Clara Imaging, BERT Training
Déclaration de confidentialité de NVIDIA