O NVIDIA Clara™ Discovery é uma coleção de frameworks, ferramentas, aplicações e modelos pré-treinados otimizados e acelerados por GPU para a descoberta computacional de medicamentos. Desenvolvido para possibilitar workflows multidisciplinares, o Clara Discovery ajuda cientistas e pesquisadores a comercializar medicamentos mais rapidamente e traz novas possibilidades de pesquisa em mecanismos de doenças.
Algoritmos de deep learning e modelos de transformers habilitados por GPU estão prontos para acelerar cada fase da descoberta de medicamentos. Do treinamento de grandes modelos de linguagem (LLMs - Large Language Models) que entendem o espaço químico às simulações de dinâmica molecular, previsão da estrutura proteica e design generativo de medicamentos, novas técnicas de deep learning estão mudando a maneira como os cientistas exploram o universo químico em constante expansão.
Credit: Mahendra awale, CC BY-SA 3.0 https://creativecommons.org/licenses/by-sa/3.0 , via Wikimedia Commons
Anunciada no GTC, o BioNemo é um framework de aplicações e serviço em cloud desenvolvido com o NVIDIA NeMo Megatron para treinamento e implantação de grandes modelos de transformer biomoleculares de AI em escala de supercomputação. O BioNeMo vem com modelos de linguagem grandes pré-treinados e é adaptado para a linguagem de proteínas, DNA e o sistema simplificado de entrada de linha de entrada molecular (SMILES - Simplified Molecular-Input Line-Entry System).
O framework de treinamento de grandes modelos de linguagem química, o MegaMoIBART, permite a geração de moléculas em escala de supercomputação de AI com alta validade e singularidade.
A descoberta de medicamentos abrange muitos workflows, desde a exploração do universo químico e a previsão de estruturas proteicas até a digitalização de candidatos a medicamentos e a simulação de moléculas. Impulsione avanços nessas áreas com as poderosas ferramentas do Clara Discovery, disponíveis no catálogo do NVIDIA NGC™.
Grandes modelos de linguagem baseados em transformers estão criando novas possibilidades para a exploração em tempo real do universo químico. O BioNeMo é um framework específico do domínio para treinamento e implantação de LLMs biomoleculares em escala de supercomputação, desenvolvido no NeMo Megatron. Ele contém os modelos de transformers MegaMolBART, ESM-1b e ProtT5.
O MegaMolBART é um modelo de química generativa treinado com 1,4 bilhão de moléculas (strings SMILES) e pode ser usado para várias aplicações quimioinformáticas na descoberta de medicamentos, como previsão de reação, otimização molecular e geração de novas moléculas para pequenas moléculas.
O ProtT5 e o ESM-1b demonstraram que o pré-treinamento não supervisionado pode ser usado para gerar incorporações aprendidas que contêm propriedades para prever estrutura proteica, função, localização celular, solubilidade da água, limitação da membrana, conservada e regiões variáveis e muito mais.
Abordagens baseadas em deep learning como o RELION estão impulsionando a automação de alta taxa de transferência de crio-microscopia eletrônica (crio-ME) para determinação da estrutura proteica. O RELION implementa uma abordagem bayesiana empírica para análise de crio-ME para refinar reconstruções 3D únicas ou múltiplas, bem como médias de classe 2D.
Para entender estruturas proteicas com detalhes atomísticos, ferramentas como a MELD podem ser usadas para inferir estruturas a partir de dados esparsos, ambíguos ou barulhentos. A MELD aproveita dados em um framework bayesiano baseado na física para melhorar a determinação da estrutura proteica.
Imagem cortesia de Rommie Amaro e da Universidade da Califórnia em San Diego
Com a AI e a computação acelerada, milhões de candidatos a medicamentos podem ser selecionados contra um alvo de proteína rígida. O AutoDock é uma coleção crescente de métodos de acoplamento computacional e triagem virtual para uso na descoberta e exploração de medicamentos baseados em estrutura dos mecanismos básicos de estrutura biomolecular.
Frameworks de dinâmica molecular com tecnologia de GPU podem simular os mecanismos fundamentais das células e calcular a intensidade com que um candidato a medicamento se ligará ao alvo de proteína pretendido. Os potenciais de machine learning, que mostram promessa de precisão, energias e forças em nível mecânico-quântico, estão mudando fundamentalmente a simulação molecular.
O Clara Discovery inclui uma variedade de ferramentas e frameworks para simulação molecular, incluindo GROMACS, NAMD, Tinker-HP, VMD, TorchANI e DeePMD-Kit.
O Clara Discovery é otimizado para ser executado na NVIDIA DGX™ A100, o sistema de AI mais avançado do mundo, oferecendo cinco petaFLOPS de desempenho. Desenvolvido especificamente para todas as cargas de trabalho de computação acelerada em escala, a DGX A100 oferece aos pesquisadores o tempo mais rápido para a solução e à TI uma infraestrutura unificada e fácil de implantar para dar suporte à próxima geração de descoberta de medicamentos.
Veja o Desempenho das Aplicações de HPC
Confira o White Paper do Pharma POD
Saiba mais Sobre a Plataforma Computacional Avançada da Schrodinger
CPU e GPU: NVIDIA Clara Parabricks, Relion, Autodock-GPU, NVIDIA RAPIDS, Amber, NAMD, VMD, Gromacs, NVIDIA Clara Imaging, Treinamento do BERT
Política de Privacidade da NVIDIA