Área da Saúde e Ciências da Vida

Deloitte Constrói Pipelines de Descoberta de Medicamentos com IA Generativa em Poucos Cliques

Objetivo

O NVIDIA DGX™ Cloud no Oracle Cloud Infrastructure (OCI) está permitindo que a Deloitte acelere a descoberta de medicamentos em sua solução de IA Quartz Atlas com IA generativa. Eles estão usando gráficos de conhecimento impulsionados por grandes modelos de linguagem (LLM), pipelines científicos com NVIDIA BioNeMo™, modelos personalizados e até mesmo treinando seus próprios modelos de linguagem química (CLMs) e modelos de linguagem de proteína (PLMs) antes de implantar perfeitamente em escala com microsserviços de inferência NVIDIA NIM.

Cliente

Deloitte Consultoria LLP

Caso de Uso

IA generativa / LLMs

Produtos

NVIDIA DGX Cloud
NVIDIA BioNeMo
NVIDIA AI Enterprise
NVIDIA NIM

Acelerando os Avanços Médicos por Meio da Inovação em IA

Como potência de pesquisa do maior provedor de serviços de consultoria do mundo, o Centro de Pesquisa Integrada da Deloitte[1] se dedica a explorar oportunidades transformadoras em todos os setores. Com uma forte ênfase na área da saúde, a equipe de pesquisa se propôs a alavancar o potencial da IA na aceleração do processo de descoberta de medicamentos. A descoberta de medicamentos é um processo demorado e caro, levando de 10 a 15 anos e custando, em média, mais de US$ 1 a 2 bilhões para cada novo medicamento a ser aprovado para uso clínico. Esses custos são acompanhados por uma assustadora taxa de falha de 90%[2]. Diante disso, a equipe da Deloitte reconheceu a necessidade de modelos pré-clínicos aprimorados, validação rigorosa de alvos e estratégias aprimoradas de tomada de decisão antes de embarcar em ensaios clínicos. Seu objetivo era reduzir significativamente a taxa de testes malsucedidos, melhorando a jornada de desenvolvimento de medicamentos.

1 Deloitte. Deloitte Ranked No. 1 Consulting Service Provider Worldwide by Revenue in Gartner® Market Share Report. July 2023.

2 NIH National Library of Medicine. Why 90% of Clinical Drug Development Fails and How to Improve It? July 2022.

O Quartz Atlas AI representa visualmente as conexões entre a proteína alergênica de bétula Bet-v-1 e entidades associadas. Essas conexões se originam de experimentos de laboratório úmido e links gerados por LLM provenientes de PLMs ou CLMs. A integração de dados experimentais com modelos de mundo aprendidos de PLMs e CLMs enriquece a compreensão dos cientistas fornecendo um contexto multimodal.

Desvendando Insights de Vastos Conjuntos de Dados Multimodais e Multidomínios

O avanço de um candidato a medicamento para ensaios clínicos de fase I é um marco significativo para as empresas farmacêuticas. No entanto, nove em cada 10 candidatos falham durante as fases subsequentes, incluindo ensaios de fase I, II e III, refletindo os desafios da descoberta de medicamentos. Esse pipeline complexo começa com a identificação de alvos relacionados a doenças, a triagem de compostos para eficácia, a otimização de compostos de chumbo para segurança e eficácia, a realização de testes pré-clínicos e o progresso de candidatos bem-sucedidos por meio de ensaios clínicos. A integração de dados nesse processo é um grande desafio, desde a integração de diversas fontes de dados biológicos na identificação de alvos até a análise de conjuntos de dados massivos na triagem. Reconhecendo a importância da integração de dados na descoberta de medicamentos impulsionados por IA, a Deloitte buscou usar IA generativa para agilizar o processo, visando economizar tempo e custos.

"Como pesquisadores, muitas vezes lidamos com dados multimodais, de texto a gráficos e imagens, abrangendo vários domínios científicos. Lemos patentes e vasculhamos artigos de pesquisa em busca de informações sobre anticorpos e compreensão das relações entre moléculas", disse Dan Ferrante, líder de IA para inovação e pesquisa e desenvolvimento da Deloitte Consulting LLP. "Queríamos harmonizar esses dados multimodais fragmentados provenientes de dezenas de conjuntos de dados de código aberto, incluindo versões de arquivos como o PubMed, o conjunto de dados Uniprot para proteínas, conjuntos de dados de anticorpos, conjuntos de dados de pequenas moléculas, etc. Esses recursos desempenham um papel crucial na tomada de decisões cotidianas sobre biológicos e pequenas moléculas. O desafio não era apenas inserir esses grandes volumes de dados em modelos avançados de deep learning, mas também treiná-los em grandes modelos de linguagem personalizados para proteína e quimioinformática para analisar e aprender padrões para previsões precisas. Esta pesquisa exigiu uma infraestrutura de computação de IA robusta e um stack de software altamente otimizado."

 
  • A execução de experimentos no DGX Cloud aumentou a produtividade do desenvolvedor em 50%, enquanto a simplificação do treinamento de vários nós economizou de 7 a 10 meses de tempo de configuração.
  • Com  o BioNeMo da NVIDIA AI Enterprise e DGX Cloud, o trabalho de montagem de um pipeline que antes levava de 4 a 6 semanas agora pode ser realizado com apenas alguns cliques, permitindo que os pesquisadores mergulhem diretamente nos projetos.

Quartz Atlas AI mostrando um gráfico de conhecimento interativo fornecendo níveis profundos de enriquecimento semântico habilitado para GenAI (LLMs, pLMs, cLMs, etc) em dados multimodais por meio de conexões e relacionamentos entre pontos de dados.

Experimentação Rápida com uma Plataforma Escalável e Modelos Personalizáveis de IA Generativa

A previsão da estrutura da proteína visa antecipar como uma proteína se dobrará em sua forma natural, o que é crucial para entender sua função no corpo e identificar alvos potenciais para terapias medicamentosas. A Deloitte desenvolveu o Quartz Atlas AI, um acelerador de descoberta de medicamentos de IA que analisa sequências de aminoácidos (as bases das proteínas) para determinar o melhor método de dobramento, que pode ser dado por um modelo de linguagem de proteína ou um método de dobra. Esse processo gera rapidamente estruturas 3D e prevê como os medicamentos podem se ligar a partes específicas da proteína. Um modelo de IA generativa refina ainda mais a estrutura da proteína ou molécula para identificar regiões dentro dela que provavelmente interagem com medicamentos (sobrepondo um mapa de calor de hotspots medicamentosos), ajudando nos esforços de desenvolvimento de medicamentos.  

"Para reunir com sucesso dados e pipelines científicos, combinamos os microsserviços BioNeMo da NVIDIA para previsão de estrutura otimizada e os modelos de IA generativa proprietários da Deloitte, que são treinados com DGX Cloud no Oracle Cloud Infrastructure", disse Ferrante. "Criamos um gráfico de conhecimento robusto impulsionado por IA generativa com a Atlas AI, carregando mais de uma dúzia de conjuntos de dados, o que equivale a 12 milhões de nós e 97 milhões de links de borda de conexão, totalizando 5 terabytes em volume bruto, pesquisáveis em segundos. Somos capazes de impulsionar essa grande quantidade de dados multimodais em nossos modelos, mapear o espaço da solução, analisar padrões e fazer previsões. A capacidade de treinar com conjuntos de dados extensos e escalar de forma eficiente foi possível aproveitando o DGX Cloud e sua capacidade de facilitar trabalhos de vários nós. O DGX Cloud on OCI nos forneceu acesso à mais recente arquitetura NVIDIA e malha de baixa latência que permitiu o dimensionamento da carga de trabalho em clusters interconectados otimizados para desempenho máximo em nossas cargas de trabalho mais exigentes."

A Deloitte está usando modelos NVIDIA BioNeMo, disponíveis como microsserviços NVIDIA NIM, incluindo AlphaFold2, OpenFold e ESMFold para previsão de estrutura de proteínas, juntamente com MegaMolBART e MolMIM para geração de moléculas. Ao mapear perfeitamente essas moléculas no espaço da solução, elas podem facilmente encontrar moléculas semelhantes com propriedades correspondentes, como toxicidade ou solubilidade. Esse processo meticuloso é crucial na descoberta de fármacos, facilitando a seleção eficiente de potenciais candidatos, a previsão precisa de segurança e eficácia e a exploração de diversos espaços químicos. Para obter mais insights, a Deloitte ajustou um modelo ESM2 de 15 bilhões de parâmetros para prever propriedades de proteínas na DGX Cloud, que foi utilizado por um modelo downstream para gerar novas sequências de proteínas com propriedades específicas desejadas.

 NVIDIA BioNeMo Framework optimizes training protein

The NVIDIA BioNeMo framework delivers optimized model architectures and tooling for training protein and small-molecule LLMs.

Um Aumento na Produtividade do Desenvolvedor, Juntamente com o Tamanho e a Escala Irrestritos do Modelo

Ferrante comentou: "No campo da biologia, muitos profissionais não querem lidar com os meandros da infraestrutura e escrever código. No entanto, o aproveitamento das ferramentas e do software dentro da DGX Cloud simplificou esse processo. Com apenas alguns cliques, nossos desenvolvedores podem selecionar um contêiner e acessar um notebook, eliminando a necessidade de proteger o Shell diretamente nos nós. Ao nos permitir executar facilmente vários experimentos em comparação com nossa solução anterior com grande visibilidade na fila de trabalhos, o DGX Cloud aumentou a produtividade do desenvolvedor em 50%."

"Devido à escala de nossos conjuntos de dados, o treinamento de vários nós foi crucial. Anteriormente, orquestrar o treinamento de vários nós era um processo manual, e nunca havíamos tentado isso em uma plataforma de nuvem. Com o DGX Cloud, o treinamento de vários nós agora é tão fácil quanto clicar em um botão, economizando de 7 a 10 meses de trabalho de infraestrutura e ferramentas que incluíam configuração de hardware, criação de contêiner e distribuição de carga de trabalho. Como resultado, nossos modelos não são mais limitados por tamanho ou escala de dados, e nossas corridas de treinamento foram reduzidas de quatro semanas para apenas oito horas."

"Anteriormente, construir o pipeline de descoberta de medicamentos era um processo trabalhoso, exigindo que fizéssemos engenharia reversa meticulosamente e depurássemos cada linha de código, enquanto rastreávamos alterações e gerenciamos várias versões. Antes levava de quatro a seis semanas para montar um pipeline, mas agora, com apenas alguns cliques, podemos mergulhar diretamente nos projetos. Graças à escalabilidade dos modelos BioNeMo e à facilidade de implantação através do NVIDIA NIM, as tarefas de pesquisa e desenvolvimento tornaram-se muito mais suaves. O ajuste fino dos modelos de base da BioNeMo no DGX Cloud e a implementação de um loop de inferência fortaleceram ainda mais a robustez do pipeline", disse Ferrante.

"Com a Atlas AI em vigor, a Deloitte pode fornecer aos usuários pipelines científicos para obter insights acionáveis combinando vários modelos juntos. Por exemplo, em vez de apenas dobrar uma molécula ou calcular uma propriedade, ele pode fornecer um relatório abrangente contendo estruturas ou propriedades dobradas, equipando os usuários com todas as informações necessárias para tomar decisões informadas sobre a viabilidade de uma solução. Também pode mostrar relações entre estruturas de proteínas graficamente e suas conexões, ajudando ainda mais na compreensão de interações moleculares complexas."

Além de uma plataforma poderosa, a equipe única de especialistas dos Serviços Empresariais NVIDIA foi inestimável. "Nós aproveitamos o suporte de ponta a ponta da NVIDIA, que vai desde assistência de plataforma para configuração de treinamento de vários nós e atualizações de contêiner até orientação em nível de aplicação, aproveitando sua ampla experiência em frameworks e modelos da área de saúde para otimizar nossos modelos de IA de forma eficaz", disse Ferrante.

"Ao nos permitir executar facilmente mais experimentos simultâneos em comparação com nossa solução anterior com grande visibilidade na fila de trabalhos, o DGX Cloud aumentou a produtividade do desenvolvedor em 50%."

Dan Ferrante
Líder de IA para Inovação e P&D, Deloitte Consulting LLP

"Com o DGX Cloud, o treinamento de vários nós agora é tão fácil quanto clicar em um botão, economizando de sete a 10 meses de trabalho de infraestrutura e ferramentas... Nossos treinamentos foram reduzidos de quatro semanas para apenas oito horas."

Dan Ferrante
Líder de IA para Inovação e P&D, Deloitte Consulting LLP

Olhando Adiante

"Uma das aplicações diretas da Atlas AI foi a capacidade de usarmos IA para tomar medicamentos aprovados pela FDA e projetar in silico uma versão melhor e patenteável da molécula. Agora podemos carregar todos os medicamentos que foram patenteados e todos os que foram aprovados pelo FDA. Nosso modelo treinado nos permite identificar potenciais compostos de partida com ligação de alvo estabelecida. Encontrar fármacos viáveis é extremamente desafiador devido ao grande número de compostos potenciais e à necessidade de propriedades específicas, tornando-se semelhante à solução de um complexo problema de otimização. MolMIM, parte da NVIDIA BioNeMo e disponível como um microsserviço NIM, ajuda nossos pesquisadores a encontrar moléculas com as propriedades ideais para o desenvolvimento de medicamentos, maximizando uma função de pontuação definida pelo usuário. Usando MolMIM, geramos novos compostos, que são otimizados para vários aspectos moleculares, como ligação aprimorada, permeabilidade intestinal, solubilidade e meia-vida prolongada", acrescentou Ferrante.

A Deloitte planeja aprimorar ainda mais a IA do Atlas, integrando-a a várias aplicações da área da saúde e ciências da vida, como medicina de precisão e percepção de voz do paciente, para melhorar o envolvimento do paciente e otimizar os resultados da área da saúde. "Aproveitando o BioNeMo e o DGX Cloud, podemos estabelecer perfeitamente um pipeline de treinamento padronizado para diversos domínios, permitindo-nos ajustá-lo para classes específicas de proteínas ou previsões de estrutura de anticorpos sem esforço", disse Ferrante.

O MolMIM realiza a geração controlada para encontrar moléculas com as propriedades certas.

"Aproveitando o BioNeMo e o DGX Cloud, podemos estabelecer perfeitamente um pipeline de treinamento padronizado para diversos domínios, permitindo-nos ajustá-lo para classes específicas de proteínas ou previsões de estrutura de anticorpos sem esforço."

Dan Ferrante
Líder de IA para Inovação e P&D da Deloitte Consulting LLP

Resultados

 
  • Maior produtividade do desenvolvedor em 50%
  • Economia de 7 a 10 meses eliminando a configuração manual para treinamento de vários nós
  • Treinamento reduzido de quatro semanas para oito horas
  • Redução do tempo de desenvolvimento do pipeline de descoberta de medicamentos de 4 a 6 semanas para apenas alguns cliques

O lugar mais rápido para começar a construir aplicações de IA generativa é na DGX Cloud, uma plataforma de IA para desenvolvedores.