Sanidad y biociencias

Deloitte construye canales de descubrimiento de fármacos mediante IA generativa en unos pocos clics

Objetivo

NVIDIA DGX™ Cloud en Oracle Cloud Infrastructure (OCI) permite a Deloitte acelerar el descubrimiento de fármacos en su solución Quartz Atlas AI con IA generativa. Usan gráficos de conocimiento con modelos lingüísticos de gran tamaño (LLM), canales científicos con NVIDIA BioNeMo™, modelos personalizados e incluso entrenan sus propios modelos de lenguaje químico (CLM) y modelos de lenguaje de proteínas (PLM) antes de implementarlos a escala con microservicios de inferencia NVIDIA NIM.

Cliente

Deloitte Consulting LLP

Caso de uso

IA generativa/LLM

Productos

NVIDIA DGX Cloud
NVIDIA BioNeMo
NVIDIA AI Enterprise
NVIDIA NIM

Aceleración de avances médicos mediante la innovación en IA

Como motor de investigación del principal proveedor de servicios de consultoría del mundo1, el Centro de investigación integrada de Deloitte se dedica a explorar oportunidades transformativas en todos los sectores. Con un fuerte énfasis en la sanidad, el equipo de investigación se propuso aprovechar el potencial de la IA para acelerar el proceso de descubrimiento de fármacos. El descubrimiento de fármacos es un proceso largo y costoso, que lleva entre 10 y 15 años y cuesta, en promedio, entre 1000 y 2000 millones de dólares por cada nuevo fármaco aprobado para uso clínico. Dichos costes van acompañados de una tasa de fracaso desalentadora, del 90 por ciento2. Ante esto, el equipo de Deloitte reconoció la necesidad de usar modelos preclínicos mejorados, validación rigurosa de objetivos y estrategias mejoradas de toma de decisiones, antes de embarcarse en ensayos clínicos. Su objetivo era reducir significativamente la tasa de ensayos fallidos, mejorando en última instancia el camino del desarrollo de fármacos. 1 Deloitte. Deloitte ocupa el puesto n.º

1 Deloitte ocupa el puesto número 1 a nivel mundial como proveedor de servicios de consultoría por ingresos en el Informe de participación de mercado de Gartner®. Julio de 2023.

2 NIH National Library of Medicine: Why 90% of Clinical Drug Development Fails and How to Improve It?, julio de 2022.

Quartz Atlas AI representa visualmente las conexiones entre la proteína alergénica del abedul, Bet-v-1, y las entidades asociadas. Estas conexiones tienen su origen tanto en experimentos de laboratorio como en enlaces generados por LLM procedentes de PLM o CLM. La integración de datos experimentales con modelos del mundo aprendido, procedentes de PLM y CLM, enriquece la comprensión de los científicos al proporcionar un contexto multimodal.

Desentrañar información de grandes conjuntos de datos multimodales y multidominio

Llevar a un candidato de fármaco a los ensayos clínicos de fase I es todo un hito para cualquier empresa farmacéutica. Sin embargo, nueve de cada diez candidatos fracasan en las fases posteriores, incluidos los ensayos de fase I, II y III, lo que refleja los retos del descubrimiento de fármacos. Este complejo proceso comienza con la identificación de los objetivos relacionados con las enfermedades, el cribado de compuestos para determinar su eficacia, la optimización de compuestos principales para su seguridad y eficacia, la realización de pruebas preclínicas y el progreso de los candidatos exitosos a través de los ensayos clínicos. La integración de datos en este proceso es un desafío importante, desde la integración de las diversas fuentes de datos biológicos en la identificación de objetivos hasta el análisis de conjuntos de datos masivos en la detección. Al reconocer la importancia de la integración de los datos en el descubrimiento de fármacos mediante IA, Deloitte buscó utilizar la IA generativa para agilizar el proceso, con el objetivo de ahorrar tiempo y costes.

«Como investigadores, a menudo trabajamos con datos multimodales, desde texto a gráficos e imágenes, que abarcan diversos dominios de la ciencia. Leemos patentes y exploramos documentos de investigación en busca de información sobre anticuerpos para comprender las relaciones entre moléculas», cuenta Dan Ferrante, líder de IA para innovación e I+D en Deloitte Consulting LLP. «Queríamos armonizar estos datos fragmentados multimodales provenientes de docenas de conjuntos de datos de código abierto, entre ellos versiones de archivos como PubMed, el conjunto de datos de Uniprot para proteínas, conjuntos de datos de anticuerpos, conjuntos de datos de pequeñas moléculas, etc. Estos recursos juegan un papel esencial en la toma diaria de decisiones referentes a pequeñas moléculas y biología. El reto no era solo ingerir estos grandes volúmenes de datos en modelos avanzados de deep learning, sino también entrenarlos en modelos lingüísticos de gran tamaño personalizados, tanto para proteínas como para quimioinformática, para analizar y aprender patrones de cara a realizar predicciones acertadas. Esta investigación requería una robusta infraestructura informática de IA y una pila de software altamente optimizada».

 
  • La ejecución de experimentos en DGX Cloud aumentó la productividad de los desarrolladores en un 50 por ciento, mientras que la racionalización del entrenamiento multinodo ahorró de 7 a 10 meses de tiempo de configuración.
  • Con BioNeMo de NVIDIA AI Enterprise y DGX Cloud, el trabajo de construcción de un canal que antes tardaba de 4 a 6 semanas ahora se puede lograr con solo unos pocos clics, lo que permite a los investigadores sumergirse directamente en los proyectos.

Quartz Atlas AI muestra un gráfico de conocimiento interactivo que proporciona niveles profundos de enriquecimiento semántico habilitado por IA generativa (LLM, pLM, cLM, etc.) en datos multimodales a través de conexiones y relaciones entre puntos de datos.

Experimentación rápida con una plataforma escalable y modelos de IA generativa personalizables

La predicción de estructuras de proteínas tiene como objetivo anticipar cómo se plegará una proteína en su forma natural, crucial para comprender su función en el cuerpo e identificar posibles objetivos para terapias con fármacos. Deloitte ha desarrollado Quartz Atlas AI, un acelerador de descubrimiento de fármacos mediante IA que analiza secuencias de aminoácidos (los bloques de construcción de las proteínas) para determinar el mejor método de plegado, que se puede dar ya sea mediante un modelo de lenguaje de proteínas o mediante un método de estilo de plegado. Este proceso genera rápidamente estructuras 3D y predice cómo se vincularán los fármacos a partes concretas de la proteína. Un modelo de IA generativa hacia abajo refina aún más la estructura de la proteína o molécula para identificar regiones que es probable vayan a interactuar con los fármacos (superponiendo un mapa de calor de puntos de acceso farmacológicos), contribuyendo al desarrollo de los fármacos.

«Para juntar con éxito los datos y procesos científicos combinamos los microservicios BioNeMo de NVIDIA para la predicción de estructuras optimizada y los modelos de IA generativa patentados por Deloitte, que se entrenan con DGX Cloud en Oracle Cloud Infrastructure», explica Ferrante. «Creamos un robusto gráfico de conocimiento mediante IA generativa con Atlas AI, cargando más de una docena de conjuntos de datos, hasta 12 millones de nodos y 97 millones de enlaces de conexión perimetrales, con un total de 5 terabytes brutos, en los que se puede buscar en cuestión de segundos. Podemos alimentar nuestros modelos con esta gran cantidad de datos multimodales, mapear el espacio de soluciones y analizar patrones y hacer predicciones. La capacidad de entrenar con conjuntos de datos extensos y escalar eficientemente fue posible al aprovechar DGX Cloud y su capacidad para facilitar los trabajos multinodo. DGX Cloud en OCI nos proporcionó acceso a la arquitectura más reciente de NVIDIA y el tejido de baja latencia que permitió el escalado de cargas de trabajo en clústeres interconectados optimizados para el máximo rendimiento en nuestras cargas de trabajo más exigentes»

.

Deloitte utiliza modelos NVIDIA BioNeM, disponibles como microservicios NVIDIA NIM, entre ellos AlphaFold2, OpenFold y ESMFold para la predicción de estructuras de proteínas, junto con MegaMolBart y MolMIM para generación de moléculas. Al mapear racionalmente estas moléculas en el espacio de la solución, se pueden encontrar fácilmente moléculas similares con propiedades correspondientes, como la toxicidad o la solubilidad. Este meticuloso proceso es crucial para el descubrimiento de fármacos y facilita la selección eficiente de candidatos potenciales, la predicción exacta de seguridad y eficacia y la exploración de diversos espacios químicos. Para obtener más ideas, Deloitte ajustó un modelo ESM2 de 15 000 millones de parámetros para precedir propiedades de proteíans en DX Cloud, que un modelo hacia abajo utilizó para generar secuencias de nuevas proteínas con propiedades deseadas concretas.

El marco NVIDIA BioNeMo optimiza las proteínas para entrenamiento

El marco NVIDIA BioNeMo ofrece arquitecturas de modelos optimizadas y herramientas para el entrenamiento de LLM de proteínas y pequeñas moléculas.

Un aumento en la productividad de los desarrolladores, junto con el tamaño y escala del modelo sin restricciones

Ferrante comentó: «En el campo de la biología , muchos profesionales no quieren lidiar con las complejidades de la infraestructura y escribir código. Sin embargo, aprovechar las herramientas y el software de DGX Cloud ha simplificado este proceso. Con solo unos pocos clics, nuestros desarrolladores pueden seleccionar un contenedor y acceder a un cuaderno, eliminando la necesidad de usar SSH directamente en los nodos. Al permitirnos lanzar fácilmente múltiples experimentos a la cola de trabajos en comparación con nuestra solución anterior, con gran visibilidad, DGX Cloud ha aumentado la productividad de los desarrolladores en aproximadamente un 50 por ciento»

.

«Debido a la escala de nuestros conjuntos de datos, el entrenamiento multinodo era esencial. Anteriormente, la orquestación del entrenamiento multinodo era un proceso manual, y nunca lo habíamos intentado en una plataforma de nube. Con DGX Cloud, el entrenamiento multinodo es ahora tan sencillo como hacer clic en un botón, lo que nos ahorra entre siete y diez meses de trabajos de infraestructura y herramientas que incluían configuración de hardware, creación de contenedores y distribución de cargas de trabajo. El resultado es que nuestros modelos ya no están restringidos por tamaño o escala de datos y nuestros lanzamientos de entrenamiento se han reducido de cuatro semanas a solo ocho horas»

.

«Anteriormente, la construcción del canal de descubrimiento de fármacos era un proceso laborioso, que nos obligaba a realizar ingeniería inversa y depurar todas las líneas de código, además de realizar seguimiento y mantener varias versiones. Solía llevarnos entre cuatro y seis semanas construir un canal, pero ahora, con solo unos pocos clics podemos sumergirnos directamente en los proyectos. Gracias a la escalabilidad de los modelos BioNeMo y la facilidad de implementación mediante NVIDIA NIM, las tareas de I+D son mucho más sencillas. El ajuste de los modelos básicos de BioNeMo en DGX Cloud y la implementación de un bucle de inferencia han fortalecido aún más la robustez del canal», explica Ferrante.

«Con Atlas AI, Deloitte puede ofrecer a los usuarios canales científicos para obtener ideas accionables combinando varias moléculas juntas. Por ejemplo, en lugar de doblar una molécula o calcular una propiedad, puede ofrecer un informe exhaustivo con estructuras dobladas o propiedades, dotando a los usuarios de toda la información necesaria para tomar decisiones informadas sobre la viabilidad de una solución. También puede mostrar gráficamente las relaciones entre estructuras de proteínas y sus conexiones, ayudando aún más a comprender las intereacciones moleculares complejas»

.

Más allá de la potente plataforma, el equipo de expertos de NVIDIA Enterprise Solutions resulta valiosísimo. «Aprovechamos la asistencia integral de NVIDIA, que va desde la asistencia de la plataforma, de cara a la configuración del aprendizaje multinodo y las actualizaciones de contenedores a tutoriales en el ámbito de las aplicaciones, aprovechando su amplia experiencia en marcos y modelos sanitarios para optimizar nuestros modelos de IA de forma efectiva», cuenta Ferrante.

«Al permitirnos ejecutar fácilmente más experimentos simultáneos en comparación con nuestra solución anterior, con una gran visibilidad de la cola de trabajos, DGX Cloud ha aumentado la productividad de los desarrolladores en un 50 por ciento».

Dan Ferrante,
líder de IA en innovación e I+D, Deloitte Consulting LLP

«Con DGX Cloud, el entrenamiento con varios nodos ahora es tan fácil como hacer clic en un botón, lo que nos ahorra de siete a diez meses de trabajo de infraestructura y herramientas… Nuestras sesiones de entrenamiento se han reducido de cuatro semanas a tan solo ocho horas».

Dan Ferrante,
líder de IA en innovación e I+D, Deloitte Consulting LLP

De cara al futuro

«Una de las aplicaciones directas de Atlas AI fue la capacidad que nos ofrece de utilizar la IA para tomar fármacos aprobados por la FDA y patentar una versión mejor de la molécula, diseñada por computadora. Ahora podemos cargar todos los fármacos patentados, además de todos los aprobados por la FDA. Nuestro modelo entrenado nos permite identificar posibles compuestos de partida vinculados a objetivos establecidos. Encontrar fármacos viables es extremadamente desafiante debido a la gran cantidad de compuestos potenciales y la necesidad de propiedades específicas, lo que lo convierte en un problema de optimización complejo. MolMIM, parte de NVIDIA BioNeMo y disponible como microservicio NIM, ayuda a nuestros investigadores a encontrar moléculas con las propiedades ideales para el desarrollo de fármacos, maximizando una función de puntuación definida por el usuario. Con MolMIM, generamos compuestos novedosos, que están optimizados para varios aspectos moleculares, como la unión mejorada, la permeabilidad intestinal, la solubilidad y la vida media prolongada», añade Ferrante.

Deloitte planea mejorar aún más Atlas AI, integrándolo en varias aplicaciones de salud y ciencias de la vida, como información de medicina de precisión y voz del paciente, para mejorar la participación del paciente y optimizar los resultados sanitarios. «Aprovechando BioNeMo y DGX Cloud, podemos establecer sin problemas un proceso de entrenamiento estandarizado para diversos dominios, lo que nos permite ajustarlo para clases de proteínas específicas o predicciones de estructuras de anticuerpos sin esfuerzo», asegura Ferrante.

MolMIM realiza generación controlada para descubrir moléculas con las propiedades adecuadas.

«Al aprovechar BioNeMo y DGX Cloud, podemos establecer sin problemas un proceso de entrenamiento estandarizado para diversos dominios, lo que nos permite ajustarlo para clases de proteínas específicas o predicciones de estructuras de anticuerpos sin esfuerzo».

Dan Ferrante,
líder de IA en innovación e I+D, Deloitte Consulting LLP

Resultados

  • Mejora de la productividad de los desarrolladores en un 50 por ciento
  • Ahorro de 7 a 10 meses al eliminar la configuración manual para el entrenamiento multinodo
  • Se redujo el entrenamiento de cuatro semanas a ocho horas
  • Se redujo el tiempo de desarrollo del proceso de descubrimiento de fármacos, de entre 4 a 6 semanas, a solo unos pocos clics

El lugar más rápido para comenzar a crear aplicaciones de IA generativa es DGX Cloud, una plataforma de IA para desarrolladores.