Gesundheitswesen und Biowissenschaften

Deloitte baut Pipelines für die Pharmaforschung mit generativer KI in wenigen Klicks

Zielsetzung

Mit

NVIDIA DGX™ Cloud auf der Oracle Cloud Infrastructure (OCI) kann Deloitte die Pharmaforschung in seiner Quartz Atlas KI-Lösung mit generativer KI beschleunigen. Sie verwenden LLM-basierte Wissensgraphen, wissenschaftliche Pipelines mit NVIDIA BioNeMoTM, benutzerdefinierte Modelle und trainieren sogar ihre eigenen CLMs (Chemistry Language Models) und Protein-Sprachmodelle (PLMs), bevor sie nahtlos mit NVIDIA NIM Inferenz-Microservices in großem Maßstab bereitstellen.

Kunde

Deloitte Consulting LLP

Anwendungsfall

Generative KI/LLMs

Produkte

NVIDIA DGX Cloud
NVIDIA BioNeMo
NVIDIA AI Enterprise
NVIDIA NIM

Beschleunigung medizinischer Durchbrüche durch KI-Innovation

Als Forschungskraftwerk des weltweit führenden Beratungsdienstleisters1 widmet sich das Center for Integrated Research von Deloitte der Erforschung von transformativen Möglichkeiten in allen Branchen. Mit einem starken Schwerpunkt auf dem Gesundheitswesen hat sich das Forschungsteam vorgenommen, das Potenzial der KI zur Beschleunigung des Wirkstoffforschungsprozesses zu nutzen. Die Wirkstoffforschung ist ein langwieriger und kostspieliger Prozess, der 10–15 Jahre dauert und im Durchschnitt über 1–2 Milliarden US-Dollar für jedes neue Medikament kostet, das für den klinischen Einsatz zugelassen wird. Diese Kosten gehen mit einer erschreckenden 90-prozentigen Fehlerquote einher2 . Angesichts dessen erkannte das Team von Deloitte, dass verbesserte präklinische Modelle, eine rigorose Zielvalidierung und verbesserte Entscheidungsstrategien erforderlich sind, bevor klinische Studien in Angriff genommen werden. Ziel war es, die Quote erfolgloser Studien deutlich zu senken und letztendlich die Entwicklungsphase von Medikamenten zu verbessern.

1 Deloitte. Deloitte ist laut Gartner® Market Share Report weltweit die Nummer 1 unter den Beratungsdienstleistern nach Umsatz. Juli 2023.

2 NIH National Library of Medicine. Warum die Entwicklung klinischer Medikamente in 90 % aller Fälle scheitert und wie man diese Quote verbessern kann. Juli 2022.

Quartz Atlas AI stellt die Verbindungen zwischen dem Bet-v-1 Birkenallergenprotein und den zugehörigen Entitäten visuell dar. Diese Verbindungen stammen sowohl von Wet-Lab-Experimenten als auch von LLM-generierten Links, die von PLMs oder CLMs stammen. Die Integration von experimentellen Daten mit Modellen der erlernten Welt von PLMs und CLMs bereichert das Verständnis der Wissenschaftler durch die Bereitstellung eines multimodalen Kontexts.

Erkenntnisse aus umfangreichen multimodalen und domainübergreifenden Datensätzen

Der Übergang eines Wirkstoffkandidaten in klinische Studien der Phase I ist ein bedeutender Meilenstein für Pharmaunternehmen. Neun von zehn Kandidaten scheitern jedoch in den nachfolgenden Phasen, einschließlich Studien der Phase I, II und III, worin sich die Herausforderungen der Pharmaforschung spiegeln. Die komplexe Pipeline beginnt mit der Bestimmung krankheitsbezogener Ziele, dem Screening von Substanzen auf Wirksamkeit, der Optimierung von Leitpräparaten auf Sicherheit und Wirksamkeit, der Durchführung präklinischer Tests und der Weiterführung erfolgreicher Kandidaten durch klinische Studien. Die Integration von Daten in diesen Prozess ist eine große Herausforderung, von der Integration verschiedener biologischer Datenquellen in die Zielbestimmung bis hin zur Analyse massiver Datensätze im Screening. Deloitte hatte die Bedeutung der Datenintegration in der KI-gestützten Pharmaforschung erkannt und strebte eine Optimierung des Prozesses mit generativer KI an, um Zeit und Kosten zu sparen.

„Als Forscher beschäftigen wir uns oft mit multimodalen Daten, von Text zu Graphen und Bildern, die verschiedene wissenschaftliche Bereiche umfassen. Wir lesen Patente und durchsuchen Forschungsarbeiten, um Informationen über Antikörper zu erhalten und die Beziehungen zwischen Molekülen zu verstehen“, sagte Dan Ferrante, KI-Leiter für Innovation und F&E Deloitte Consulting LLP. „Wir wollten diese fragmentierten multimodalen Daten aus Dutzenden von Open-Source-Datensätzen harmonisieren, einschließlich Versionen von Archiven wie PubMed, dem Uniprot-Datensatz für Proteine, Antikörperdatensätze, Datensätze für kleine Moleküle usw. Diese Ressourcen spielen eine entscheidende Rolle bei der täglichen Entscheidungsfindung in Bezug auf Biologie und kleine Moleküle. Die Herausforderung bestand darin, diese großen Datenmengen nicht nur in fortschrittliche Deep-Learning-Modelle einzugeben, sondern sie auch auf benutzerdefinierten großen Sprachmodellen für Protein und Chemoinformatik zu trainieren, um Muster für genaue Vorhersagen zu analysieren und zu erkennen. Diese Forschung erforderte eine robuste KI-Recheninfrastruktur und einen hochoptimierten Software-Stack.“

 
  • Die Durchführung von Experimenten auf DGX Cloud konnte die Produktivität der Entwickler um 50 Prozent steigern, während die Optimierung des Trainings mit mehreren Knoten 7 bis 10 Monate Einrichtungszeit eingespart hat.
  • Mit BioNeMo von NVIDIA AI Enterprise und DGX Cloud kann die Arbeit zum Zusammenstellen einer Pipeline, die früher 4–6 Wochen dauerte, jetzt mit nur wenigen Klicks erledigt werden, sodass Forscher direkt in Projekte eintauchen können.

Quartz Atlas AI zeigt einen interaktiven Wissensgraph, der eine tiefe GenAI-fähige semantische Anreicherung (LLMs, pLMs, cLMs, etc.) auf multimodalen Daten durch Verbindungen und Beziehungen zwischen Datenpunkten bietet.

Schnelles Experimentieren mit einer skalierbaren Plattform und anpassbaren generativen KI-Modellen

Die Proteinstrukturvorhersage zielt darauf ab, vorherzusehen, wie sich ein Protein in seine natürliche Form faltet. Dies ist entscheidend für das Verständnis seiner Funktion im Körper und die Bestimmung potenzieller Ziele für Arzneimitteltherapien. Deloitte hat Quartz Atlas AI entwickelt, einen KI-Beschleuniger in der Wirkstofferforschung, der Aminosäuresequenzen (die Bausteine von Proteinen) analysiert, um die beste Faltungsmethode zu bestimmen, die entweder durch ein Proteinsprachmodell oder eine Faltstilmethode gegeben sein kann. Dieser Prozess erzeugt schnell 3D-Strukturen und prognostiziert, wie sich Medikamente an bestimmte Teile des Proteins anbinden können. Ein nachgelagertes generatives KI-Modell verfeinert die Struktur des Proteins oder Moleküls, um Regionen darin zu lokalisieren, die wahrscheinlich mit Medikamenten interagieren (Überlagerung einer Heatmap von medikamentenfähigen Hotspots) – dies unterstützt die Wirkstoffentwicklung.

„Um Daten und wissenschaftliche Pipelines erfolgreich zusammenzuführen, haben wir die BioNeMo-Microservices von NVIDIA für optimierte Strukturvorhersage und die proprietären generativen KI-Modelle von Deloitte, die mit DGX Cloud auf Oracle Cloud Infrastructure trainiert werden, kombiniert“, sagte Ferrante. „Wir haben einen robusten, durch generative KI gestützten Wissensgraph mit Atlas AI erstellt und dabei über ein Dutzend Datensätze geladen, die 12 Millionen Knoten und 97 Millionen Verbindungs-Edge-Links mit insgesamt 5 Terabyte Rohvolumen umfassen und innerhalb von Sekunden durchsuchbar sind. Wir können diese große Menge an multimodalen Daten in unsere Modelle einspeisen, den Lösungsraum kartieren, Muster analysieren und Vorhersagen treffen. Die Fähigkeit, mit umfangreichen Datensätzen zu trainieren und effizient zu skalieren wurde durch die Nutzung von DGX Cloud und deren Fähigkeit, Aufträge mit mehreren Knoten zu vereinfachen, ermöglicht. DGX Cloud auf OCI bot uns Zugang zur neuesten NVIDIA-Architektur und einer latenzarmen Fabric, die die Skalierung von Workloads in miteinander verbundenen Clustern ermöglichten, die für Spitzenleistung bei unseren anspruchsvollsten Workloads optimiert sind.“

Deloitte verwendet NVIDIA BioNeMo-Modelle, die als NVIDIA NIM-Microservices wie AlphaFold2, OpenFold, und ESMFold für die Proteinstrukturvorhersage neben MegaMolBART und MolMIM für die Molekülgenerierung verfügbar sind. Durch die nahtlose Abbildung dieser Moleküle in den Lösungsraum können sie ähnliche Moleküle mit entsprechenden Eigenschaften wie Toxizität oder Löslichkeit leicht finden. Dieser akribische Prozess ist für die Pharmaforschung von entscheidender Bedeutung. Er erleichtert die effiziente Auswahl potenzieller Kandidaten, die genaue Vorhersage von Sicherheit und Wirksamkeit und die Erforschung verschiedener chemischer Räume. Um weitere Erkenntnisse zu gewinnen, hat Deloitte ein 15-Milliarden-Parameter-ESM2-Modell für die Vorhersage von Proteineigenschaften auf DGX Cloud feinabgestimmt, das von einem nachgeschalteten Modell genutzt wurde, um neuartige Proteinsequenzen mit spezifischen gewünschten Eigenschaften zu generieren.

NVIDIA BioNeMo Framework optimiert Trainingsprotein

Das NVIDIA BioNeMo Framework bietet optimierte Modellarchitekturen und Werkzeuge für das Training von Proteinen und LLMs mit kleinen Molekülen.

Steigerung der Entwicklerproduktivität, neben uneingeschränkter Modellgröße und -skalierung

Ferrante bemerkte: „Viele Fachleute im Biologiebereich wollen sich nicht mit den Feinheiten der Infrastruktur und dem Schreiben von Code befassen. Die Nutzung der Tools und Software in DGX Cloud hat diesen Prozess jedoch rationalisiert. Mit nur wenigen Klicks können unsere Entwickler einen Container auswählen und auf ein Notebook zugreifen, wodurch die Notwendigkeit, die Shell direkt in die Knoten zu sichern, entfällt. Dadurch, dass wir im Vergleich zu unserer vorherigen Lösung einfach mehrere Experimente mit großer Sichtbarkeit in die Auftragswarteschlange durchführen können, hat DGX Cloud die Produktivität der Entwickler um 50 Prozent gesteigert.“

„Aufgrund der Größe unserer Datensätze war das Training mit mehreren Knoten von entscheidender Bedeutung. Früher war die Orchestrierung des Trainings mit mehreren Knoten ein manueller Prozess, und wir hatten es noch nie auf einer Cloud-Plattform versucht. Mit DGX Cloud ist das Training mit mehreren Knoten jetzt so einfach wie ein Knopfdruck, was uns sieben bis zehn Monate Infrastruktur- und Tooling-Arbeit, die Hardware-Setup, Containererstellung und Workload-Verteilung einschlossen, erspart. Dadurch sind unsere Modelle nicht mehr durch Größe oder Datenumfang eingeschränkt, und unsere Trainingsläufe wurden von vier Wochen auf nur acht Stunden reduziert.“

„Früher war die Entwicklung der Pipeline für die Pharmaforschung ein mühsamer Prozess, der uns gezwungen hat, jede Codezeile sorgfältig zurückzuentwickeln und zu debuggen, während wir Änderungen verfolgten und mehrere Versionen verwalteten. Die Erstellung der Pipeline dauerte vier bis sechs Wochen, aber jetzt können wir mit wenigen Klicks direkt in Projekte einsteigen. Dank der Skalierbarkeit von BioNeMo-Modellen und der einfachen Bereitstellung durch NVIDIA NIM sind F&E-Aufgaben viel reibungsloser geworden. Die Feinabstimmung von Grundlagenmodellen von BioNeMo in der DGX Cloud und die Implementierung einer Inferenzschleife haben die Robustheit der Pipeline weiter gestärkt“, sagte Ferrante. „Mit Atlas AI kann Deloitte Benutzern wissenschaftliche Pipelines bereitstellen, um durch die Kombination mehrerer Modelle umsetzbare Erkenntnisse zu erhalten. Anstatt ein Molekül zu falten oder eine Eigenschaft zu berechnen, kann sie einen umfassenden Bericht mit gefalteten Strukturen oder Eigenschaften bereitstellen, der dem Benutzer alle Informationen gibt, die für fundierte Entscheidungen über die Machbarkeit einer Lösung erforderlich sind. Es kann auch Beziehungen zwischen Proteinstrukturen und ihren Verbindungen grafisch anzeigen, was das Verständnis komplexer molekularer Wechselwirkungen erleichtert.“

Über eine leistungsstarke Plattform hinaus war das One-Stop-Expertenteam von NVIDIA Enterprise Services von unschätzbarem Wert.

„Wir haben vom End-to-End-Support von NVIDIA profitiert, der von der Plattformunterstützung für die Einrichtung des Trainings mit mehreren Knoten und die Aktualisierung von Containern bis hin zu Beratung auf Anwendungsebene reicht, und ihr umfangreiches Fachwissen über Frameworks und Modelle im Gesundheitswesen einbringt, um unsere KI-Modelle effektiv zu optimieren“, sagte Ferrante.

„Dadurch, dass wir im Vergleich zu unserer vorherigen Lösung einfach mehrere Experimente mit großer Sichtbarkeit in die Auftragswarteschlange durchführen können, hat DGX Cloud die Produktivität der Entwickler um 50 Prozent gesteigert.“

Dan Ferrante
KI-Leiter für Innovation und F&E Deloitte Consulting LLP

„Mit DGX Cloud ist das Training mit mehreren Knoten jetzt so leicht wie ein Knopfdruck, was uns sieben bis zehn Monate an Infrastruktur- und Tooling-Arbeit erspart ... Unser Trainingslauf wurde von vier Wochen auf nur acht Stunden reduziert.“

Dan Ferrante
KI-Leiter für Innovation und F&E Deloitte Consulting LLP

Blick nach vorn

„Eine der direkten Anwendungen von Atlas AI war die Möglichkeit, KI zu nutzen, um Medikamente zu nehmen, die von der FDA zugelassen sind, und eine bessere, patentierbare Version des Moleküls in silico zu entwickeln. Wir sind jetzt in der Lage, alle patentierten und von der FDA zugelassenen Medikamente zu laden. Unser trainiertes Modell ermöglicht es uns, potenzielle Ausgangsverbindungen mit etablierter Zielbindung zu identifizieren. Das Finden brauchbarer Medikamente ist aufgrund der großen Anzahl potenzieller Verbindungen und der Notwendigkeit spezifischer Eigenschaften äußerst schwierig und ähnelt der Lösung eines komplexen Optimierungsproblems. MolMIM, Teil von NVIDIA BioNeMo und verfügbar als NIM-Mikroservice, hilft unseren Forschern, Moleküle mit den idealen Eigenschaften für die Pharmaforschung zu finden, indem sie eine benutzerdefinierte Scoring-Funktion maximieren. Mit MolMIM generieren wir neuartige Verbindungen, die für verschiedene molekulare Aspekte wie verbesserte Bindung, Darmpermeabilität, Löslichkeit und verlängerte Halbwertszeit optimiert sind“, fügte Ferrante hinzu.

Deloitte plant, Atlas AI durch die Integrierung in verschiedene Anwendungen im Gesundheitswesen und der Biowissenschaften weiter zu verbessern, wie z. B. Präzisionsmedizin und Erkenntnisse aus Patientenmeinungen, um die Patientenbindung zu verbessern und die gesundheitlichen Ergebnisse zu optimieren. „Durch die Nutzung von BioNeMo und DGX Cloud können wir nahtlos eine standardisierte Trainingspipeline für verschiedene Bereiche aufbauen, mit der wir mühelos bestimmte Proteinklassen oder Antikörperstrukturvorhersagen verfeinern können“, sagte Ferrante.

MolMIM führt kontrollierte Generierung durch, um Moleküle mit den richtigen Eigenschaften zu finden.

„Mit BioNeMo und DGX Cloud können wir eine standardisierte Trainings-Pipeline für verschiedene Bereiche nahtlos aufbauen, sodass wir sie mühelos für spezifische Proteinklassen oder Antikörperstrukturvorhersagen optimieren können.“

Dan Ferrante
KI-Leiter für Innovation und F&E Deloitte Consulting LLP

Ergebnisse

  • Verbesserte Produktivität der Entwickler um 50 Prozent
  • Einsparung von 7 bis 10 Monaten durch den Verzicht auf manuelle Einrichtung für Training mit mehreren Knoten
  • Reduziertes Training von vier Wochen auf acht Stunden
  • Reduzierte Entwicklungszeit der Pipeline für die Pharmaforschung von 4–6 Wochen auf nur wenige Klicks

Der schnellste Ort, um mit der Erstellung generativer KI-Anwendungen zu beginnen, ist DGX Cloud, eine KI-Plattform für Entwickler.