Área de la Salud y Ciencias Biológicas

Descubriendo los Misterios de las Firmas Mutacionales del Cáncer con las Soluciones Aceleradas de NVIDIA

Objectivo

Sanger Institute utiliza el servidor NVIDIA DGX para impulsar su proceso de análisis de firmas de cáncer mutacional, mejorando el rendimiento 30 veces.

Cliente

Sanger Institute

Caso de Uso

Mejora del Rendimiento

Tecnología

Servidor NVIDIA DGX-1™, NVIDIA® NVLink®

La Necesidad de Comprender Mejor las Firmas Mutacionales del Cáncer

El cáncer es causado por un daño al ADN de las células conocido como mutaciones somáticas. Este daño puede ser el resultado de comportamientos como fumar y beber alcohol, así como de factores ambientales como la luz ultravioleta y la exposición a la radiación.

El daño al ADN ocurre en patrones específicos conocidos como "firmas mutacionales", que son exclusivos del factor que causó el daño. Por ejemplo, aunque el tabaco y la radiación ultravioleta causan cáncer al producir mutaciones, la firma causada por fumar tabaco se encuentra en el cáncer de pulmón, mientras que la firma de la exposición a la luz ultravioleta se encuentra en el cáncer de piel.

Se han identificado muchas firmas mutacionales asociadas al cáncer, pero sólo alrededor de la mitad de ellas tienen causas conocidas. En los últimos años, el análisis del ADN de los cánceres ha permitido descubrir más de noventa firmas mutacionales diferentes. Sin embargo, aún se desconocen las causas ambientales, de estilo de vida, genéticas u otras posibles causas de muchas de estas firmas mutacionales.

Como parte del equipo Cancer Grand Challenges Mutographs financiado por Cancer Research UK (CRUK), el Wellcome Sanger Institute, uno de los principales centros de descubrimiento y comprensión genómica del mundo, está utilizando modelos de machine learning acelerados por GPU NVIDIA para ayudar a comprender cómo los cambios naturales en el ADN afectan el cáncer.

El objetivo del componente computacional del proyecto es dilucidar las causas de las principales diferencias geográficas y temporales globales en la incidencia de cáncer a través del estudio de firmas mutacionales. La identificación de un conjunto más amplio de firmas mutacionales contribuirá en gran medida a comprender las correlaciones entre ellas y sus causas, lo que en última instancia conducirá a tratamientos contra el cáncer más precisos.

lungs

Investigadora del Wellcome Sanger Institute realiza secuenciación de ADN. Imagen cortesía del Wellcome Sanger Institute.

OSCC-map

Los casos de carcinoma de células escamosas de esófago varían mucho en todo el mundo. Imagen cortesía del proyecto Mutographs. Fuente de datos: GLOBOCAN 2012.

Descifrando el Código con Computación Acelerada por GPU

Este trabajo requiere la solución de un problema de machine learning computacionalmente intensivo conocido como factorización matricial no negativa (NMF). Ludmil Alexandrov desarrolló el enfoque para detectar firmas de mutaciones y el software (SigProfiler) mientras estaba en el Sanger Institute y continúa desarrollando este trabajo con su equipo en la Universidad de California, San Diego (UCSD). Juntos, NVIDIA y los equipos de Mutographs de UCSD y el Sanger Institute se unieron para utilizar GPU para acelerar esta investigación.

"Los proyectos de investigación como el Mutographs Grand Challenge son así: grandes desafíos que traspasan los límites de lo que es posible", dijo Pete Clapham, líder del Grupo de Apoyo a la Computación del Wellcome Sanger Institute. "Los sistemas NVIDIA DGX proporcionan una aceleración considerable que permite al equipo de Mutographs no solo satisfacer las demandas computacionales del proyecto, sino también impulsarlo aún más, entregando de manera eficiente resultados que antes eran imposibles".

Las GPU NVIDIA aceleran la aplicación científica al descargar las partes del código que consumen más tiempo. Si bien el Sanger Institute ahorra costos y mejora el rendimiento al ejecutar el trabajo computacional intensivo en GPU, el resto de la aplicación aún se ejecuta en la CPU. Desde la perspectiva del investigador, la aplicación general se ejecuta más rápido porque utiliza la potencia de procesamiento paralelo de la GPU para mejorar el rendimiento.

En el proyecto actual, los investigadores están estudiando el ADN de los tumores de 5.000 pacientes con cinco tipos de cáncer: páncreas, riñón, colorrectal y dos tipos de cáncer de esófago. Para estimar el rendimiento de la computación se utilizaron cinco matrices de datos sintéticos que imitan un tipo de perfiles mutacionales del mundo real. Un sistema NVIDIA DGX-1 ejecuta el algoritmo NMF en las cinco matrices, mientras que los trabajos de CPU replicados correspondientes se ejecutan en contenedores acoplables en máquinas virtuales (VM) OpenStack, específicamente 60 núcleos en procesadores Intel Xeon Skylake con 2,6 GHz y 697,3 GB de almacenamiento aleatorio. -memoria de acceso (RAM).

NVIDIA DGX-1 es un sistema integrado para IA que incluye ocho GPU NVIDIA V100 Tensor Core que se conectan a través de NVIDIA NVLink, la interconexión de GPU de alto rendimiento de NVIDIA, en una red híbrida de malla cúbica. Junto con las CPU Intel Xeon de doble socket y cuatro tarjetas de interfaz de red NVIDIA Mellanox® InfiniBand de 100GB, el DGX-1 ofrece un petaFLOPS de potencia de IA para un rendimiento de entrenamiento sin precedentes. El software del sistema DGX-1, las potentes bibliotecas y la red NVLink están optimizados para ampliar el deep learning en las ocho GPU V100 Tensor Core para proporcionar una plataforma flexible y de máximo rendimiento para el desarrollo y la implementación de aplicaciones de IA tanto en entornos de producción como de investigación.

“Los proyectos de investigación como el Mutographs Grand Challenge son así: grandes desafíos que traspasan los límites de lo que es posible. Los sistemas NVIDIA DGX proporcionan una aceleración considerable que permite al equipo de Mutographs no solo satisfacer las demandas computacionales del proyecto, sino también impulsarlo aún más, entregando de manera eficiente resultados que antes eran imposibles”.

Pete Clapham, Líder del Grupo de Apoyo a la Computación, Wellcome Sanger Institute

Resultados Más Rápidos y Experimentos Más Complejos Prometen Mejorar la Salud Humana

Se observó una aceleración promedio de 30 veces cuando los trabajos de pipeline se ejecutaron en la plataforma DGX-1 en comparación con aquellos en el hardware de la CPU. El DGX-1 entregó resultados precisos en dieciséis horas para un trabajo de CPU equivalente que normalmente tomaba veinte días en un análisis de la vida real.

La velocidad y la potencia de cálculo de las GPU están permitiendo a los investigadores obtener resultados científicos más rápido, realizar una mayor cantidad de experimentos y ejecutar experimentos más complejos de lo que antes era posible, allanando el camino para descubrimientos científicos que podrían transformar el futuro de los tratamientos contra el cáncer.