Área da Saúde e Ciências da Vida

Desvendando os Mistérios das Assinaturas Mutacionais do Câncer com as Soluções Aceleradas da NVIDIA

Objetivo

O Sanger Institute usa o servidor NVIDIA DGX para potencializar seu processo de análise de assinaturas de câncer mutacional, melhorando o desempenho em 30 vezes.

Cliente

Sanger Institute

Caso de Uso

Melhoria de Desempenho

Tecnologia

Servidor NVIDIA DGX-1™, NVIDIA® NVLink®

A Necessidade de Compreender Melhor as Assinaturas Mutacionais do Câncer

O câncer é causado por danos ao DNA das células, conhecidos como mutações somáticas. Esses danos podem ser resultado de comportamentos como fumar e beber álcool, bem como de fatores ambientais como luz ultravioleta e exposição à radiação.

Os danos ao DNA ocorrem em padrões específicos conhecidos como “assinaturas mutacionais”, que são exclusivos do fator que causou o dano. Por exemplo, embora o tabaco e a radiação ultravioleta causem câncer ao produzirem mutações, a assinatura causada pelo fumo do tabaco é encontrada no câncer de pulmão, enquanto a assinatura da exposição à luz ultravioleta é encontrada no câncer da pele.

Muitas assinaturas mutacionais associadas ao câncer foram identificadas, mas apenas cerca de metade delas têm causas conhecidas. Nos últimos anos, a análise do DNA de cânceres levou à descoberta de mais de noventa assinaturas mutacionais diferentes. No entanto, as causas ambientais, de estilo de vida, genéticas ou outras causas potenciais de muitas dessas assinaturas mutacionais ainda são desconhecidas.

Como parte da equipe Cancer Grand Challenges Mutographs, financiada pelo Cancer Research UK (CRUK), o Wellcome Sanger Institute, um dos principais centros de descoberta e compreensão genômica do mundo, está usando modelos de machine learning acelerados por GPU NVIDIA para ajudar a entender como alterações naturais no DNA afetam o câncer.

O objetivo da componente computacional do projeto é elucidar as causas das principais diferenças geográficas e temporais globais nas incidências de câncer através do estudo de assinaturas mutacionais. A identificação de um conjunto mais amplo de assinaturas mutacionais contribuirá muito para a compreensão das correlações entre elas e suas causas, levando, em última análise, a tratamentos de câncer mais precisos

lungs

Pesquisadora do Wellcome Sanger Institute conduz sequenciamento de DNA. Imagem cortesia do Wellcome Sanger Institute..

OSCC-map

Os casos de carcinoma espinocelular de esôfago variam muito em todo o mundo. Imagem cortesia do projeto Mutographs. Fonte de dados: GLOBOCAN 2012.

Decifrando o Código com Computação Acelerada por GPU

Este trabalho requer a solução de um problema de machine learning computacionalmente intensivo conhecido como fatoração de matriz não negativa (NMF). Ludmil Alexandrov desenvolveu a abordagem para detectar assinaturas de mutação e o software (SigProfiler) enquanto estava no Sanger Institute e continua a desenvolver este trabalho com sua equipe na Universidade da Califórnia, San Diego (UCSD). Juntas, a NVIDIA e as equipes Mutographs da UCSD e do Sanger Institute se uniram para usar GPUs para acelerar esta pesquisa.

“Projetos de pesquisa como o Mutographs Grand Challenge são assim: grandes desafios que ultrapassam os limites do que é possível”, disse Pete Clapham, líder do Grupo de Apoio à Computação do Wellcome Sanger Institute. “Os sistemas NVIDIA DGX fornecem uma aceleração considerável que permite à equipe Mutographs não apenas atender às demandas computacionais do projeto, mas também levá-lo ainda mais longe, entregando com eficiência resultados antes impossíveis.”

As GPUs NVIDIA aceleram a aplicação científica ao descarregar as partes mais demoradas do código. Embora o Sanger Institute economize custos e melhore o desempenho executando o trabalho computacionalmente intensivo em GPUs, o restante da aplicação ainda é executado na CPU. Do ponto de vista do pesquisador, a aplicação geral é executada mais rapidamente porque usa o poder de processamento paralelo da GPU para melhorar o desempenho.

No projeto atual, os pesquisadores estão estudando o DNA de tumores de 5.000 pacientes com cinco tipos de câncer: pâncreas, rim, colorretal e dois tipos de câncer de esôfago. Cinco matrizes de dados sintéticas que imitam um tipo de perfis mutacionais do mundo real foram usadas para estimar o desempenho da computação. Um sistema NVIDIA DGX-1 executa o algoritmo NMF nas cinco matrizes, enquanto os trabalhos de CPU replicados correspondentes são executados em contêineres docker em máquinas virtuais (VMs) OpenStack, especificamente 60 núcleos em processadores Intel Xeon Skylake com 2,6 GHz e 697,3 GB de dados aleatórios. -acessar memória (RAM).

O NVIDIA DGX-1 é um sistema integrado para IA com oito GPUs NVIDIA V100 Tensor Core que se conectam por meio do NVIDIA NVLink, a interconexão de GPU de alto desempenho da NVIDIA, em uma rede híbrida de malha cúbica. Juntamente com CPUs Intel Xeon de soquete duplo e quatro placas de interface de rede NVIDIA Mellanox® InfiniBand de 100GB, o DGX-1 oferece um petaFLOPS de potência de IA, para desempenho de treinamento sem precedentes. O software do sistema DGX-1, as bibliotecas poderosas e a rede NVLink são ajustados para ampliar o deep learning em todas as oito GPUs V100 Tensor Core para fornecer uma plataforma flexível e de desempenho máximo para o desenvolvimento e implantação de aplicações de IA em ambientes de produção e pesquisa.

“Projetos de pesquisa como o Mutographs Grand Challenge são assim: grandes desafios que ultrapassam os limites do que é possível. Os sistemas NVIDIA DGX fornecem aceleração considerável que permite à equipe Mutographs não apenas atender às demandas computacionais do projeto, mas também levá-lo ainda mais longe, entregando com eficiência resultados antes impossíveis.”

Pete Clapham, Líder do Grupo de Apoio à Computação, Wellcome Sanger Institute

Resultados Mais Rápidos e Experimentos Mais Complexos Prometem Melhorar a Saúde Humana

Uma aceleração média de 30 vezes foi observada quando os trabalhos de pipeline foram executados na plataforma DGX-1 em comparação com aqueles no hardware da CPU. O DGX-1 forneceu resultados precisos em dezesseis horas para um trabalho de CPU equivalente que normalmente levava vinte dias em uma análise real.

A aceleração e o poder computacional das GPUs estão permitindo que os pesquisadores obtenham resultados científicos mais rapidamente, executem um maior número de experimentos e executem experimentos mais complexos do que era possível anteriormente, abrindo caminho para descobertas científicas que poderiam transformar o futuro dos tratamentos contra o câncer.