Este trabalho requer a solução de um problema de machine learning computacionalmente intensivo conhecido como fatoração de matriz não negativa (NMF). Ludmil Alexandrov desenvolveu a abordagem para detectar assinaturas de mutação e o software (SigProfiler) enquanto estava no Sanger Institute e continua a desenvolver este trabalho com sua equipe na Universidade da Califórnia, San Diego (UCSD). Juntas, a NVIDIA e as equipes Mutographs da UCSD e do Sanger Institute se uniram para usar GPUs para acelerar esta pesquisa.
“Projetos de pesquisa como o Mutographs Grand Challenge são assim: grandes desafios que ultrapassam os limites do que é possível”, disse Pete Clapham, líder do Grupo de Apoio à Computação do Wellcome Sanger Institute. “Os sistemas NVIDIA DGX fornecem uma aceleração considerável que permite à equipe Mutographs não apenas atender às demandas computacionais do projeto, mas também levá-lo ainda mais longe, entregando com eficiência resultados antes impossíveis.”
As GPUs NVIDIA aceleram a aplicação científica ao descarregar as partes mais demoradas do código. Embora o Sanger Institute economize custos e melhore o desempenho executando o trabalho computacionalmente intensivo em GPUs, o restante da aplicação ainda é executado na CPU. Do ponto de vista do pesquisador, a aplicação geral é executada mais rapidamente porque usa o poder de processamento paralelo da GPU para melhorar o desempenho.
No projeto atual, os pesquisadores estão estudando o DNA de tumores de 5.000 pacientes com cinco tipos de câncer: pâncreas, rim, colorretal e dois tipos de câncer de esôfago. Cinco matrizes de dados sintéticas que imitam um tipo de perfis mutacionais do mundo real foram usadas para estimar o desempenho da computação. Um sistema NVIDIA DGX-1 executa o algoritmo NMF nas cinco matrizes, enquanto os trabalhos de CPU replicados correspondentes são executados em contêineres docker em máquinas virtuais (VMs) OpenStack, especificamente 60 núcleos em processadores Intel Xeon Skylake com 2,6 GHz e 697,3 GB de dados aleatórios. -acessar memória (RAM).
O NVIDIA DGX-1 é um sistema integrado para IA com oito GPUs NVIDIA V100 Tensor Core que se conectam por meio do NVIDIA NVLink, a interconexão de GPU de alto desempenho da NVIDIA, em uma rede híbrida de malha cúbica. Juntamente com CPUs Intel Xeon de soquete duplo e quatro placas de interface de rede NVIDIA Mellanox® InfiniBand de 100GB, o DGX-1 oferece um petaFLOPS de potência de IA, para desempenho de treinamento sem precedentes. O software do sistema DGX-1, as bibliotecas poderosas e a rede NVLink são ajustados para ampliar o deep learning em todas as oito GPUs V100 Tensor Core para fornecer uma plataforma flexível e de desempenho máximo para o desenvolvimento e implantação de aplicações de IA em ambientes de produção e pesquisa.