MLPerf Inference v4.0 mede o desempenho de inferência usando nove tipos diferentes de redes neurais, incluindo LLMs, geração de imagens, processamento de linguagem natural, visão computacional e segmentação de imagens médicas.
O MLPerf Training v4.0 mede o desempenho do treinamento em nove benchmarks diferentes, incluindo pré-treinamento de LLM, ajuste fino de LLM, texto para imagem, rede neural gráfica (GNN), visão computacional, segmentação de imagens médicas e recomendação.
O MLPerf HPC v3.0 mede o desempenho do treinamento em quatro casos de uso de computação científica diferentes, incluindo identificação climática atmosférica de rios, previsão de parâmetros cosmológicos, modelagem molecular quântica e previsão de estrutura de proteínas.