MLPerf Inference v4.1 mesure les performances d'inférence sur neuf benchmarks différents : plusieurs grands modèles de langage (LLM) ainsi que des modèles de texte à image, de traitement du langage naturel, des systèmes de recommandation, de vision par ordinateur et de segmentation d'images médicales.
MLPerf Training v4.0 mesure les performances d'entraînement sur neuf benchmarks différents : le pré-entraînement des LLM, l'optimisation des LLM, les capacités de texte à image, le réseau neuronal graphique (GNN), la vision par ordinateur, la segmentation d'images médicales et les systèmes de recommandation.
MLPerf HPC v3.0 mesure les performances d'entraînement sur quatre cas d'utilisation différents en matière de calcul scientifique : l'identification des rivières atmosphériques, la prédiction de paramètres cosmologiques, la modélisation moléculaire quantique et la prédiction de la structure des protéines.