NVIDIA Unified Fabric Manager (UFM)

Entdecken Sie die Netzwerkmanagement-Plattformen für Cyber Intelligence und Analysen.

Die NVIDIA® UFM® Plattform revolutioniert das Netzwerkmanagement im Rechenzentrum durch die Kombination verbesserter Echtzeit-Netzwerktelemetrie mit KI-gestützter Cyber Intelligence und Analysen zur Unterstützung skalierungsfähiger InfiniBand-vernetzten Rechenzentren.

 

Rechenzentrumsmanagement leicht gemacht

Die UFM-Plattform ermöglicht es Betreibern von Forschungs- und industriellen Rechenzentren, ihre leistungsstarke InfiniBand-Netzwerk-Fabric effizient bereitzustellen, zu überwachen, zu verwalten sowie eine präventive Fehlerbehebung und Wartung. Die UFM-Plattform besteht aus mehreren Lösungsebenen und einem umfassenden Funktionsumfang, um die breitesten Anforderungen an moderne Scale-out-Rechenzentren zu erfüllen. Mit UFM können Sie eine höhere Nutzung von Fabric-Ressourcen erreichen und einen Wettbewerbsvorteil erzielen, während Sie gleichzeitig die Betriebskosten reduzieren.

UFM-Plattformen bieten robuste grafische Benutzeroberflächen (GUIs)

Die UFM-Plattform bietet robuste grafische Benutzeroberflächen (Graphical User Interfaces, GUIs).

Erfahren Sie, wie einfach es ist, Ihr InfiniBand-vernetztes Rechenzentrum mit einer kostenlosen 60-tägigen Testversion der UFM-Enterprise-Software zu verwalten, zu überwachen und zu warten.

UFM-Plattformen – Produktsuite

UFM-Telemetrie:
Echtzeitüberwachung

UFM-Telemetrie bietet Netzwerkvalidierungstools zur Überwachung der Netzwerkleistung und -bedingungen. Außerdem erfasst und streamt sie umfangreiche Netzwerk-Telemetrieinformationen in Echtzeit, die Nutzung von Anwendungs-Workloads und die Systemkonfiguration einer lokalen oder Cloud-basierten Datenbank zur weiteren Analyse.

 

Sie ist über Software-Container oder dedizierte Appliances verfügbar.

 

Hauptmerkmale:

  • Telemetrie für Switches, Adapter und Kabel
  • Systemvalidierung
  • Netzwerkleistungstests
  • Streaming von Telemetrieinformationen in eine lokale oder cloudbasierte Datenbank

UFM-Enterprise:
Transparenz und Kontrolle von Fabrics

UFM-Enterprise kombiniert die Vorteile der UFM-Telemetrie mit verbesserter Netzwerküberwachung und -verwaltung. Sie führt eine automatisierte Netzwerkerkennung und -bereitstellung, Datenverkehrsüberwachung und Überlastungserkennung durch.

 

Sie ist über Software-Container oder dedizierte Appliances verfügbar.

 

Hauptmerkmale:

  • Enthält UFM-Telemetriefunktionen
  • Automatisierte Netzwerkerkennung und -validierung
  • Sicheres Kabelmanagement
  • Überlastungsverfolgung zur Identifizierung von Datenverkehrsengpässen
  • Problemidentifikation und -lösung
  • Globale Software-Updates
  • Job-Scheduler-Bereitstellung, Integration von Slurm und IBM Spectrum LSF
  • Erweiterte Berichterstellung und umfassende REST-APIs (Representational State Transfer)
  • Umfangreiche webbasierte GUI

UFM-Cyber-KI:
Cyber Intelligence und Analysen

Die UFM-Cyber-KI erweitert die Vorteile von UFM-Telemetrie und UFM-Enterprise und ermöglicht präventive Wartung und Cybersicherheit zur Senkung der Supercomputing-Betriebskosten.

 

Sie ist über eine dedizierte UFM-Cyber-KI-Appliance lokal verfügbar.

 

Hauptmerkmale:

  • Enthält UFM-Telemetrie- und UFM-Enterprise-Funktionen
  • Erkennt Leistungseinbußen oder Änderungen des Nutzungsprofils im Laufe der Zeit
  • Verwendet KI zur Herstellung von Korrelationen zwischen Ereignissen (die scheinbar nichts miteinander zu tun haben)
  • Warnt, wenn präventive Wartung erforderlich ist
  • Optimiert die Vorhersagbarkeit durch kontinuierliche Systemdatenerfassung

NVIDIA UFM-SDK

NVIDIA Networking Care – Überwachungs- und Network Operations Center (NOC)-Dienste

Eine umfassende Suite von Tools und Plugins für mit NVIDIA InfiniBand-vernetzte Cluster

NVIDIA UFM-SDK bietet ein umfangreiches Angebot an Plugins von Drittanbietern, die für Open-Source-Plattformen wie Grafana, FluentD, Zabbix und Slurm konzipiert wurden. Diese Tools und Plugins steigern die Produktivität von Entwicklern und bieten eine effiziente, benutzerfreundliche Integration mit der UFM-REST-API. Probieren Sie unsere Plugins für Application Lifecycle Management (ALM) und Problem Detection and Resolution (PDR) für vorausschauende Wartungen aus. Erkennen Sie Probleme vor ihrer Entstehung und sorgen Sie für eine optimale Netzwerkleistung.

Ressourcen

Ihr Cluster konfigurieren

Netzwerkkurse besuchen

Konnten wir Sie überzeugen?