Blackwell은 발생할 수 있는 잠재적인 결함을 조기에 식별하여 가동 중단 시간을 최소화하기 위해 전용 RAS(신뢰성, 가용성, 서비스 용이성) 엔진으로 지능형 복원력을 추가합니다. NVIDIA의 AI 기반 예측 관리 기능은 하드웨어 및 소프트웨어 전반에서 수천 개의 데이터 포인트를 지속적으로 모니터링하여 전반적인 상태를 파악함으로써 가동 중단 시간과 비효율성의 원인을 예측하고 개입합니다. 이를 통해 시간, 에너지 및 컴퓨팅 비용을 절감하는 지능형 복원력을 구축할 수 있습니다.
NVIDIA의 RAS 엔진은 우려되는 영역을 식별하고 유지 관리를 계획할 수 있는 심층 진단 정보를 제공합니다. RAS 엔진은 문제의 원인을 신속하게 파악하여 소요 시간을 단축하고 효과적인 해결을 촉진하여 가동 중단 시간을 최소화합니다.