NVIDIA Quantum InfiniBand 플랫폼

과학 컴퓨팅, AI, 클라우드 데이터센터에 엔드 투 엔드 고성능 네트워킹을 도입합니다.

InfiniBand 네트워킹 솔루션

복잡한 워크로드에는 고해상도 시뮬레이션, 매우 큰 크기의 데이터세트 및 고도로 병렬화된 알고리즘의 초고속 처리가 필요합니다. 이러한 요구 사항이 계속 늘어나는 추세에서, 세계 유일의 완전 오프로드 가능한 인-네트워크 컴퓨팅 플랫폼인 NVIDIA Quantum InfiniBand는 성능을 극적으로 향상해 비용과 복잡성이 적으면서도 더 빠른 발견 시간을 달성합니다.

최고 성능의 AI 전용 인프라를 위한 NVIDIA Quantum-X800 InfiniBand

InfiniBand 어댑터

NVIDIA® ConnectX® InfiniBand 호스트 채널 어댑터(HCA)는 최신 워크로드에 필요한 가속, 확장성, 기능이 풍부한 기술을 제공하기 위해 초저 지연 시간, 대규모 처리량, 혁신적인 NVIDIA 인-네트워크 컴퓨팅 엔진을 제공합니다.

데이터 처리 장치(DPU)

NVIDIA BlueField® DPU는 강력한 컴퓨팅, 고속 네트워킹 및 광범위한 프로그래밍 기능을 결합하여 가장 까다로운 워크로드를 위한 소프트웨어 정의 하드웨어 가속 솔루션을 제공합니다. BlueField를 사용하면 가속 AI 및 과학 컴퓨팅에서 클라우드 기반 슈퍼컴퓨팅에 이르는 다양한 가능성이 실현됩니다.

InfiniBand 스위치

InfiniBand 스위치 시스템은 가능한 한 최고의 성능과 포트 밀도를 제공합니다. NVIDIA SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)™와 고급 관리 기능(예: 셀프 힐링 네트워크 기능, 서비스 품질, 향상된 VL(Virtual Lane) 매핑, NVIDIA 인-네트워크 컴퓨팅 가속 엔진)은 산업, AI 및 과학 애플리케이션에 성능 향상을 가져다줍니다.

라우터 및 게이트웨이 시스템

InfiniBand 시스템은 InfiniBand 라우터 및 InfiniBand-이더넷 게이트웨이 시스템을 사용하여 최고의 확장성과 서브넷 격리를 제공합니다. InfiniBand-이더넷 게이트웨이 시스템은 InfiniBand 데이터센터를 이더넷 인프라에 연결하는 확장 가능하고 효율적인 방법을 구현하는 데 사용됩니다.

롱 홀(Long-Haul) 시스템

NVIDIA MetroX® 롱 홀(Long-Haul) 시스템은 원격 InfiniBand 데이터센터, 스토리지 또는 기타 InfiniBand 플랫폼을 원활하게 연결할 수 있습니다. 이러한 시스템은 InfiniBand의 도달 범위를 최대 40km까지 확장할 수 있으므로, 고가용성과 재해 복구를 위해 원격 데이터센터 간 또는 데이터센터와 원격 스토리지 인프라 간에 기본 InfiniBand 연결성을 지원합니다.

케이블 및 트랜시버

LinkX® 케이블 및 트랜시버는 InfiniBand 요소 간에 지연 시간이 낮고 안정성이 높은 고대역폭 연결이 필요한 HPC 네트워크의 성능을 극대화하도록 설계되었습니다.

InfiniBand의 향상된 기능

인-네트워크 컴퓨팅

NVIDIA SHARP(Scalable Hierarchical Aggregation and Reduction Protocol)™는 집합적 통신 연산을 스위치 네트워크에 오프로드하여 네트워크를 이동하는 데이터의 양을 줄이고, 메시지 전달 인터페이스(MPI) 작업의 시간을 단축하고, 데이터센터 효율성을 높입니다.

셀프 힐링 네트워크

셀프 힐링 네트워크 기능을 갖춘 NVIDIA InfiniBand는 연결 오류를 극복하여 다른 어떤 소프트웨어 기반 솔루션보다도 5,000배 더 빠른 네트워크 복구를 가능하게 합니다. 이러한 기능은 최신 세대의 InfiniBand 스위치에 내장된 인텔리전스를 활용합니다.

서비스 품질

InfiniBand는 고급 혼잡 제어 및 적응형 라우팅을 포함한 검증된 서비스 품질 기능을 갖춘 유일한 고성능 인터커넥트 솔루션으로, 최고의 네트워크 효율성을 제공합니다.

네트워크 토폴로지

InfiniBand는 중앙 집중식으로 관리할 수 있으며 Fat Tree, Hypercubes, 다차원 Torus, Dragonfly+를 포함한 모든 토폴로지를 지원합니다. 라우팅 알고리즘은 특정 애플리케이션 통신 패턴에 맞는 토폴로지 설계 시 성능을 최적화합니다.

최적의 성능을 위한 소프트웨어

MLNX_OFED

OpenFabrics Alliance의 OFED는 고성능 입출력(IO) 제조사에서 공동 개발하고 테스트했습니다. NVIDIA MLNX_OFED는 NVIDIA가 테스트한 OFED 버전입니다.

HPC-X

NVIDIA HPC-X®는 포괄적인 MPI 및 SHMEM/PGAS 소프트웨어 제품군입니다. HPC-X는 InfiniBand 인-네트워크 컴퓨팅과 가속 엔진을 활용하여 연구 및 산업 애플리케이션을 최적화합니다.

UFM

NVIDIA UFM®(Unified Fabric Manager) 플랫폼은 데이터센터 관리자가 InfiniBand 네트워크 인프라를 효율적으로 프로비저닝, 모니터링, 관리하고 관련 문제를 사전에 해결할 수 있도록 지원합니다.

Magnum IO

NVIDIA Magnum IO™는 네트워크 IO, 인-네트워크 컴퓨팅, 스토리지, IO 관리를 활용하여 멀티 GPU와 멀티 노드 시스템을 위한 데이터 이동, 액세스, 관리를 간소화하고 더욱 빠르게 처리합니다.

리소스

클러스터 구성

네트워킹 과정 수강

구매할 준비가 되셨습니까?