최대 920억 개의 트랜지스터를 갖춘 Blackwell은 지금까지 만들어진 가장 강력한 소비자용 GPU입니다. Blackwell 스트리밍 멀티프로세서(SM)는 신경 셰이더의 성능을 최적화하기 위해 더 많은 처리량과 Tensor 코어와의 긴밀한 통합으로 업데이트되었습니다. Blackwell은 셰이더 실행 재정렬(Shader Execution Reordering)을 개선하기 위한 여러 하드웨어 및 소프트웨어 혁신을 통해 향상되었습니다. 재정렬 논리는 두 배 더 효율적이므로 신경 셰이더의 성능을 가속화하는 재정렬 속도와 정밀도를 높입니다.
새로운 Blackwell Tensor 코어는 엄청난 양의 AI 처리 성능으로 구축되었으며 FP4 정밀 모델의 가속화된 처리를 지원합니다. FP4를 사용하면 Blackwell Tensor 코어는 모델을 더 빠르게 처리할 수 있을 뿐만 아니라 더 적은 그래픽 메모리를 사용하면서 이를 수행할 수 있습니다.
차세대 DLSS Multi Frame Generation의 프레임 페이싱 요구 사항을 지원하기 위해 Blackwell 아키텍처는 향상된 하드웨어 플립 미터링 기능으로 구축되어 원활한 고품질 경험에 필요한 속도와 정확성을 제공합니다.
Blackwell은 또한 엄청난 양의 세부 형상을 레이 트레이싱하도록 설계된 새로운 RT 코어를 갖추고 있습니다. RT 코어는 이전 세대에 비해 2배의 레이 트라이앵글 인터섹션 레이트(Ray triangle intersection rate)를 제공하고 메모리 공간을 줄이도록 설계된 향상된 압축 기능을 제공합니다. 이를 통해 Blackwell GPU는 이전에는 불가능했던 수준의 기하학적 형상을 레이 트레이싱할 수 있습니다.
Blackwell은 또한 PCIe Gen5와 DisplayPort 2.1b UHBR20으로 향상되어 최대 8K 165Hz의 디스플레이를 구동합니다.
GeForce RTX 50 시리즈 노트북의 경우 Advanced Power Gating, Low Latency Sleep, Accelerated Frequency Switching과 같은 새로운 Max-Q 기술로 이전 세대에 비해 배터리 수명이 최대 40% 늘어납니다.
그리고 이 모든 처리 능력을 공급하기 위해 Blackwell은 최대 30Gbps 속도의 세계에서 가장 빠른 메모리인 GDDR7을 탑재했습니다. G7 메모리를 사용하면 Blackwell GPU는 최대 1.8TB/s의 메모리 대역폭을 제공할 수 있습니다.