¿Por qué solo 10 GB de memoria para la RTX 3080? ¿Cómo se determinó que era un valor suficiente, cuando es el mismo de la generación anterior?
Link
[Justin Walker] Analizamos constantemente los requisitos de memoria de los juegos más recientes y consultamos periódicamente a los desarrolladores de juegos para comprender sus necesidades de memoria para los juegos actuales y futuros. El objetivo de la 3080 es brindarles un gran rendimiento con una resolución de hasta 4k con todas las opciones de configuración al máximo y al mejor precio posible. Para hacer esto, necesitas una GPU muy potente con memoria de alta velocidad y suficiente memoria para satisfacer las necesidades de los juegos. Algunos ejemplos: Si nos fijamos en Shadow of the Tomb Raider, Assassin's Creed Odyssey, Metro Exodus, Wolfenstein Youngblood, Gears of War 5, Borderlands 3 y Red Dead Redemption 2 que se ejecutan en una 3080 a 4k y con la configuración máxima (incluido cualquier paquete de texturas de alta resolución que corresponda) y RTX On, cuando el juego lo permite, obtienes un rango de 60-100 cuadros por segundo (FPS) y usas entre 4 GB y 6 GB de memoria. Siempre es bueno tener más memoria, pero aumentaría el precio de la tarjeta gráfica, por lo que debemos encontrar el equilibrio adecuado.
En la diapositiva dice que la RTX 3070 es igual o más rápida que la 2080 Ti, ¿estamos hablando de rasterización tradicional o cargas de trabajo de DLSS y RT? Me parece importante aclararlo, ya que no se mostraron puntos de referencia de rasterización tradicionales, solo de juegos compatibles con RT y DLSS.
Link
[Justin Walker] Estamos hablando de ambos. Juegos que solo admiten la rasterización tradicional y juegos que admiten RTX (RT + DLSS). Puedes verlo en nuestro artículo de lanzamiento aquí.
¿Ampere admite HDMI 2.1 con el ancho de banda completo de 48 Gbps?
Link
[Qi Lin] Sí. La arquitectura NVIDIA Ampere admite la velocidad de enlace HDMI 2.1 más alta de 12 Gbs/carril en los 4 carriles y soporta Display Stream Compression (DSC) para permitir una resolución de hasta 8K y 60 Hz en HDR.
¿Podrían desarrollar un poco sobre esta duplicación de núcleos CUDA? ¿Cómo afecta a las arquitecturas generales de las GPCs? ¿Qué desafío implica mantener alimentadas todas esas unidades FP32? ¿Qué se hizo para garantizar una alta ocupación?
Link
[Tony Tamasi] Uno de los objetivos de diseño clave para el SM (Multiprocesadores para Streaming) de Ampere de la Serie 30 era lograr el doble de rendimiento para las operaciones FP32 en comparación con el SM de Turing. Para lograr este objetivo, el SM (Multiprocesadores para Streaming)) de Ampere incluye nuevos diseños de rutas de datos para las operaciones FP32 e INT32. Una ruta de datos en cada partición consta de 16 núcleos CUDA FP32 capaces de ejecutar 16 operaciones FP32 por frecuencia. Otra ruta de datos consta de 16 núcleos CUDA FP32 y 16 núcleos INT32. Como resultado de este nuevo diseño, cada partición de SM (Multiprocesadores para Streaming) de Ampere es capaz de ejecutar 32 operaciones FP32 por frecuencia o 16 operaciones FP32 y 16 INT32 por frecuencia. Las cuatro particiones de SM (Multiprocesadores para Streaming) combinadas pueden ejecutar 128 operaciones FP32 por frecuencias (el doble del valor de FP32 del SM de Turing) o 64 operaciones FP32 y 64 INT32 por frecuencia.
Duplicar la velocidad de procesamiento para FP32 mejora el rendimiento de una serie de algoritmos y operaciones gráficas y de computación comunes. Las cargas de trabajo de sombreado moderno suelen tener una combinación de instrucciones aritméticas FP32 como FFMA, adiciones de punto flotante (FADD) o multiplicaciones de punto flotante (FMUL), combinadas con instrucciones más simples como adiciones de enteros para direccionar y obtener datos, realizar comparaciones de puntos flotantes u obtener valores mín./ máx. para procesar resultados, etc. Las ganancias de rendimiento variarán en el nivel de sombreado y aplicación según la combinación de instrucciones. Los sombreadores de eliminación de ruido de ray tracing son buenos ejemplos que podrían beneficiarse enormemente de la duplicación del rendimiento de FP32.
Duplicar el rendimiento matemático requirió duplicar las rutas de datos que lo soportan, razón por la cual el SM (Multiprocesadores para Streaming) de Ampere también duplicó la memoria compartida y el rendimiento de la caché L1 para el SM. (128 bytes/frecuencias por SM (Multiprocesadores para Streaming) de Ampere frente a 64 bytes/frecuencia en Turing). El ancho de banda L1 total para GeForce RTX 3080 es de 219 Gb/s, frente a 116 Gb/s para GeForce RTX 2080 Super.
Al igual que las GPUs de NVIDIA anteriores, Ampere se compone de grupos de procesamiento de gráficos (GPC), grupos de procesamiento de texturas (TPC), multiprocesadores de transmisión (SM), operadores de ráster (ROPS) y controladores de memoria.
El GPC es el bloque de hardware de alto nivel dominante con todas las unidades de procesamiento de gráficos clave que residen dentro del GPC. Cada GPC incluye un motor de rasterización dedicado y ahora también incluye dos particiones ROP (cada partición contiene ocho unidades ROP), que es una nueva característica para las GPU NVIDIA con arquitectura Ampere GA10x. Se pueden encontrar más detalles sobre la arquitectura NVIDIA Ampere en el Informe técnico de arquitectura Ampere de NVIDIA, que se publicará en los próximos días.
¿Alguna idea de si el diseño de flujo de aire dual se verá afectado en las carcasas invertidas? ¿Más que en los diseños anteriores? Parece que lo dirige hacia la cpu. Sin embargo, el enfriador de la CPU lo expulsaría del chasis. Quizás no sea tan malo.
Segunda pregunta. 10 veces más silencioso que Titan para la 3090 ¿es más o menos más silencioso que una 2080 Super (Evga ultra fx, por ejemplo)?
Link
[Qi Lin] El nuevo diseño de flujo a través de refrigeración funcionará muy bien siempre que los ventiladores del chasis estén configurados para llevar aire fresco a la GPU y luego muevan el aire que fluye a través de la GPU fuera del chasis. No importa si el chasis está invertido.
La Founders Edition RTX 3090 es más silenciosa que la Titan RTX y la Founders Edition RTX 2080 Super. No lo hemos probado con diseños de socios específicos, pero creo que te impresionará lo que escuches… o, mejor dicho, lo que no escuches. :-)
¿Las tarjetas de la Serie 30 admitirán la resolución 10 bits, 444, 120 cuadros por segundo (FPS)? Tradicionalmente, las tarjetas para clientes minoristas de NVIDIA solo admitían salidas de 8 bits o 12 bits, ni de 10 bits. La gran mayoría de los monitores y televisores HDR del mercado son de 10 bits.
Link
[Qi Lin] La serie 30 admite la resolución HDR de 10 bits. De hecho, HDMI 2.1 puede admitir hasta 8K a 6 0Hz con HDR de 12 bits, y eso incluye las pantallas HDR de 10 bits.
¿Qué avance tecnológico les permitió realizar el enorme salto a la línea 3xxx desde la línea 2xxx? Sabía que sería algo aterrador, pero es una locura pensar en lo eficientes y poderosas que son estas tarjetas. ¿Estas tarjetas admiten la resolución 4K a 144 hz?
Link
[Justin Walker] Hubo grandes avances en la arquitectura de GPU, la tecnología de procesos y la tecnología de memoria, por nombrar solo algunos. Una RTX 3080 es lo suficientemente potente para ejecutar ciertos juegos con la configuración al máximo y resolución 4K a 144 fps: Doom Eternal, Forza 4, Wolfenstein Youngblood, por nombrar algunos. Pero otros, Red Dead Redemption 2, Control, Borderlands 3, por ejemplo, están más cerca de 4k a 60 cuadros por segundo (FPS) con la configuración al máximo.