Após os Anúncios do GeForce Beyond, realizamos uma sessão de perguntas e respostas da comunidade em r/NVIDIA e convidamos sete gerentes de produtos da NVIDIA para responder às suas perguntas. Embora não tenhamos conseguido responder a todas elas, escolhemos as mais frequentes para nossos especialistas responderem.
P: Por que as placas de vídeo GeForce RTX 4080 de 16GB e 12GB mantém o mesmo nome "4080" se elas têm quantidades completamente diferentes de CUDA Cores e chips diferentes?
A nomenclatura da GeForce RTX 4080 de 16GB e 12GB é semelhante à nomenclatura de duas versões da RTX 3080 que tivemos na geração anterior, e de outras anteriores. Há uma configuração da RTX 4080 com uma memória de 16GB e uma configuração diferente, com uma memória de 12GB. Um único nome de produto, duas configurações.
A 4080 de 12GB é uma placa de vídeo incrível, com desempenho superior ao da nossa melhor placa da geração anterior, a RTX 3090 Ti, e 3x mais desempenho que a RTX 3080 Ti com suporte para DLSS 3, por isso, acreditamos que é uma ótima placa de vídeo da classe 80. Sabemos que muitos gamers podem querer uma opção premium, então a RTX 4080 de 16GB oferece mais memória e ainda mais desempenho. As duas versões serão claramente identificadas nas embalagens, nos detalhes do produto e no varejo, para que gamers e criadores possam escolher facilmente a melhor placa de vídeo por si mesmos.
P: Como será o desempenho da RTX Série 40 em comparação com a série 30 se a geração de frames do DLSS não estiver ativada?
Veja mais informações sobre o desempenho aqui.
Este gráfico considera o DLSS ativado quando compatível, mas há alguns games como Division 2 e Assassin's Creed Valhalla no gráfico que não têm DLSS. Desse modo, é possível ver o desempenho em comparação com nossa placa de vídeo mais rápida da RTX Série 30 sem DLSS.
P: Tem havido muito conteúdo sobre o visual e os games, mas tenho mais interesse nos recursos CUDA. O número de núcleos diminui em relação aos modelos RTX 30xx correspondentes, mas os recursos compatíveis foram atualizados. Quanto os CUDA Cores da RTX 40xx nos workflows existentes são mais rápidos/melhores/mais eficientes?
Os workflows de aplicações CUDA podem ser mais diversos do que os games. Em geral, o aumento significativo do core clock significa que a potência do sombreador aumenta muito de geração em geração, variando de 30% a 120%. As aplicações CUDA com padrões mais desafiadores de acesso à memória também podem se beneficiar do cache L2 maior. Para workflows de criadores, a GeForce RTX Série 40 é até 2x mais rápida em aplicações de renderização off-line, como o Blender ou o V-Ray, e, combinada com o DLSS 3, é até 4x mais rápida em aplicações de renderização em tempo real, como o Omniverse, o Unreal ou o Unity. Isso tudo ao mesmo tempo que consome a mesma ou menos potência do que a geração anterior.
P: Que tipo de adaptadores de energia são necessários para a GeForce RTX 4090, a RTX 4080 (16GB) e a RTX 4080 (12GB)?
A RTX 4090 usa o novo conector de energia PCIe 5.0, que permite alimentar a placa de vídeo com um único cabo. Esperamos que as PSUs com esse conector estejam disponíveis em outubro. No entanto, a 4090 vem com um adaptador de energia que permite usar um sistema de alimentação com seus conectores PCIe de 8 pinos.
Além desse adaptador, a RTX 4080 usa um conector de alimentação PCIe 5.0, e ela é enviada também com um adaptador de energia compatível com conectores PCIe de 8 pinos.
Observe que os cabos e adaptadores de 12 pinos existentes da geração RTX Série 30 não são compatíveis com as placas de vídeo RTX Série 40.
P: Por que o DisplayPort 2.0 não está listado na especificação?
O padrão atual do DisplayPort 1.4 já é compatível com 8K a 60Hz. O suporte para o DisplayPort 2.0 em monitores gamer para consumidores ainda está longe no futuro.
P: Alguém pode explicar essas alegações de desempenho em como se relacionam com os games? Um desempenho 2-4x maior parece inédito. Normalmente, de geração em geração, as placas de vídeo veem um aumento de 30 a 50% no desempenho. A alegação é de que essas placas vão, *no mínimo*, dobrar o desempenho nos games?
A RTX 4090 atinge um desempenho 2-4x maior com uma combinação de melhorias de software e hardware. Atualizamos os três processadores RTX: Shader Cores, RT Cores e Tensor Cores. Combinada com nossa nova tecnologia de geração de frames por AI do DLSS 3, a RTX 4090 oferece até 2x mais desempenho nos games e em aplicações de criação mais atuais, em comparação com a RTX 3090 Ti. Ao analisar o conteúdo de última geração que coloca uma carga de trabalho maior na placa de vídeo, vemos um aumento de desempenho de até 4x. Esses não são ganhos mínimos de desempenho, são os ganhos que você pode esperar ver nos games e nas aplicações com uso mais intensivo de computação.
Veja mais informações sobre o desempenho aqui.
P: O DLSS 2.X continuará a ser aprimorado e compatível em jogos futuros?
O DLSS 3 consiste em 3 tecnologias: a geração de frames do DLSS, a super-resolução do DLSS (também conhecido como DLSS 2) e o NVIDIA Reflex.
A geração de frames do DLSS usa o Optical Flow Accelerator de alta velocidade da RTX Série 40 para calcular o fluxo de movimento usado para a rede de AI, e então executa a rede em Tensor Cores de 4ª geração. O suporte para arquiteturas de placa de vídeo anteriores exigiria mais inovação e otimização para o algoritmo de fluxo óptico e o modelo de AI.
A super-resolução do DLSS e o NVIDIA Reflex permanecerão compatíveis com o hardware da geração anterior. Por isso, os gamers e os criadores GeForce atuais se beneficiarão dos games que integrarem o DLSS 3. Continuamos a pesquisar e a treinar a AI para a super-resolução do DLSS, e forneceremos atualizações de modelos para todos os clientes RTX, assim como temos feito desde o lançamento inicial do DLSS.
Sub-recurso do DLSS 3 |
Suporte ao Hardware da Placa de Vídeo |
Geração de frames do DLSS |
Placa de vídeo GeForce RTX Série 40 |
Super-resolução do DLSS (também conhecido como DLSS 2) |
Placa de vídeo GeForce RTX Séries 20/30/40 |
NVIDIA Reflex |
GeForce Série 900 e placas de vídeo mais recentes |
P: O DLSS 3.0 está incrível e é realmente impressionante em um nível técnico. As melhorias no DLSS 3.0 em relação ao 2.0 exigem atualizações no nível do engine? Ou o DLSS 3.0 pode ser implementado facilmente em games que já são compatíveis com o DLSS 2.0 sem muito esforço de desenvolvimento?
O DLSS 3 foi projetado para uma integração rápida e fácil. Ele já está se tornando uma das nossas tecnologias adotadas mais rapidamente, com mais de 35 games e aplicações em breve. Os primeiros games chegam em outubro.
O DLSS 3 aproveita os mesmos pontos de integração do DLSS 2 e do NVIDIA Reflex, facilitando os upgrades dos SDKs existentes com um plug-in Streamline do DLSS 3.
O DLSS 3 também está chegando aos engines de games mais populares do mundo, incluindo Unity, Unreal Engine e Frostbite Engine, facilitando para os games baseados nesses engines ativar o DLSS 3.
P: Como o fluxo óptico se encaixa no modelo? Se o DLSS 2 é a reconstrução espacial do próximo frame, isso significa que temos a reconstrução temporal com vários frames pela frente? Além disso, ele permite que você obtenha menos de 25% dos pixels renderizados (modo desempenho do DLSS)?
Há dois modelos AI no DLSS 3: super-resolução do DLSS (também conhecido como DLSS 2) e a geração de frames do DLSS. A super-resolução do DLSS aumenta a taxa de frames renderizando menos pixels e usando a AI para construir uma imagem nítida e com resolução mais alta. A geração de frames do DLSS analisa frames sequenciais e dados de movimento do novo Optical Flow Accelerator das placas de vídeo GeForce RTX Série 40 para criar frames adicionais de alta qualidade e aumentar o desempenho sem comprometer a qualidade da imagem e o tempo de resposta. Quando o DLSS 3 está ativado, o primeiro frame é reconstruído pela super-resolução do DLSS, e o frame seguinte, pela geração de frames do DLSS. No total, o DLSS 3 permite reconstruir 7/8s do total de pixels exibidos. Saiba mais aqui.
P: O Portal RTX foi minha parte favorita do evento hoje. Sou grande fã das implementações da RTX nos games mais antigos. Podemos esperar outros projetos semelhantes no futuro?
Estamos felizes por você gostar do Portal com RTX! O NVIDIA RTX Remix é a plataforma de modding usada para desenvolver o Portal com RTX e estará disponível como um kit de ferramentas gratuito para a comunidade fazer a remasterização de games semelhantes ou para continuar a criar no Portal com RTX. Estamos animados para ver o que a comunidade vai criar! Não temos mais nada para anunciar sobre os projetos do NVIDIA Lightspeed Studio no momento.
P: O RTX Remix está bloqueado para placas 40xx?
Não. Além do desempenho, os mods RTX criados com RTX Remix (incluindo Portal com RTX) devem ser executados em placas de vídeo compatíveis com Ray Tracing Vulkan. O kit de ferramentas para criadores RTX Remix será compatível com placas de vídeo RTX de 8GB ou mais.
Dito isso, as placas RTX Série 40 com o DLSS 3 oferecerão o melhor desempenho para RTX Remix e RTX Mods. As informações sobre placas de vídeo mínimas e recomendadas serão fornecidas mais perto da versão Beta do RTX Remix.
P: O NVIDIA Remix certamente parece uma notícia maravilhosa para o espaço de modding, quão ampla será sua aplicabilidade? Todos os games terão compatibilidade ou será limitado a apenas alguns games selecionados?
Inicialmente, planejamos enviar com suporte para games DirectX 8 e 9 que utilizam um pipeline gráfico de função fixa. A compatibilidade pode variar de acordo com o game. Mais informações serão divulgadas mais perto do lançamento da versão Beta. Fale para nós quais são os games com DirectX 8 e 9 que você está animado para saber sobre mods!
P: Como é possível injetar uma cena personalizada de volta no game? Todos esses novos objetos, fontes de iluminação. Eles precisam interagir com os personagens do engine do game/NPCs/gamers de alguma forma, mas como?
O engine do game envia comandos para o tempo de execução do DirectX, e são esses comandos que instruem a placa de vídeo a renderizar esses personagens NPCs/gamers corretamente. O RTX Remix intercepta esses comandos da aplicação antes de chegar à placa de vídeo e os altera com base nas vontades dos criadores do conteúdo, conforme expresso no kit de ferramentas RTX Remix.
P: O RTX Remix permitirá a integração do DLSS 2 e do FSR 2.1, ou o redimensionamento está limitado ao DLSS 3?
Atualmente, o RTX Remix é compatível com os recursos do DLSS 3, que inclui a geração de frames do DLSS, a super-resolução do DLSS (também conhecida como DLSS 2) e o NVIDIA Reflex.
Q: NVIDIA Remix surely seems wonderful news for the modding space, how broad will be its applicability? Will every game be able to support it, or will it be limited to just some chosen games?
Initially, we plan to ship with support for DirectX 8 and 9 games that utilize a fixed function graphics pipeline. Game compatibility may vary by title – more information will be provided closer to beta release. Definitely let us know which DirectX 8 and 9 games you are excited about modding!
Q: How is it possible to inject a modded scene back into the game? All these new objects, lighting sources. They need to interact with game engine/NPCs/player characters somehow, but how?
The game engine sends commands to the DirectX runtime, and it’s these commands which instruct the GPU to render these NPCs/Player characters correctly. RTX Remix intercepts those commands from the application, before they reach the GPU, and alters them based on the content creators desires, as expressed in the RTX Remix toolkit.
Q: Will RTX Remix allow the integration of DLSS 2 and FSR 2.1, or is the upscaling limited to DLSS 3?
Currently RTX Remix supports DLSS 3 features which includes DLSS Frame Generation, DLSS Super Resolution (aka DLSS 2), and NVIDIA Reflex.
P: E o desempenho bruto? Vocês fizeram um bom trabalho com o DLSS e o Ray Tracing, mas, como um gamer de FPS competitivo, eu me importo mais com o desempenho bruto.
O desempenho bruto também recebeu um aumento importante nesta geração! As placas de vídeo RTX Série 40 permitem games competitivos em 1440p a mais de 360 FPS. Estou jogando Valorant de forma consistente acima de 400 FPS a 1440p. Confira mais em nosso artigo que foi publicado hoje.
P: Um amigo meu, há algumas semanas, estava me contando como o NVIDIA Reflex é um recurso pensado para as placas de vídeo mais antigas, é verdade? Os modelos mais antigos têm mais vantagens?
As placas de vídeo mais antigas tendem a ter FPS mais baixo e latência mais alta, o que significa que há mais latência para o NVIDIA Reflex reduzir.
Por exemplo (não são dados reais):
Tanto as placas de vídeo antigas e as novas se beneficiam do NVIDIA Reflex. A economia de % apenas será maior na placa de vídeo mais antiga devido à latência base mais alta.
P: Quais seriam as vantagens de usar o NVIDIA NVENC em relação ao x264 mais tradicional?
O x264 é um codificador de software que funciona na CPU, enquanto o NVENC é um codificador de hardware que usa hardware dedicado em placas de vídeo NVIDIA. O x264 utilizará parte da CPU, deixando menos potência para executar seus games ou outras aplicações. O NVENC opera em uma parte independente da placa de vídeo, deixando a CPU e a placa de vídeo para renderizar o game e as aplicações. Assim, o NVENC permite maximizar o uso do seu hardware e obter mais FPS.
Além disso, os codecs de última geração, como o AV1, consomem muitos recursos e não podem ser executados em uma CPU típica. Porém, com o NVENC na GeForce RTX Série 40, é possível codificar perfeitamente o AV1 em até 8K60.
P: Alguma atualização do NVDEC? Ainda dependo do M1 ou do Quicksync para decodificação 4:2:2 de 10 bits.
A GeForce RTX Série 40 usa o mesmo NVIDIA Decoder que o da RTX Série 30, o NVDEC de 5ª geração. Não há suporte para decodificação 4:2:2 de 10 bits.
P: O ShadowPlay se beneficiará das melhorias do NVENC e da adição da codificação AV1?
O ShadowPlay foi atualizado para usar os codificadores duplos da GeForce RTX Série 40, permitindo que o ShadowPlay grave em até 8K60 HDR em HEVC. No momento, o AV1 não é compatível com o ShadowPlay.
P: Como é o aumento de desempenho do Blender e de outros pacotes 3D?
A GeForce RTX Série 40 é até 2x mais rápida, de geração em geração, em renderizadores off-line, como o Chaos V-Ray ou o Blender. E, combinada com o DLSS 3, é até 4x mais rápida em renderizadores em tempo real, como o Omniverse, o Unreal ou o Unity.
Acesse GeForce.com para saber mais sobre as placas de vídeo GeForce RTX Série 40 e sobre tudo o que anunciamos em nossa apresentação GeForce Beyond.