NVIDIA RTX 4080/4090 to Launch by September, Chiplet Based Hopper Delayed to 2024
As placas gráficas da série GeForce RTX 40 de última geração da NVIDIA (codinome Ada Lovelace) serão lançadas em setembro . Isso foi confirmado pelo renomado informante Greymon55 no outro dia. Em linha com os lançamentos anteriores da GeForce, o RTX 4090/4080 e possivelmente o RTX 4070 chegarão em agosto ou setembro, seguidos pelo RTX 4060 em algum momento da temporada de festas. Estranhamente, porém, as GPUs GH202 baseadas em chiplet foram adiadas para 2024, indicando que elas alimentarão a linha da série RTX 50.
Em contraste com os rumores anteriores, isso indica que a próxima geração de GPUs de consumo e HPC será alimentada pela microarquitetura Lovelace e fabricada no nó de processo EUV de 5nm da TSMC.
GPU | TU102 | GA102 | AD102 | GH202 |
---|
Arch | Turing | Ampere | Ada Lovelace | Hopper |
Process | TSMC 12nm | Sam 8nm LPP | TSMC 5nm | 3nm? |
GPC | 6 | 7 | 12 | ~20 |
TPC | 36 | 42 | 72 | ~140 |
SMs | 72 | 84 | 144 | ~300 |
Shaders | 4,608 | 10,752 | 18,432 | ~36,000? |
TFLOPs | 16.1 | 37.6 | 90 TFLOPs? | 150 TFLOPs+ |
Memory | 11GB GDDR6 | 24GB GDDR6X | 24GB GDDR6X | 32GB GDDR7? |
Bus Width | 384-bit | 384-bit | 384-bit | 512-bit |
TGP | 250W | 350W | 600W? | 600W+ |
Launch | Sep 2018 | Sep 20 | Aug-Sep 2022 | 2024 |
Para as GeForce RTX 4080 e 4090 baseadas em Ada Lovelace, estamos olhando para o dobro do desempenho das peças Ampere contemporâneas, com uma
contagem de núcleos FP32 de até 18.432 . Há rumores de que o carro-chefe AD102 apresentará 144 SMs distribuídos em 12 GPCs. Isso resulta em um
ganho de 71% no desempenho bruto de computação (66 TFLOPs) em relação ao GA102. Acrescente a isso o fato de que o Team Green está aproveitando o nó de processo N5 avançado da TSMC para Lovelace, e o aumento de frequência resultante deve gerar um ganho de ~ 2,2x sobre o RTX 3090.
A largura do barramento do RTX 4080 e 4090 deve ser a mesma de seus antecessores (384 bits e 320 bits), combinada com chips GDDR6X mais rápidos, resultando em uma largura de banda de memória ainda maior. O RTX 4090 deve conter até 24 GB de memória GDDR6X e velocidades de clock que rivalizam com as peças Navi 31 (2,3-2,5 GHz). Quanto ao rendimento geral do desempenho, estamos analisando cerca de 90 TFLOPs de desempenho do FP32, um grande avanço em relação aos 36 TFLOPs do 3090.
Se o AD102 incluir um total de 18.432 núcleos, podemos esperar aproximadamente
16.000 núcleos no RTX 4080 e 18.000 no RTX 4090 . De acordo com Greymon e Kopitekimi,
o RTX 4080/4090 consumirá até 600W de potência sob carga . Isso apesar do uso de um dos nós de processo mais avançados e eficientes do planeta. No entanto, executar os números meio que soma.
O carro-chefe AD102 deverá apresentar 144 SMs/12 GPCs, um ganho de 71% em termos de lógica em comparação com o GA102. Mesmo que o nó N5 da TSMC seja 30% mais eficiente em termos de energia do que o nó LPP de 8 nm da Samsung, estamos observando um aumento de pelo menos 80% nas unidades de hardware.
Isso deve resultar facilmente em um consumo de energia de pelo menos 30 a 50% a mais do que as ofertas RTX 3080/3090 Ampere de ponta.