nvidia geforce rtx 4080

NVIDIA GeForce RTX 4080, análisis

NVIDIA GeForce RTX 4080. Si tienes alguna inquietud recuerda contactarnos a través de nuestras redes sociales, o regístrate y déjanos un comentario en esta página. También puedes participar en el WhatsApp. Si usas Telegram  ingresa al siguiente enlace.

La tarjeta gráfica más ambiciosa que tiene NVIDIA actualmente ha puesto el listón muy alto. Durante nuestras pruebas la GeForce RTX 4090 nos demostró que es un auténtico monstruo dimensionado para entregarnos un rendimiento muy alto en cualquier escenario de uso. Incluso a 2160p, con la máxima calidad gráfica y el trazado de rayos activado.

En cualquier caso, estas dos tarjetas gráficas no están respaldadas únicamente por la microarqitectura Ada Lovelace; ambas se apoyan en la tecnología de reconstrucción de la imagen más avanzada que tiene actualmente NVIDIA: DLSS 3. Antes de meternos en harina, ahí va nuestra apuesta: estamos a punto de presenciar una batalla encarnizada entre la GeForce RTX 4080 y las Radeon RX 7900 XTX y XT de AMD. Podemos ir sacando las palomitas.

 4090 RTX 3090 TI 4080 RTX 3080 TI
ARQUITECTURAAda LovelaceAmpereAda LovelaceAmpere
TRANSISTORES76 000 millones2800 millones46 000 millones2800 millones
FOTOLITOGRAFÍA4 nm TSMC8 nm Samsung (tecnología de integración personalizada para NVIDIA)4 nm TSMC8 nm Samsung (tecnología de integración personalizada para NVIDIA)
NÚCLEOS CUDA168410 752972810 240
NÚCLEOS RT128 (ª generación)84 (2ª generación)76 (ª generación)80 (2ª generación)
NÚCLEOS TENSOR512 (4ª generación)6 (generación)04 (4ª generación)20 ( generación)
UNIDADES DE CÁLCULO (CU)128847680
FRECUENCIA DE RELOJ MÁXIMA2,52 GHz1,86 GHz2,51 GHz1,67 GHz
MEMORIA DEDICADA24 GB GDDR6X24 GB GDDR6X16 GB GDDR6X12 GB GDDR6X
BUS DE MEMORIA84 bits84 bits256 bits84 bits
VELOCIDAD DE TRANSFERENCIA DE LA MEMORIA1008 GB/s1008 GB/s75 GB/s912 GB/s
SHADER TFLOPS (FP2)9040494
OPERACIONES DE RASTERIZACIÓN192 ROP/s112 ROP/s96 ROP/s112 ROP/s
UNIDADES DE MAPAS DE TEXTURAS51260420
TASA DE TEXTURAS1290 Gtexeles/s625 Gtexeles/s761,5 Gtexeles/s52,8 Gtexeles/s
TASA DE PÍXELES48,8 Gpíxeles/s208, Gpíxeles/s240,5 Gpíxeles/s186,5 Gpíxeles/s
DLSStres232
RANURAS OCUPADAStres332
TEMPERATURA MÁXIMA DE LA GPU90 ºC92 ºC90 ºCºC
CONSUMO MEDIO450 vatios450 vatios20 vatios vatios
POTENCIA RECOMENDADA PARA LA FUENTE DE ALIMENTACIÓN850 vatios850 vatios750 vatios750 vatios
PRECIO2099,89 euros1576,84 eurosDesde 1469 euroseuros

La arquitectura Ada Lovelace de la GeForce RTX 4080, bajo nuestra lupa

NVIDIA no se ha andado con delicadezas a la hora de comunicar qué  representa para esta compañía la llegada de la arquitectura Ada Lovelace: un salto gigantesco en términos de rendimiento y eficiencia.

En cualquier caso, más allá de la apuesta por la tecnología de integración de 4 nm de TSMC en detrimento de la litografía de 8 nm de Samsung utilizada en la fabricación de los procesadores gráficos GeForce RTX, las nuevas GPU de NVIDIA nos entregan una nueva generación de núcleos RT y núcleos Tensor, así como más núcleos CUDA que nunca.

También llegan de la mano de frecuencias de reloj más altas e implementan tecnologías de procesado de la imagen más sofisticadas. Así se las gastan las brutales (y caras) GeForce RTX 40.

Más núcleos CUDA, y, además, llegan los núcleos RT

Los núcleos CUDA se responsabilizan de llevar a cabo los cálculos complejos a los que se enfrenta una GPU para resolver, entre otras tareas, la iluminación general, el sombreado, la eliminación de los bordes dentados o la física. Estos algoritmos se benefician de una arquitectura que prioriza el paralelismo masivo, por lo que cada nueva generación de GPU de NVIDIA incorpora más núcleos CUDA.

La arquitectura de los núcleos CUDA prioriza el paralelismo masivo, de ahí que cada nueva generación de GPU de NVIDIA incorpore más unidades de este tipo

Los núcleos RT (Ray Tracing), por otro lado, son las unidades que se encargan expresamente de asumir una gran parte del esfuerzo de cálculo que requiere el renderizado de las imágenes mediante trazado de rayos, liberando de este estrés a otras unidades funcionales de la GPU que no son capaces de llevar a cabo este trabajo de una forma tan eficiente. Son en gran medida responsables de que las tarjetas gráficas de las series GeForce RTX 20, 30 y 40 sean capaces de ofrecernos ray tracing en tiempo real.

Dejando a un lado los detalles más complejos, el motor OMM tiene el propósito de acelerar el renderizado mediante trazado de rayos de las texturas empleadas en la vegetación, las vallas y las partículas. El procesado de estos tres elementos representa un gran esfuerzo para la GPU, y el objetivo de este motor es, precisamente, aliviarlo. Por otro lado, el motor DMM se encarga de procesar las escenas que contienen una gran complejidad geométrica para hacer posible el renderizado en tiempo real mediante trazado de rayos.

Los núcleos Tensor evolucionan: llega la 4ª generación

Al igual que los núcleos RT, los núcleos Tensor son unidades funcionales de hardware especializadas en resolver operaciones matriciales que admiten una gran paralelización, pero estos últimos han sido diseñados expresamente para ejecutar de forma eficiente las operaciones que requieren los algoritmos de aprendizaje profundo y la computación de alto rendimiento. Los núcleos Tensor ejercen un rol esencial en la tecnología DLSS (Deep Learning Super Sampling), de ahí que tengan un claro protagonismo en la reconstrucción de la imagen mediante.

Según NVIDIA, la 4ª iteración de estos núcleos es mucho más rápida que su predecesora, logrando multiplicar su rendimiento por cinco en determinadas circunstancias. Un apunte interesante: el motor de transformación FP8 utilizado por primera vez por esta marca en estos núcleos para llevar a cabo cálculos con números en coma flotante de 8 bits procede de la GPU H100 Tensor Core diseñada por NVIDIA expresamente para los centros de datos que trabajan con algoritmos

El esfuerzo computacional que conlleva el renderizado en tiempo real de un fotograma mediante trazado de rayos es descomunal. Esta es la razón por la que cada nueva generación de procesadores gráficos no puede conformarse únicamente con introducir una cantidad mayor de las mismas unidades funcionales presentes en sus predecesoras.

La fuerza bruta importa, pero no es suficiente en absoluto. También es imprescindible elaborar estrategias que consigan abordar los procesos involucrados en el renderizado de una forma más inteligente. Más ingeniosa.

Las tecnologías ‘Shader Execution Reordering’ y ‘Ada Optical Flow Accelerator’ persiguen incrementar el rendimiento de la GPU abordando las tareas involucradas en el renderizado de la forma más eficiente posible

Este es el enfoque que pone sobre la mesa NVIDIA con las GPU GeForce RTX 40, y a nosotros nos parece la opción correcta. Precisamente las dos tecnologías en las que estamos a punto de indagar, conocidas como Shader Execution Reordering (SER) y Ada Optical Flow Accelerator, persiguen llevar a la práctica este propósito: incrementar el rendimiento de la GPU abordando las tareas involucradas en el renderizado que desencadenan un mayor esfuerzo computacional de la forma más eficiente posible.

La tecnología Shader Execution Reordering (SER) se responsabiliza de optimizar los recursos de la GPU reorganizando en tiempo real y de una manera inteligente los sombreadores (shaders), que son los programas que llevan a cabo los cálculos necesarios para resolver los atributos esenciales del fotograma que se está renderizando, como la iluminación o el color.

De alguna forma esta técnica lleva a cabo un procedimiento similar a la ejecución superescalar de las CPU, lo que, según NVIDIA, permite a la tecnología SER multiplicar por tres el rendimiento del renderizado mediante trazado de rayos, incrementando, por el camino, la cadencia de imágenes por segundo en hasta un 25%. No pinta nada mal.

Por otro lado, la tecnología Ada Optical Flow Accelerator tiene el propósito de predecir qué objetos se van a desplazar entre dos fotogramas consecutivos para entregar esa información a la red neuronal convolucional involucrada en la reconstrucción de la imagen mediante DLSS 3.

Según NVIDIA esta estrategia multiplica por dos el rendimiento de la anterior implementación de la tecnología DLSS, y, a la par, mantiene intacta la calidad de imagen. De nuevo, suena muy bien, pero los usuarios tendremos que ir comprobando poco a poco si realmente esta innovación está a la altura de las expectativas que está generando.

NVIDIA nos promete que las GeForce RTX 40 son más eficientes que las RTX

Una de las consecuencias de la adopción de la tecnología de  integración de 4 nm de TSMC frente a la litografía de 8 nm utilizada por  Samsung para fabricar las GPU de la familia GeForce RTX consiste en  que los últimos procesadores gráficos de NVIDIA deberían ser perceptiblemente más eficientes. Y sí, eso es precisamente lo que nos promete esta marca.

Según NVIDIA la temperatura máxima que alcanzan bajo estrés las GPU GeForce RTX 4090 y 4080 asciende a 90 ºC

La diapositiva que publicamos debajo de estas líneas describe la relación que existe entre la energía consumida y el rendimiento que nos entregan las GPU con arquitectura Turing, Ampere y Ada Lovelace. Y, efectivamente, esta última implementación gana por goleada a sus predecesoras. Aun así, no debemos pasar por alto las exigencias de las nuevas tarjetas gráficas de NVIDIA si nos ceñimos a su consumo eléctrico.

Según NVIDIA la temperatura máxima que alcanzan bajo estrés las GPU GeForce RTX 4090 y 4080 asciende a 90 ºC, pero el consumo medio de la RTX 4090 roza los 450 vatios, mientras que la RTX 4080 coquetea con los vatios. Por otro lado, NVIDIA sugiere que los equipos en los que va a ser instalada una RTX 4090 cuenten con una fuente de alimentación de 850 vatios o más, mientras que la RTX 4080 requiere una fuente de al menos 750 vatios.

DLSS multiplica por cuatro el rendimiento con ‘ray tracing’

La técnica de reconstrucción de la imagen empleada por NVIDIA recurre al análisis en tiempo real de los fotogramas de nuestros juegos utilizando algoritmos de aprendizaje profundo. Su estrategia es similar a la que emplean otros fabricantes de hardware gráfico: la resolución de renderizado es inferior a la resolución de salida que finalmente entrega la tarjeta gráfica a nuestro monitor.

El motor gráfico renderiza las imágenes a una resolución inferior a la que esperamos obtener, y después la tecnología DLSS escala cada fotograma a la resolución final

Un apunte interesante más: el procesado de los fotogramas en alta resolución y los vectores de movimiento se alimentan, según nos explica NVIDIA, de una red neuronal convolucional que analiza toda esta información y genera en tiempo real un frame adicional por cada fotograma procesado por el motor del juego.

Para concluir, ahí va otra promesa de esta compañía: DLSS puede trabajar en tándem con Unity y Unreal Engine, y durante los próximos meses llegará a más de juegos. De hecho, es posible habilitar esta técnica en poco tiempo en aquellos títulos que ya implementan DLSS 2 o Streamline.

La GeForce RTX 4080 Founders Edition, en detalle

El recinto de esta tarjeta gráfica es idéntico al de la GeForce RTX 4090. Las versiones Founders Edition de estas dos bestias miden  mm y acaparan nada menos que tres ranuras (61 mm) de la caja de nuestro PC. Por otro lado, la GeForce RTX 4080 tiene según NVIDIA un consumo medio de  vatios, por lo que esta marca nos sugiere que la alimentemos con una fuente que tenga al menos una entrega de potencia de 750 vatios.

En la siguiente fotografía de detalle podemos ver con claridad la salida de aire alojada junto a los conectores DisplayPort y HDMI. Esta tarjeta incorpora tres salidas DisplayPort  ideales para instalaciones multimonitor, y, al igual que las RTX, también tiene una salida HDMI que implementa la norma y que nos permite enviar la señal de vídeo a un televisor (lo ideal es que también sea compatible con este estándar para poder sacar partido a las prestaciones vinculadas a él).

El conector de alimentación de esta tarjeta gráfica es idéntico a la interfaz 12VHPWR que nos propone la GeForce RTX 4090. Durante las últimas semanas varios usuarios de esta última tarjeta gráfica han notificado a través de Reddit daños en este conector derivados de un posible sobrecalentamiento, pero durante nuestras pruebas nosotros no hemos identificado este problema ni en la GeForce RTX 4090 ni en la RTX 4080. Veremos cómo acaba este asunto.

Con el respaldo de DLSS esta tarjeta gráfica no se arruga ante ningún videojuego

La configuración de la plataforma de pruebas que hemos utilizado para evaluar el rendimiento de esta tarjeta gráfica es la siguiente: microprocesador AMD Ryzen 9 5950X con 16 núcleos (32 hilos de ejecución); dos módulos de memoria Corsair Dominator Platinum con una capacidad conjunta de 16 GB y una latencia de 18-19-19-39; una placa base ASUS ROG Crosshair VIII Hero con chipset AMD X570; una unidad SSD Samsung 970 EVO Plus con interfaz NVMe M.2 y una capacidad de 500 GB; y, por último, un sistema de refrigeración por aire para la CPU Corsair A500 con ventilador de rodamientos por levitación magnética.

Otro elemento muy importante de nuestra plataforma de análisis es el monitor que hemos utilizado en nuestras pruebas: un ROG Strix XG27UQ de ASUS equipado con un panel LCD IPS de 27 pulgadas con resolución 4K UHD y capaz de trabajar a una frecuencia de refresco máxima de 144 Hz. Esta veterana pantalla es una pieza habitual en nuestros análisis y nos permite sacar todo el jugo a cualquier tarjeta gráfica de última generación.

Todas las pruebas las hemos ejecutado con la máxima calidad gráfica implementada en cada juego o test y habilitando la API DirectX 12 en aquellos títulos en los que está disponible

Todas las pruebas las hemos ejecutado con la máxima calidad gráfica implementada en cada juego o test y habilitando la API DirectX 12 en aquellos títulos en los que está disponible. El modo de reconstrucción de la imagen que hemos seleccionado tanto en las tarjetas gráficas de NVIDIA como en las de AMD en aquellos juegos que implementan esta tecnología es el que prioriza el rendimiento. Y, por último, las herramientas que hemos utilizado para recoger los datos son FrameView, de NVIDIA; OCAT, de AMD; y FRAPS. Las tres están disponibles gratuitamente.

En ‘Control’, curiosamente, a 1080p la GeForce RTX 4080 nos entrega un rendimiento casi idéntico al de la RTX 4090. Sin embargo, como cabe esperar, a medida que se incrementa la resolución esta última va tomando ventaja. Aun así, la RTX 4080 se mantiene siempre por delante de la RTX 3090 Ti, y a 2160p y sin DLSS nos entrega una cadencia media de 50 FPS.

‘Death Stranding’ nos depara una sorpresa. Y es que a 1080p la GeForce RTX 4080 es ligeramente más rápida que la RTX 4090. A 1440p ambas tarjetas gráficas han arrojado en nuestras pruebas exactamente el mismo rendimiento, y a 2160p la RTX 4090 se desmarca y toma la delantera. Aun así, a esta última resolución la RTX 4080 nos entrega una cadencia media de más de 150 FPS sin necesidad de recurrir a la tecnología DLSS.

A pesar de su veteranía, el motor gráfico de ‘Final Fantasy XV’ sigue siendo duro de roer. No obstante, la GPU que estamos poniendo a prueba no se ha acobardado. Con la máxima calidad gráfica y a 2160p nos entrega más de 110 FPS sostenidos, por lo que este juego es muy disfrutable por muy exigentes que nos pongamos. Una vez más, la RTX 4080 consigue superar con claridad.

Como os hemos anticipado unos párrafos más arriba, el sistema de refrigeración que han puesto a punto los ingenieros de NVIDIA en las versiones Founders Edition de las GeForce RTX 40 cumple su cometido con eficacia. En la siguiente gráfica podemos ver que bajo estrés la RTX 4080 se mantiene por debajo de los 60 ºC, un valor muy razonable que contrasta con las temperaturas con las que coquetean las nuevas CPU de Intel y AMD. De hecho, disipa menos calor no solo que la RTX 4090, sino también la Radeon RX 6900 XT y la Radeon RX 6800 XT.

Para medir el nivel de ruido máximo emitido por cada tarjeta gráfica bajo estrés utilizamos nuestro sonómetro Velleman DVM805, y, como podéis ver en la siguiente gráfica, el nivel máximo arrojado por la GeForce RTX 4080 es muy similar al de la RTX 4090. Ambas tarjetas gráficas son un poco más ruidosas que las otras opciones con las que las hemos comparado, con la única excepción de la Radeon RX 6900 XT, que es, y con claridad, la más ruidosa de todas.

NVIDIA GeForce RTX 4080: la opinión de Xataka

El rendimiento de esta tarjeta gráfica es fabuloso. La tecnología de reconstrucción de la imagen DLSS es una aliada esencial en algunos juegos si pisamos el acelerador a fondo con la calidad gráfica y activamos el trazado de rayos, pero con otros títulos, como ‘F1 22’, logra entregarnos una cadencia sostenida superior a los 60 FPS a 2160p sin recurrir al DLSS. Y no es fácil lograrlo.

Las tecnologías de reconstrucción de la imagen van a quedarse, de eso no cabe la menor duda

Estamos preparando un análisis minucioso de la calidad de imagen que nos ofrece DLSS, pero podemos anticiparos algo: esta revisión supera con cierta claridad la calidad global de DLSS 2, que ya de por sí es muy buena. Y, como hemos comprobado en este análisis, su rendimiento es sobresaliente. Las tecnologías de reconstrucción de la imagen van a quedarse, de eso no cabe la menor duda, por lo que es una buena idea que tanto NVIDIA como AMD se esfuercen para refinarlas.

En lo que se refiere a su diseño, estabilidad y rendimiento no podemos poner ningún ‘pero’ a esta tarjeta gráfica. Lo que sí nos apena es que su precio la coloque fuera del alcance de tantos y tantos entusiastas de los videojuegos que podrían disfrutarla muchísimo, y que van a tener que conformarse con una solución gráfica más modesta. Veremos qué nos proponen las ‘hermanas pequeñas’ de esta GeForce RTX 4080 cuando estén listas. Y cuánto costarán. Crucemos los dedos.