NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento

NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento

por Juan Antonio Soto Comentarios

Ada Lovelace en números

NVIDIA ha lanzado su nueva generación de tarjetas gráficas RTX 40 Series, estas tarjetas incluyen las nuevas GPUs basadas en la arquitectura Ada Lovelace que promete de 2 a 4 veces más rendimiento que la anterior generación. Inicialmente NVIDIA ha lanzado 3 modelos para equipos de escritorio y un modelo para profesionales y creadores de contenido que tendrán que competir con las nuevas AMD Radeon RX 7000 Series y con las Intel Arc.

NVIDIA ha optado en esta ocasión por un proceso personalizado 4N realizado por TSMC. De esta forma ha conseguido pasar de un proceso anterior de 8 nanómetros para llegar a incluir hasta el triple de transistores en la GPU estrella AD102, un total de 76.300 millones de transistores en un área más pequeña que la anterior GA102.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 1

A pesar de que las CPUs actuales ya soportan la tecnología PCI Express 5.0, NVIDIA ha dado compatibilidad a esta nueva generación con PCI Express 4.0. Un estándar muy introducido en el mercado y que no obligará a cambiar de equipo si ya tienes uno reciente para aprovechar todo el potencial de esta nueva generación.

Veamos las características que destacan en esta nueva generación.

Arquitectura interna de Ada Lovelace

Para conseguir estas cifras, se ha aumentado el número de GPCs (Graphic Processors Cluster o Clusters de Procesadores Gráficos), TPCs (Texture Processors Cluster o Cluster de Procesadores para Texturas) y SMs (Streaming Multiprocessors o Multiprocesadores de flujo) en esta nueva arquitectura Ada Lovelace.

En la GPU más potente, la AD102, tenemos 12 GPCs presentes frente a los 7 de la anterior generación, también se ha aumentado el número de TPCs de 42 a 72 en esta nueva generación y los SMs han aumentado de 84 a 144. Todo esto hace posible un mayor número de núcleos CUDA, Tensor y RT.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 2

Dentro de cada GPC encontramos 6 TPCs con 2 Multiprocesadores de flujo (SMs). Cada SM incluye 4 Tensor Cores de cuarta generación y un RT Core de tercera generación junto con 128 KB de Caché L1. Esto consigue duplicar el rendimiento por vatio en comparación con la arquitectura Ampere.

El interior de cada SM no ha cambiado respecto a la generación anterior donde si vimos alguna novedad, se incluyen 4 unidades FP32 + INT32 y otras 4 unidades FP32 dedicadas. Un total de 8 unidades FP32 que ayudarán en ciertas tareas a trabajar de forma simultánea evitando cuellos de botella.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 3

Además, estos cambios en la arquitectura interna permiten a NVIDIA ofrecer nuevas tecnologías con esta generación RTX 40 que también ayudan a un mejor rendimiento y que hacen DLSS 3 una herramienta aún más potente cuando se usa con esta generación de gráficas NVIDIA.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 4

SER (Shader Execution Reordering)

Al activar el Raytracing en los juegos, hasta ahora las operaciones de sombreado entraban a los SMs de forma desordenada, simplemente se añadían las operaciones pendientes por orden. Para optimizar esta forma de renderizar, NVIDIA ha creado una tecnología que se podrá ejecutar gracias a esta nueva arquitectura, denominada SER o Shader Execution Reordering, que viene a ser algo así como reordenación de las tareas de sombreado.

Con esta tecnología lo que se pretende es llevar a los Multiprocesadores de flujo el trabajo de sombreado ya ordenado. Básicamente la gráfica se encargará mediante este nuevo sistema SER en reordenar estas cargas en lugar de entregarlas desordenadas, para que los núcleos RT de tercera generación y los núcleos Tensor de cuarta generación incluidos en cada SMs puedan aprovechar mejor los recursos y obtener un mejor rendimiento usando Raytracing. Hasta un 25% más de FPS con Raytracing activado y una eficiencia de hasta 2 o 3 veces superior.

Con esta tecnología se ha conseguido incrementar el rendimiento en aplicaciones optimizadas en hasta un 44% más en Cyberpunk Overdrive Mode, un 29% más en el nuevo Portal con RTX y un 20% más en Racer RTX. Esta tecnología SER está en su primera etapa y puede ser mejorada de cara a futuro para optimizar aún más los recursos. Utilizarla es muy sencilla, ya que únicamente requiere una API para poder aplicarla, eso sí, como limitación hardware deberás tener una NVIDIA RTX 40 Series.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 5

Micro Mallas Desplazadas

Crear objetos complejos con mucho detalle es una operación muy costosa, incluso con las más potentes tarjetas gráficas suponía un gran esfuerzo para la GPU. Para combatir este problema, NVIDIA ha creado esta tecnología llamada Micro Mallas desplazadas (Displaced Micro-Meshes).

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 6

Esta tecnología permite obtener figuras geométricas mucho más detalladas y complejas a la vez que son compactas para una mayor velocidad en el renderizado. Los objetos se componen de micro mallas que a su vez están compuestos de micro triángulos que ocupan muy poco espacio, de esta forma renderizarlos es mucho más eficiente creando imágenes más realistas y complejas que permitirá acelerar el trazado de rayos.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 7

La composición de figuras complejas y detalladas puede ser hasta 15 veces más rápida y 20 veces más pequeña.

Opacity Micro Masks

Junto con Displaced Micro-Meshes se ha presentado otra tecnología que, en conjunto, funcionan para optimizar aún más la creación y renderizado de imágenes complejas y detalladas de forma más eficiente. Utilizándolas en conjunto o por separado podremos obtener mayor rendimiento en trazado de rayos en tiempo real a la vez que se ofrece una mayor calidad de imagen, sobre todo en elementos muy detallados como la hierba.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 8

Esta tecnología complementa a la anterior, permitiendo mapear en triángulos y micro mallas los objetos más detallados. Gracias a Opacity Micro Masks se puede ofrecer trazado de rayos en elementos muy definidos como pueden ser las hojas de los árboles o la hierba. Esta tecnología ofrece un resultado más realista y de calidad con un mínimo coste en todos los objetos de la escena.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 9

Gracias a Opacity Micro Masks se pueden llenar el buffer de gráficos un 30% más rápido y así obtener imágenes hasta un 10% más rápido.

DLSS 3.0 la nueva generación de escalado de imágenes

 Con esta nueva arquitectura se ha introducido la versión 3.0 de DLSS que estará presente en una gran cantidad de juegos desde su lanzamiento. DLSS 3.0 será compatible desde las NVIDIA RTX 20, pero únicamente podrás usar la tecnología DLSS Frame Generator con hardware NVIDIA RTX 40 Series gracias a los nuevos núcleos Tensor y RT. Veamos ahora en que consiste DLSS Frame Generator.

Como breve introducción a DLSS 2.0, se generaban imágenes de menor resolución a la original y mediante inteligencia artificial se escalaba a la resolución de salida para obtener una mayor cantidad de imágenes. Al generar imágenes de menor resolución había que hacer un importante trabajo de escalado para llegar incluso a igualar la calidad de gráficos original, e incluso mejorarla.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 10

DLSS 3.0 funciona de la misma forma que DLSS 2.0 donde además han optimizado Super Resolution para obtener un incremento de rendimiento. Además, utilizando las RTX 40 Series, se pueden generar fotogramas completos mediante IA consiguiendo aumentar aún más el número de FPS respecto a DLSS 2.0.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 11

DLSS 3.0 a partir de imágenes del juego es capaz de crear fotogramas completos mediante IA. Esta técnica también permite analizar el movimiento de la imagen para crear unos fotogramas realistas teniendo en cuenta elementos como el vector de movimiento y profundidad.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 12

Esto es posible gracias a Optical Flow Acelerator que analiza imágenes y es capaz de obtener información de la imagen a nivel de cada píxel como reflejos, sombras e iluminación. DLSS 3 también analiza el vector de movimiento de la escena para determinar la dirección y profundidad del objeto.

Así la tecnología DLSS Frame Generator decidirá como utilizar esta información para la creación de estos fotogramas intermedios. DLSS Frame Generator utiliza tanta información como sea posible para generar la siguiente imagen de forma fiel, incluyendo los efectos representados en la escena.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 13

DLSS 3 es capaz de reconstruir hasta las 3/4 partes del primer fotograma gracias a DLSS Super Reloution y crear un segundo fotograma completo mediante IA. Un total de 7/8 reconstruidos de los píxeles reales que permite un aumento significativo del rendimiento.

Además, DLSS 3.0 incluye NVIDIA Reflex para sincronizar la CPU y la GPU eliminando las colas de renderizado, y ofreciendo una mínima latencia gracias al uso de marcadores que permitirán reflejar tus acciones en pantalla tan pronto como las realices.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 14

Para mostrar el rendimiento que ofrece DLSS 3.0 con estas tecnologías, NVIDIA ha mostrado una versión optimizada para esta nueva tecnología de Cyberpunk 2077. Desde una cifra de 22 FPS sin utilizar DLSS y con Raytracing activado, se ha conseguido aumentar la tasa de FPS a 98 con DLSS 3.0. Pero esto no es todo, la latencia también ha sido menor con DLSS 3.0 bajando desde los 166 ms hasta los 58 ms.

DLSS 3.0 es capaz de ofrecer un rendimiento de hasta 4 veces superior comparado con un renderizado tradicional. Pero recuerda, esto solamente funciona gracias a los Tensor Cores de cuarta generación junto con Optical Flow Acelerator presentes en las NVIDIA RTX 40 Series. Además, NVIDIA utiliza un superordenador para mejorar el entrenamiento de imágenes mediante IA.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 15

Rendimiento de las GPUs Ada Lovelace

NVIDIA ha especificado el rendimiento que ofrece esta nueva generación basada en Ada Lovelace respecto a la anterior generación Ampere. La NVIDIA RTX 4090 ofrece un rendimiento similar a 4 NVIDIA RTX 3090 Ti, de igual forma la NVIDIA RTX 4080 de 16 GB ofrece un rendimiento equivalente a 3 NVIDIA RTX 3080 Ti y el modelo de 12 GB tiene un rendimiento equivalente a tener 3 NVIDIA RTX 3080. Todo esto manteniendo los precios de la anterior generación.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 16

En juegos podemos obtener una cantidad muy superior de FPS utilizando las tecnologías que nos presenta esta nueva generación junto con el hardware dedicado de las nuevas NVIDIA RTX 40 Series. En juegos de tipo eSport podemos obtener una cantidad muy superior de FPS, hasta 300 FPS en Apex Legend o incluso 600 FPS en Fortnite, con una resolución de 1440p. Además, se consigue una menor latencia, inferior a 10 ms, que mejorarán tu tiempo de respuesta.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 17

Estas cifras ofrecen el doble de rendimiento en juegos y programas actuales si los comparamos con la anterior generación NVIDIA RTX 3090 Ti, pero esta cifra puede aumentar hasta 4 veces más de rendimiento cuando los desarrolladores comiencen a optimizar sus programas y juegos para esta nueva generación incluyendo todas las novedades que han presentado.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 18

Como podemos ver, el incremento en el rendimiento no es solo en juegos, también podemos aprovechar esta tecnología en programas para diseño y renderizado de imágenes. Ahora las NVIDIA RTX 40 Series incluyen NV Encoders Duales que permitirán reducir el tiempo de renderizado y una mejor experiencia cuando haces streaming de videojuegos, también compatible con el códec AV1 con un rendimiento superior al H.264.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 19

También podrás crear nuevos efectos y mejorar los existentes como añadir fondos virtuales o crear avatares reales con tus expresiones.

Pero para conseguir este incremento en el rendimiento, veamos qué novedades ofrece la arquitectura Ada Lovelace con su tercera generación de RT Cores para concurrencia y la cuarta generación de Tensor Cores, que ofrece hasta 5 veces el rendimiento de la anterior generación, para las tareas de IA como las del nuevo DLSS 3. Además, esta generación incluye nuevas tecnologías que ayudarán a ofrecer este rendimiento prometido por NVIDIA.

Ada Lovelace duplica el rendimiento de decodificación

Esta nueva generación ha añadido un segundo codificador de octava generación capaz de reducir el tiempo de exportación considerablemente. Ahora además son compatibles con AV1, un códec que ofrece un gran rendimiento y que está libre de pagos y que se está siendo adoptado por software como OBS, Blackmagic Design, DaVinci Resolve, etc. Esto ofrecerá una mejora en la transmisión de vídeo, ideal para streamers, a la vez que se podrán crear escenas realistas con todo tipo de efectos de forma más rápida.

Con AV1 y los NV Encoders duales de NVIDIA RTX 40 se consigue una eficiencia superior de hasta el 40% respecto a H.264. También es capaz de reducir el consumo de recursos hasta un 35%.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 20

Pero la verdadera ventaja de estos codificadores duales se nota a la hora de renderizar imágenes, reduciendo el tiempo hasta la mitad respecto a la anterior generación Ampere. También es capaz de grabar vídeos a 8K60 gracias a las dos unidades de codificación disponibles. Estas unidades duales de codificación también ayudan a DLSS a ofrecer mejor rendimiento de renderizado en tiempo real.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 21

NVIDIA RTX 40 Series

El fabricante especializado en tarjetas gráficas ha lanzado inicialmente 2 modelos para uso doméstico, aunque uno de ellos presenta dos variantes. NVIDIA ha decidido lanzar dos variantes de la RTX 4080, una con 16 GB de VRAM y otra con 12 GB de VRAM, aunque como veremos ahora esta no es la única diferencia. En total hay disponibles 3 tarjetas gráficas NVIDIA RTX 40, la NVIDIA RTX 4090, la NVIDIA RTX 4080 de 16 GB y la NVIDIA RTX 4080 de 12 GB.

NVIDIA RTX 4090

Esta NVIDIA RTX 4090 es la tarjeta tope de gama, aunque NVIDIA ha dejado puertas para un modelo superior que posiblemente veamos en un futuro como la NVIDIA RTX 4090 Ti. Incluye una GPU AD102 con una configuración de 16.384 núcleos CUDA, 512 núcleos Tensor y 128 núcleos RT. Cuenta con 24 GB de memoria GDDR6x cuyo ancho de banda es de 384 bits y su reloj base es de 2.230 MHz que puede alcanzar los 2.520 MHz. Su TDP es de 450 W alimentado con un único conector de 16 pines. El precio de lanzamiento para el modelo de referencia de NVIDIA es de 1.959 euros.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 22

NVIDIA RTX 4080 de 16 GB

La NVIDIA RTX 4080 de 16 GB cuenta con una GPU diferente al modelo de 12 GB, concretamente la AD103. Esta tarjeta dispone de 9.728 núcleos CUDA junto con 304 Tensor Cores y 76 RT Cores. Como su propio nombre indica, este modelo viene con 16 GB de VRAM y un bus de 256 Bits. Su reloj base es de 2.205 MHz, pero puede subir hasta los 2.505 MHz. En este modelo el TDP baja hasta los 320 W con una fuente de mínimo 700 W como recomendación. El precio de esta NVIDIA RTX 4080 de 16 GB es de 1.469 euros.

  NVIDIA RTX 4090 NVIDIA RTX 4080 16 GB NVIDIA RTX 4080 12 GB
GPU AD102 AD103 AD104
Núcleos CUDA 16.384 9.728 7.680
Frecuencia base 2.230 MHz 2.210 MHz 2.310 MHz
Frecuencia turbo 2.520 MHz 2.510 MHz 2.610 MHz
Memoria VRAM GDDR6x 24 GB 16 GB 12 GB
Ancho de banda de memoria 384 bits 256 bits 192 bits
TDP 450 W 320 W 285 W
Precio 1.959 euros 1.469 euros 1.099 euros
Disponible 12 de octubre Noviembre

NVIDIA RTX 4080 de 12 GB

Este modelo NVIDIA RTX 4080 con 12 GB de VRAM también cuenta con una configuración inferior a la de 16 GB. Con una GPU AD104, esta NVIDIA dispone de 7.680 núcleos CUDA, 240 Tensor Cores y 60 RT Cores. El modelo con 12 GB de VRAM GDDR6x tiene un bus de 192 bits. Esta NVIDIA RTX 4080 con 12 GB tiene un reloj base de 2.310 MHz que puede aumentar hasta los 2.610 MHz y su TDP baja hasta los 285 W. El precio de lanzamiento es de 1.099 euros.

Geeknetic NVIDIA Ada Lovelace: Así consiguen las RTX 40 mejorar el rendimiento 23

Pero además de estas completas prestaciones que nos ofrece la generación de gráficas basadas en Ada Lovelace, veamos que es capaz de ofrecer esta nueva arquitectura para obtener hasta 4 veces el rendimiento de la anterior Ampere.

Conclusión

Esta nueva generación de gráficos Ada Lovelace se ha centrado en ofrecer mayor rendimiento, sobre todo en escenas con Raytracing, para ofrecer unos gráficos de mejor calidad sin renunciar al rendimiento.

También ha llegado con la nueva generación de RT y Tensor Cores para aumentar los FPS gracias a DLSS 3.0 y su sistema para generar imágenes mediante IA. Imágenes realistas que tienen en cuenta la dirección y profundidad de los objetos, así como los efectos visibles en la escena que son analizados píxel a píxel para mayor precisión.

Gracias tecnologías como SER o Mallas Micro Desplazadas, únicamente disponibles con esta generación de gráficos Ada Lovelace, es posible este incremento en el rendimiento de hasta 4 veces más respecto a la generación anterior. Esto permite dar un paso más para obtener una calidad de imagen más fiel a la realidad y unas tasas de FPS superiores en tus juegos favoritos.

Pero NVIDIA no se ha olvidado de los creadores de contenido, con los Dual NV Encoders tardarás hasta la mitad de tiempo en tener listas tus escenas o incluso consumir menos recursos a la hora de transmitir tus directos.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Redactor del Artículo: Juan Antonio Soto

Juan Antonio Soto

Soy Ingeniero Informático y mi especialidad es la automatización y la robótica. Mi pasión por el hardware comenzó a los 14 años cuando destripé mi primer ordenador: un 386 DX 40 con 4MB de RAM y 210MB de disco duro. Sigo dando rienda suelta a mi pasión en los artículos técnicos que redacto en Geeknetic. Dedico la mayor parte de mi tiempo libre a los videojuegos, contemporáneos y retro, en las más de 20 consolas que tengo, además del PC.

Nitro 5 Banner