Nvidia RTX, un salto a la piscina del Raytracing sin mucha agua

por Javier Rodríguez 19/09/2018 11

Prestaciones técnicas de las nuevas RTX

Las primeras Geforce RTX serán un producto de transición entre dos tiempos, presente y futuro, pero como todo producto de transición no pone suficiente carne en el asador del futuro porque en el presente es donde están realmente los clientes. Nuevos chips gráficos más potentes, más rápidos, notablemente más caros y con algunas prestaciones añadidas interesantes pero que seguramente no vayan a cambiar el mundo del jugador actual.

La nueva arquitectura tiene mejoras notables, sin duda, una de las más efectivas es que es capaz de procesar instrucciones básicas tipo “integer”, con instrucciones de coma flotante de forma simultánea, una mejora importante sobre las generaciones anteriores. Conjuntamente con esta forma de proceso clásica se añade, prácticamente con el mismo tamaño que la unidad de coma flotante, una unidad de proceso “tensor” para aumentar de forma aritmética la capacidad de cálculo de operaciones de “machine learning” en la propia GPU.

Las GPU siempre han sido buenas en el cálculo de algoritmos complejos, por sus grandes unidades de cálculo de coma flotante y gran capacidad de proceso en paralelo. Con el añadido de unidades Tensor esta capacidad se magnífica, aunque, como ya os imagináis, no es la primera vez que una GPU integra este tipo de unidades de proceso. Volta, de la propia Nvidia, ya contaba con este tipo de capacidad.

El “Tensor Core” usa matrices de 4x4 bits que puede combinar, mediante multiplicación y acumulación, para realizar procesos muy eficientes de cálculo de coma flotante de tipo FP16 o FP32, que son los estándares modernos usados en todo tipo de aplicaciones científicas e industriales. La eficiencia de proceso de estas unidades en este tipo de operaciones no tiene comparación con ningún método anterior por su gran capacidad y eficiencia en el paralelismo. Turing consigue hasta 114 TFlops de cálculo FP16.

Nvidia ha potenciado también su sistema de cache logrando mejoras de hasta el doble de ancho de banda en su cache de primer nivel y memoria compartida. Ahora se usan dos unidades de carga y grabado en paralelo donde cada unidad dispone de una combinación de hasta 32KB de cache de primer nivel y 64KB de memoria compartida. Todas estas unidades acaban en una cache de segundo nivel, compartida, de 6MB, el doble que la anterior generación.

Se reducen latencias en L1, se dobla la capacidad de L2, se aumenta la capacidad de L1 hasta casi 3 veces y se aumenta el ancho de banda. Todo esto se traduce en un rendimiento superior de su sistema de cache que, combinado con las nuevas memorias, consigue nuevos niveles de ancho de banda en estos nuevos chips.

Esta generación introduce el uso de memoria GDDR6 con hasta 7GHz de frecuencia de trabajo montadas en una configuración de 352-Bit que logra una velocidad teorica máxima de 14Gbps que logran un ancho de banda real superior a los 600GBps.

Los tres nuevos modelos

La gama Turing tiene tres opciones desde su lanzamiento: Geforce RTX 2070, Geforce RTX 2080 y Geforce RTX 2080ti. Comparten arquitectura, pero tienen prestaciones diferenciadas. Nvidia busca que los datos se centren en sus nuevas unidades de proceso de Raytracing, de las que hablaremos ahora, pero ciertamente tienen grandes diferencias también en otros elementos clave. En la siguiente tabla tenéis los datos básicos:

Datos básicos a los que hay que añadir que la Geforce RTX 2070 tiene una capacidad Raytracing limitada, con solo 45 billones de operaciones RTX, que en la Geforce RTX 2080 alcanzan hasta 60 billones y en la Geforce RTX 2080Ti alcanza todo su potencial con un máximo de 78 billones de operaciones.

Para mi otra característica técnica importante que se introduce en esta generación es que por fin Nvidia introduce el primer conector USB-C con modo alterno en una tarjeta gráfica. Este conector permitirá dar vida a nuevas generaciones de sistemas de realidad virtual ya que no solo ofrece conectividad de vídeo 8k, mediante el estándar Displayport 1.4a, sino que además proporciona hasta 27w de alimentación por el mismo conector y, por si fuera poco, conectividad USB 3.1. Todo en un mismo conector, un solo cable a las gafas VR o a cualquier monitor con menor consumo que el que proporciona.

Este nuevo conector es una gran novedad, pero también lo es el nuevo interfaz NVLink que da vida a un sistema SLI más potente que en cualquier otra generación y con capacidad para mostrar imagen en sistemas Surround 4k a 144Hz con HDR o resoluciones de hasta 8k con HDR. El Nvlink se introdujo primero en las soluciones Tesla de Nvidia, ahora llega al mercado doméstico. Permite cinco veces más rendimiento que el interfaz SLI clásico, alcanzando los 100GBps en esta generación Turing.

Lo importante: Raytracing en renderizado hibrido y DLSS

En cada lanzamiento de gráficas los fabricantes nos muestran un montón de bondades de las cuales muchas nos pasan desapercibidas o simplemente no acaban teniendo una implantación en el mercado por parte de los desarrolladores. Por eso yo en esta editorial, previa a nuestro análisis detallado del Geforce RTX 2080ti, me he centrado en las dos prestaciones que seguramente veremos en juegos y que tendrán cierto impacto en el jugador.

Por un lado, Nvidia introduce un nuevo sistema de filtrado de antialiasing que supera de forma sustancia al clásico método TAA gracias al uso de las unidades “tensor” de la tarjeta. Estas unidades aprovechan su capacidad de cálculo para mejorar la calidad, incluso en ultra alta definición, y aumentando el rendimiento en algunos de sus modos.

El DLSS 2x, por ejemplo, ofrece más rendimiento en las gráficas Turing que un filtro TAA 4x con mejor calidad de imagen en cualquier situación. También cuenta con un modo “supersampling” 64x que no mejorará el rendimiento pero que potencia de forma notable la calidad de imagen.

El Raytracing que introduce Nvidia en esta generación esta todavía a años de poder ser una solución directa. Es decir, no veras juegos completamente renderizados mediante técnicas de Raytracing en el medio plazo porque incluso con los 100TFlops de capacidad de cálculo de estas tarjetas, esta capacidad es del todo insuficiente.

Lo que disfrutaremos es de una solución híbrida donde las técnicas de Raster clásicas se potencian con sombreado asistido por Raytracing. El uso de estas técnicas, mediante API estandarizados, será una realidad en los mejores juegos que están por salir al mercado, pero también tendrá un impacto grande en el rendimiento de estas tarjetas.

Es una demostración básica del futuro, un futuro brillante donde los juegos se podrán comparar con la calidad cinematográfica de las mejores producciones de Hollywood, pero, por desgracia, un futuro que aún está muy lejos de ser real y más aún para el usuario doméstico.

Nvidia ya no es tan eficiente

En los modelos de referencia nuevos, con el doble ventilador, Nvidia presume de ofrecer un PCB con un sistema de alimentación mucho más afinado, de 8 fases, capaz de suministrar los 250-260w que consumen estas gráficas (la Geforce RTX 2080ti). Este nuevo sistema de ventilación, menos ortodoxo que en generaciones anteriores, también presume de producir mucho menos ruido bajo carga, alrededor de los 32dBA frente a los 38dBA que tenían como limite los modelos con turbina.

La realidad es que estas gráficas son notablemente más calientes que las generaciones anteriores. Su proceso de fabricación de 12nm no es el que Nvidia hubiera deseado para esta generación, pero los problemas con su desarrollo, ya que es una arquitectura notablemente compleja, no ha permitido en tiempo y forma mejorar el proceso a 7-10nm. Esto se ha traducido en que Nvidia no ha podido mantener el ratio de consumo a los que nos tenía acostumbrados en generaciones anteriores.

A pesar de ello, gracias al nuevo sistema de alimentación más afinado, Nvidia proporciona 20w extra de alimentación, que se traducirán también en más calor a disipar, llegando hasta los 50w de margen para overclocking. En buenas manos, con la refrigeración adecuada y el PCB adaptado, puede traducirse en excelentes niveles de overclocking que se combinan con nuevas utilidades capaces de desarrollar todo el potencial de nuestra tarjeta con solo pulsar un botón.

Poniendo coto al overclocking

Nvidia también pondrá coto al overclocking de fábrica, al menos inicialmente, así que probablemente no veremos gráficas personalizadas más rápidas que las propias Founder Edition de Nvidia, que como habéis visto antes en la tabla de prestaciones, son sensiblemente más rápidas que las versiones de referencia que Nvidia ha proporcionado a los diferentes integradores.

Esta diferenciación de overclocking se realiza por hardware, identificando los chips, y se usa en el nuevo sistema de overclocking de un clic que Nvidia ha desarrollado para estas tarjetas. No tendrán menos capacidad de overclocking pero Nvidia busca tenerlas identificadas de alguna forma y para algún motivo que aún no han terminado de aclarar.

A pesar de esto Nvidia sigue concienciada con el usuario que hace overclocking y los diseños de referencia, por no hablar de los personalizados, dispondrán de sistemas de alimentación digital más avanzados que ofrecerán excelentes niveles de overclocking para la GPU.

Un precio para una transición lenta

Este es seguramente el relevo donde Nvidia ha podido invertir más tiempo, las Geforce GTX 1080 salieron hace casi dos años y medio y realmente no parecía que Nvidia tuviera mucha prisa sobre todo por culpa de no tener una competencia que realmente pudiera hacer daño a su gama actual de productos. AMD lanzo el año pasado las nuevas Vega, excelentes graficas para minar criptomonedas, pero menos efectivas para jugar.

Luego llego la última fiebre de la minería y ciertamente ninguno de los dos fabricantes ha dado abasto hasta que la fiebre se terminó por la bajada de precio de estas mismas monedas y por la incorporación de ciertos ASIC de minado muy especializados. Ahora se encuentran con una producción cuya venta se ha parado en seco y un importante stock de GPUs aun por vender.

Todo esto nos lleva a los precios de las nuevas RTX, los precios de lanzamiento más elevados hasta la fecha en una GPU para uso doméstico, y a la necesidad que tiene Nvidia de que sus productos Turing y Pascal puedan convivir hasta que los stocks se reduzcan. No tiene competencia, se lo pueden permitir.

Las nuevas gráficas son rápidas, pero una Geforce RTX 2080, aparte de sus prestaciones renovadas, no ofrece más de un 5% de rendimiento sobre una Geforce GTX 1080Ti y cuesta más de 150 Euros más. La RTX 2070 queda por debajo de estas, con un precio similar y la Geforce RTX 2080ti tiene un precio tan elevado que quedara para la colección de Youtubers famosos que juegan al fortnite en monitores 1080p144.

También está por ver que uso real darán los jugadores a la renderización híbrida con Raytracing, que es bella pero no impactante salvo en la tasa de FPS. Sumemos otros factores como el mayor consumo, que no permitirá soluciones compactas como hasta ahora y una gama media por llegar en 2019 que huele a refrito de pascal sin estas nuevas prestaciones añadidas. Con todo esto yo me pregunto, ¿Estamos ante el primer fracaso de Nvidia en muchos años?

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!