AMD XDNA2 da forma a una nueva generación de ordenadores IA

AMD XDNA2 da forma a una nueva generación de ordenadores IA

por Javier Rodríguez

De dónde venimos, AMD XDNA

AMD diseño XDNA con el mismo objetivo que AMD XDNA2, es decir, ahorrar energía en aplicaciones basadas en operaciones típicas de modelos de datos para inteligencia artificial. El objetivo siempre ha sido disponer de un modelo de cálculo en paralelo, de programación sencilla, capaz de ahorrar energía en estos procesos. Sin duda orientada a procesadores en entornos donde el consumo es un factor importante, no solo por la autonomía sino también por la gestión del calor.

En principio centrada en procesadores para ordenadores portátiles o los cada día más apreciados formatos MiniPC, han acabado llegando también a procesadores más orientados a sistemas sobremesa siempre en la misma combinación de SOC con potente CPU, GPU de grandes prestaciones y NPU para la descarga de operaciones de IA.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 1

En términos técnicos, AMD XDNA incorpora una arquitectura de matriz de puertas programables en campo (FPGA), que permite la reconfiguración dinámica de hardware para adaptarse a distintas cargas de trabajo. Esta capacidad de reprogramación en tiempo real ofrece una flexibilidad sin precedentes, permitiendo a los desarrolladores optimizar el rendimiento para aplicaciones específicas, desde inteligencia artificial y aprendizaje automático hasta procesamiento de datos y gráficos avanzados.

Además, AMD XDNA utiliza técnicas avanzadas de gestión de energía, integrando múltiples niveles de control de voltaje y frecuencia para ajustar el consumo energético en función de la carga de trabajo. Esto no solo mejora la eficiencia energética, sino que también prolonga la vida útil del hardware al reducir el estrés térmico y eléctrico.

Otra característica técnica notable es la integración de aceleradores específicos dentro de la arquitectura XDNA, los cuales están diseñados para tareas computacionalmente intensivas. Estos aceleradores pueden incluir unidades de procesamiento de gráficos (GPU), unidades de procesamiento de inteligencia artificial (AI), y otros componentes especializados que trabajan en conjunto para ofrecer un rendimiento superior.

En resumen, la tecnología XDNA de AMD combina configurabilidad, eficiencia energética y aceleración específica para ofrecer una solución de procesamiento altamente adaptable y potente, adecuada para una amplia gama de aplicaciones tecnológicas modernas.

NPU con la eficiencia como piedra angular

Sin duda choca bastante que parece que los SOC “Strix Point” de AMD son sus CPUs más complejas, con más aporte de hardware que, por ejemplo, los nuevos Ryzen 9000 de sobremesa. Esto tiene una explicación clara, se busca la eficiencia en cada tarea que ejecuta el procesador, también las relacionadas con IA local.

Una CPU de sobremesa cuenta con más potencia, más núcleos de rendimiento, más frecuencia de trabajo y también un gran número de instrucciones habitualmente relacionadas con IA y en la gran mayoría de casos una GPU que a día de hoy son mucho más potentes en estas tareas, pero no más eficientes. Un buen ejemplo lo tenemos en las Radeon 7900 GRE, una gran tarjeta para jugar, que también produce 92TOPS de potencia de proceso en modelos FP16, o una GeForce RTX 4070 Super que triplica esta potencia alcanzando los 284 TOPS en el mismo modelo de datos.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 2

En resumen, en un ordenador con una GPU de gama media o alta siempre tendremos mayor potencia de proceso para IA, pero seremos mucho menos eficientes. De hecho AMD ha medido esta eficiencia comparando sus procesadores con NPU, sin NPU y con una GPU dedicada y en las operaciones adecuadas su nueva NPU de segunda generación, basada en XDNA2, es un 35% más eficiente que las funciones clásicas de CPU cuando la GPU es solo un 8% más eficiente. La clave no es solo la velocidad de proceso, sino el consumo de energía y liberar las zonas menos eficientes del procesador de una tarea para la que no están especializadas.

Claves de la arquitectura de la nueva NPU basada en XDNA2

Esta generación de acelerador de IA integrado en los nuevos Ryzen AI de AMD trae importantes mejoras centradas no solo en las nuevas capacidades necesarias para añadir potencia de proceso sino también para ser mucho más eficiente en su ejecución. La clave es ahorrar energía en diseños de portátil cada vez más exigentes en tamaño, rendimiento y autonomía.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 3

La NPU de AMD se estructura en un diseño de baldosas más eficientes en la gestión de la memoria, con menor acceso y gestión por software, con un uso más eficiente también de la cache. El diseño permite una partición completamente flexible tanto en diseños donde el pool de operaciones tenga una gestión lineal, ejecutando una operación tras otra, o dividiendo la NPU en secciones capaces de ejecutar diferentes operaciones completamente en paralelo.

Esta generación añade 12 baldosas nuevas sobre el diseño anterior, para un total de 32, pero consigue aumentar el rendimiento en cinco unidades, pasando de 10 TOPs a nada menos que 50 TOPs (Teraflops por segundo).

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 4

Este nuevo diseño no es solo mucho más rápido, consiguiendo la NPU más rápida integrada en un procesador para entornos domésticos portátiles, sino que es además dos veces más eficiente en el uso de la energía que la generación anterior.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 5

La importancia del modelo de datos, AMD introduce el Block FP16 en sus nuevas NPU

Actualmente casi todas las aplicaciones de IA usan modelos de datos basados en una precisión de 16-Bit, siendo evidentemente más exigentes que las de 8-Bit. AMD ha introducido un nuevo modelo capaz de generar precisiones cercanas las de 16-Bit con las exigencias de proceso de las de 8-Bit, y la han denominado Block Floating Point o Block FP16.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 6

Ya se pueden entrenar los modelos más característicos con esta nueva tecnología de AMD y de hecho algunos como el Llama2-7B son capaces de producir rendimientos cercanos a los 8-Bit con precisiones superiores 99,9% con respecto a los generados nativamente en FP16. El rendimiento es superior, prácticamente el doble, con la ventaja adicional que ocupan menos, sensiblemente menos, que los entrenados con modelos FP16.

AMD no solo introduce nuevos modelos de datos, más eficientes, sino que además trabajan con los principales actores de esta revolución y no solo con entidades privadas, como Microsoft dentro de su iniciativa Copilot+ de ordenadores certificados para Windows 11 con IA, sino también en estándares completamente abiertos para que cualquiera pueda usar y aprovechar estas nuevas tecnologías de forma completamente transparente y con licencia de código abierto.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 7

Actualmente los nuevos Ryzen AI de tercera generación, de los cuales hemos hablado en este otro artículo, pueden ser usados incluso con su modelo Block FP16, en modelos muy extendidos como “Stable Diffusion XL Turbo”, o también en su implementación en “Llama2-7B” con hasta cinco veces más rendimiento que la NPU integrada en el Intel Core Ultra 7 155H.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 8

Ventajas de una NPU “local”

Aunque está claro que la revolución de la IA para el uso doméstico viene de la mano de la implementación de grandes modelos de datos basados en la nube también la aportación de proceso local tiene sus ventajas y de hecho el sentimiento de los fabricantes de hardware es que vamos a un modelo de IA hibrido.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 9

Un parte de la carga de trabajo sea local por dos razones fundamentales, aliviar el coste de los datacenter, algo que sin duda está en la mente de los principales actores y segundo por temas de seguridad, podemos mantener nuestra información a salvo en nuestro entorno personal o profesional.

No me cabe la menor duda, sobre todo cuando se disponga de modelos completamente estandarizados en APIs muy extendidas como DirectX o Vulkan, que estas técnicas de IA se aplicaran también a juegos punteros como ya se está haciendo en muchas aplicaciones de creación de contenidos, en modo de filtros o postproceso, donde este tipo de técnicas logran resultados excepcionales sin necesidad de ejecutar las cargas de proceso en la nube.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 10

Combinado con en un SOC para una solución completa

Aunque estamos seguros que con las semanas o los meses esta tecnología llegara a los entornos de sobremesa, normalmente en algún procesador AMD Ryzen 9000 de la serie G con gráficos RDNA 3.5 integrados, lo cierto es que esta tecnología de momento se circunscribe a los modelos de procesadores AMD Ryzen AI 365 y AMD Ryzen AI HX 370 que veremos en portátiles ultraligeros de nueva generación.

Geeknetic AMD XDNA2 da forma a una nueva generación de ordenadores IA 11

Estos procesadores englobados dentro del SOC con nombre en código “Strix Point” buscan la eficiencia en la ejecución de todo tipo de tareas modernas. Por un lado, balanceando juegos, computación y gráficos hacia una potente GPU que se ha evolucionado en esta generación precisamente a ser más eficiente en el uso de memoria y consumos y también con una nueva NPU más potente y eficiente en el uso de la energía.

Sa apoya también en nuevos núcleos Zen5 y Zen5c de bajo consumo para las tareas más comunes. Una combinación cuidada donde AMD quiere presentar un potente procesador que es versátil, rápido y potente, pero sobre todo cuidadoso con el uso de la energía y la necesidad de refrigeración lo que permite modelos de portátil con más autonomía y diseños más elegantes y estilizados.

En este sentido la NPU AMD XDNA2 no busca otra cosa que aportar esta misma idea en el proceso local de modelos de inteligencia artificial sobre una base unificada que soporta todas las tecnologías actuales de forma unificada.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Redactor del Artículo: Javier Rodríguez

Javier Rodríguez

Empecé a publicar artículos sobre los componentes de PC que pasaban por mis manos en 1999, al tiempo que era director técnico de la cadena de tiendas de informática Batch-PC. Me uní a Geeknetic como redactor jefe y responsable de laboratorio en 2005. El hardware es mi pasión, aunque en mi tiempo libre acostumbro a disfrutar de juegos de PC multijugador.

Nitro V16 Q4 2024 Banner