La CPU recupera el protagonismo en pequeñas cargas de IA con los nuevos núcleos C1 de Arm y las instrucciones SME2
por Juan Antonio SotoJunto con los nuevos clústeres C1 de Arm, se ha introducido el nuevo conjunto de instrucciones SME2. Un conjunto presente en todos los nuevos núcleos que ha llegado para potenciar sus capacidades en inteligencia artificial. Aunque habitualmente la GPU es la opción ideal para grandes cargas de trabajo de IA, las nuevas CPUs C1 de Arm junto a SME2 ofrecen un mejor rendimiento en pequeñas cargas de trabajo de IA.
Ahora la CPU puede ejecutar pequeñas cargas de trabajo de IA con mayor rendimiento que la GPU
Con la ayuda de SME2 acelerar los procesos basados en IA es una realidad, consiguiendo multiplicar el rendimiento gracias a este conjunto de instrucciones junto con el rendimiento óptimo de estas CPUs C1 Series.
Arm ha puesto como ejemplo algunas de las tareas más habituales que se realizan de forma local en los dispositivos móviles. Entre ellas encontramos la generación de audio a partir de texto, donde usando SMD2 y KleidiAI se ha conseguido reducir de 27 a menos de 10 segundos el tiempo necesario para obtener el audio, esto supone un rendimiento 2,8 veces superior.

Con SME2 se consigue reducir la latencia en Whisper Base casi 5 veces
También ha ofrecido cifras asombrosas, como pasar de casi 1.500 ms de latencia a solo 315 ms en el reconocimiento de voz con Whisper Base, esto supone un incremento de rendimiento de 4,7 veces más, o lo que es lo mismo, necesitarás casi 5 veces menos tiempo para realizar esta tarea. Otra de las cifras ofrecidas por Arm ha sido en la generación de tokens, pasando de 84 hasta 398 T/s con Gemma 3, casi multiplicando por 5 gracias a SME2.
Esto se consigue gracias a estas instrucciones, donde se ha conseguido gracias a la multiplicación de matrices y vectores, a la vez que no es necesario la transferencia de información a otros aceleradores.

El soporte avanzado para multiplicación de matrices y vectores consigue aumentar el rendimiento en IA cuando se ejecuta en la CPU
SME2 consigue destacar como protagonista a la CPU en pequeñas cargas de inteligencia artificial, mejorando el rendimiento general en este tipo de tareas.
Fin del Artículo. ¡Cuéntanos algo en los Comentarios!




