Seville, Spain
Seville, Spain
+(34) 624 816 969
Meta ha dado un paso estratégico que redefine el equilibrio de poder en la infraestructura de inteligencia artificial. La compañía anunció una alianza con Amazon Web Services (AWS) para integrar “decenas de millones” de núcleos del procesador Graviton5 en su ecosistema computacional, con la posibilidad de expandir esta capacidad conforme evolucionen sus cargas de trabajo de IA. Este movimiento no solo posiciona a Meta como uno de los mayores clientes de Graviton a nivel global, sino que también refleja una tendencia más profunda: la CPU está recuperando un rol protagónico en la era de la IA agente.

Table of contents [Show]
Hasta ahora, la narrativa dominante en IA se centraba en las GPU como motor de entrenamiento de modelos de lenguaje a gran escala (LLM). Sin embargo, la IA agente —caracterizada por tareas de razonamiento en tiempo real, procesos de múltiples pasos y generación de código— exige una arquitectura más equilibrada. Los procesadores Graviton5, basados en la arquitectura ARM y fabricados con 192 núcleos por chip, están diseñados para gestionar “miles de millones de interacciones” y coordinar flujos agentivos complejos, según AWS. Esto los convierte en el complemento ideal para las GPU, asumiendo funciones de orquestación, gestión de memoria y programación.
Matt Kimball, vicepresidente y analista principal de Moor Insights & Strategy, señala que “en realidad se trata del control del sistema de IA, no solo de la escala”. En su opinión, a medida que la IA evoluciona hacia cargas de trabajo persistentes y dependientes del estado, la CPU actúa como el plano de control que permite que los aceleradores funcionen de manera eficiente. “Esto es especialmente cierto en entornos de tipo agente, donde las cargas de trabajo serán menos lineales y más dependientes del estado”, añade.
El acuerdo con AWS no es un movimiento aislado. Meta ha tejido una red de alianzas con prácticamente todos los grandes proveedores de chips: Nvidia, AMD, Arm, y ahora AWS. Además, desarrolla internamente su propio chip acelerador MTIA, del cual ha anunciado cuatro nuevas generaciones. Esta diversificación responde a una premisa clara: “ninguna arquitectura de chip única puede atender de manera eficiente todas las cargas de trabajo”, como afirma la propia Meta.
Kimball compara esta estrategia con la construcción de un sistema heterogéneo, donde no se busca un único ganador, sino una combinación optimizada. “Nvidia sigue dominando el entrenamiento y gran parte de la inferencia, mientras que AMD está adquiriendo cada vez más relevancia a gran escala. ARM proporciona control arquitectónico, y Graviton5 encaja como una capa de computación de propósito general optimizada en coste y eficiencia”, explica.

Una de las preguntas que surgen es si Meta aspira a convertirse en un proveedor de computación. Kimball lo descarta: “Se trata más bien de la integración vertical de su propia pila de IA”. La compañía busca gestionar sus cargas de trabajo internas con mayor eficiencia y, al mismo tiempo, sentar las bases para ofrecer servicios de IA agente al mercado, como su modelo Llama a través de API.
Nabeel Sherif, director asesor principal de Info-Tech Research Group, plantea la cuestión clave: “¿Qué van a hacer con toda esta capacidad?”. Según él, la respuesta tiene dos vertientes: respaldar la experimentación interna y preparar el terreno para servicios externos. “Aún no está claro cómo serán esos servicios, pero será interesante ver cómo se desarrollan”, comenta.
Desde una perspectiva de costes, la inferencia persistente —especialmente en sistemas agentivos— cambia la economía computacional. Ya no se trata solo de maximizar los FLOPS, sino de optimizar el coste total de propiedad (TCO). Las CPU como Graviton5 están bien posicionadas para aquellas partes de la carga de trabajo que no requieren aceleradores, pero que deben ejecutarse de forma continua. “A la escala de Meta, incluso pequeñas mejoras de eficiencia por carga de trabajo se acumulan rápidamente”, subraya Kimball.
La señal para los profesionales de TI es inequívoca: la pila de IA se está volviendo más heterogénea, no menos. Las empresas verán un acoplamiento más estrecho entre CPU, GPU y aceleradores especializados, con cargas de trabajo distribuidas según su comportamiento (prellenado frente a decodificación, sin estado frente a con estado, ráfaga frente a persistente).
Kimball concluye: “La implicación es que las decisiones sobre la infraestructura deben tener más en cuenta las cargas de trabajo. No se trata tanto de ‘¿qué nube?’ como de ‘¿dónde se ejecuta esta parte específica de la aplicación de la forma más eficiente?’”. Este enfoque resuena con las lecciones de apagones digitales y la necesidad de resiliencia, así como con la tendencia hacia modelos de nube privada que ofrecen mayor control.

Meta está construyendo una infraestructura que no solo escala, sino que se adapta a la naturaleza cambiante de la IA. La alianza con AWS es un recordatorio de que, en la era de los agentes autónomos, la CPU no es un actor secundario, sino un componente crítico del ecosistema. Para las empresas que buscan adoptar IA agente, la lección es clara: la heterogeneidad arquitectónica y la optimización por carga de trabajo serán factores determinantes para el éxito.
Como ya exploramos en nuestra guía de arquitectura de agentes de IA, la clave está en diseñar sistemas que combinen eficientemente diferentes tipos de procesadores. Meta, con su enfoque diversificado, está marcando el camino.
Fuente original: ComputerWorld. Análisis y adaptación por ForgeNEX.