Sevilla, España
Sevilla, España
+(34) 624 816 969
La carrera por la inteligencia artificial agente se ha convertido en un sprint, y Meta no escatima en recursos para asegurar su posición. La compañía ha anunciado un acuerdo estratégico con Amazon Web Services (AWS) para integrar 'decenas de millones' de núcleos AWS Graviton5 en su infraestructura, con la opción de expandir esta capacidad según crezcan sus necesidades de IA. Esta operación posiciona a Meta como uno de los mayores clientes de Graviton a nivel global, un movimiento que complementa sus alianzas con Nvidia, Arm, AMD y su desarrollo interno de chips.

Tabla de contenidos [Mostrar]
Las GPU han sido el pilar del entrenamiento de modelos de lenguaje a gran escala (LLM), pero la IA agente demanda cargas de trabajo radicalmente diferentes. Las CPU como Graviton5 están diseñadas para manejar tareas intensivas como razonamiento en tiempo real, procesos multi-paso, generación de código e investigación profunda. AWS destaca que Graviton5 puede gestionar 'miles de millones de interacciones' y coordinar tareas agentivas complejas, gracias a su integración con el sistema AWS Nitro, que garantiza alto rendimiento, disponibilidad y seguridad.
Matt Kimball, vicepresidente de Moor Insights & Strategy, subraya que 'en realidad se trata del control del sistema de IA, no sólo de la escala'. A medida que la IA evoluciona hacia cargas de trabajo persistentes, la CPU actúa como plano de control, orquestando la memoria, la programación y otras tareas intensivas en los aceleradores. 'Esto es especialmente cierto en entornos de tipo agente, donde las cargas de trabajo serán menos lineales y más dependientes del estado', añade. Garantizar el suministro de estos recursos es, por tanto, una decisión estratégica.
Meta denomina a esta estrategia como un 'enfoque diversificado' hacia la infraestructura. Como la propia compañía afirma, 'ninguna arquitectura de chip única puede atender de manera eficiente todas las cargas de trabajo'. Para demostrarlo, Meta ha anunciado recientemente cuatro nuevas generaciones de su chip acelerador MTIA, un acuerdo con AMD para acceder a 6 GW de CPU y aceleradores, una colaboración plurianual con Nvidia para millones de GPU Blackwell y Rubin, y es uno de los primeros grandes clientes de CPU de Arm.

Nabeel Sherif, director asesor principal de Info-Tech Research Group, plantea la pregunta clave: '¿Qué van a hacer con toda esta capacidad?'. Más allá de respaldar la experimentación interna, Meta sienta las bases para ofrecer servicios de IA agente, como su modelo Llama como API. 'Aún no está claro cómo serán esos servicios, pero será interesante ver cómo se desarrolla', comenta Sherif. Esta capacidad permitirá una diversidad de casos de uso y experimentación en diversas arquitecturas, algo crucial en un entorno con importantes limitaciones en la cadena de suministro.
Kimball insiste en que el acuerdo con AWS es 'sin duda alguna complementario'. Meta no abandona las GPU ni los aceleradores, sino que construye un sistema heterogéneo. 'Se trata de montar un sistema heterogéneo, no de elegir un único ganador. La heterogeneidad es fundamental para el éxito a largo plazo', afirma. En este ecosistema, Nvidia domina el entrenamiento y la inferencia, AMD gana relevancia a gran escala, Arm proporciona control arquitectónico, y Graviton5 ofrece una capa de computación de propósito general optimizada en coste y eficiencia.
¿Se está convirtiendo Meta en un proveedor de computación? Kimball no lo cree: 'Se trata más bien de la integración vertical de su propia pila de IA'. La medida permite gestionar cargas de trabajo internas de forma más eficiente y proporciona la base para exponer esa capacidad externamente, ya sea a través de API o asociaciones. Además, la economía de la IA está cambiando: con la inferencia persistente, especialmente en sistemas agenticos, el foco se desplaza de los FLOPS máximos al coste total de propiedad (TCO).

Kimball señala que las CPU como Graviton5 están bien posicionadas para partes de la carga de trabajo que no requieren aceleradores, pero que deben ejecutarse de forma continua. 'A la escala de Meta, incluso pequeñas mejoras de eficiencia por carga de trabajo se acumulan rápidamente', añade. Para los desarrolladores y departamentos de TI, la señal es clara: la pila de IA se está volviendo más heterogénea. Las empresas verán un acoplamiento más estrecho entre CPU, GPU y aceleradores especializados, con cargas de trabajo repartidas según su comportamiento.
La conclusión es que las decisiones sobre infraestructura deben centrarse en las cargas de trabajo. No se trata tanto de '¿qué nube?' como de '¿dónde se ejecuta esta parte específica de la aplicación de la forma más eficiente?'. En este contexto, la alianza Meta-AWS es un ejemplo de cómo la diversificación y la especialización se combinan para impulsar la próxima ola de innovación en IA.
Para profundizar en cómo la automatización y la IA están transformando los procesos empresariales, te invitamos a leer nuestro artículo sobre Automatización de procesos empresariales con n8n e IA. Además, si te interesa la ciberseguridad en entornos de IA, no te pierdas Claude Mythos revela 271 fallos en Firefox.
Fuente original: ComputerWorld. Análisis y adaptación por ForgeNEX.