Seville, Spain
Seville, Spain
+(34) 624 816 969
La inteligencia artificial agente ha pasado de ser una promesa futurista a una realidad tangible que está transformando la forma en que las empresas automatizan procesos complejos. A diferencia de los chatbots tradicionales, los agentes de IA no se limitan a generar respuestas: ejecutan acciones de forma autónoma en nombre de los usuarios, interactuando con sistemas, tomando decisiones y completando tareas de múltiples pasos sin intervención humana constante.

Table of contents [Show]
Andrew McNamara, director de aprendizaje automático aplicado en Shopify, define a los agentes como sistemas que "pueden realizar acciones en nombre de los usuarios, no solo generar texto o responder preguntas". Su funcionamiento es continuo hasta que la tarea se completa, como demuestra Sidekick de Shopify, un agente proactivo para comerciantes.
Según Anthropic, los casos de uso más comunes de agentes de IA se concentran en ingeniería de software (aproximadamente la mitad), seguidos de automatización administrativa, marketing, ventas, finanzas y análisis de datos. Heath Ramsey, vicepresidente de ServiceNow, ejemplifica con la resolución de incidentes de TI: los agentes extraen datos contextuales, verifican políticas anteriores, aplican soluciones, actualizan registros y notifican al equipo.
Sin embargo, desarrollar sistemas agénticos exige un nuevo paradigma de pensamiento sistémico para evitar problemas como el indeterminismo, la saturación de tokens y las brechas de seguridad derivadas de los LLM, como la desalineación de agentes (cuando el modelo miente o inventa información para alcanzar un objetivo).
Anurag Gurtu, CEO de AIrrived, sostiene que "crear sistemas de agentes requiere una arquitectura fundamentalmente nueva, diseñada para la autonomía, no solo para la automatización". Los agentes necesitan un entorno de ejecución, un cerebro, manos, memoria y barreras de seguridad. A continuación, desglosamos los bloques de construcción clave.
En el núcleo de todo sistema agéntico se encuentra un modelo de razonamiento que realiza la planificación basándose en la solicitud del usuario, el contexto disponible y las capacidades existentes. Frank Kilcommins, director de arquitectura empresarial en Jentic, señala que algunos modelos son más adecuados que otros: "Buscamos modelos que parezcan agentivos", añade McNamara, "con la cantidad adecuada de llamadas a herramientas y que sigan instrucciones con firmeza".
Un agente necesita contexto: datos internos de la empresa, conocimiento institucional, políticas, indicaciones del sistema, datos externos, memoria de chats anteriores y metadatos del agente. Edgar Kussberg, director de producto de IA en Sonar, menciona fuentes como bases de datos, API, sistemas RAG, bases de datos vectoriales, sistemas de archivos y paneles internos. Las organizaciones están creando bases de conocimiento de agentes para organizar estos datos. Anusha Kovi, ingeniera de inteligencia empresarial en Amazon, observa que "la mayoría de los equipos combinan un almacén vectorial como pgvector con algo estructurado como un catálogo de datos o un grafo de conocimiento".
Para ser operativos, los agentes necesitan acceso de lectura y escritura a bases de datos, herramientas y API. Jackie Brosamer, directora de datos e IA en Block, destaca que "parte del trabajo más importante se está realizando para conectar la IA y los sistemas existentes". El sector se ha unificado en torno al Model Context Protocol (MCP) como conector universal. Ejemplos públicos incluyen el agente goose de código abierto de Block y el uso de MCP por Workato para flujos empresariales impulsados por Claude.

Contar con flujos de trabajo claramente documentados para procedimientos comunes es crucial. Ramsey enfatiza que "los agentes se coordinen a través de flujos de trabajo definidos para que la autonomía se amplíe de forma predecible y controlada". Kilcommins recomienda usar "definiciones de capacidades claras y legibles por máquina", como la especificación Arazzo de la OpenAPI Initiative.
A gran escala, los sistemas multiagente son necesarios. Gurtu explica que "en lugar de un agente generalista, a menudo se cuenta con equipos de agentes especializados: razonamiento, recuperación, acción y validación". Kovi añade que "se necesita una capa de orquestación para el ciclo planificar-ejecutar-evaluar", con componentes como LangGraph, CrewAI y Bedrock Agents. El protocolo A2A para comunicaciones entre agentes también será clave.
La seguridad es quizás el elemento más importante. Gurtu advierte: "Ya no se protege software que sugiere, se protege software que actúa". Kilcommins recomienda permisos claramente definidos para evitar escalada de privilegios. Kovi señala que "un agente decide en tiempo de ejecución qué consultar, por lo que no se pueden delimitar permisos de forma tradicional", y aboga por autorización justo a tiempo y barreras de seguridad en políticas de IAM, no solo en instrucciones de línea de comandos.
Incluso con seguridad avanzada, las acciones sensibles requieren aprobaciones humanas. Shopify adopta por defecto el "diseño con intervención humana" con puertas de aprobación. Brosamer afirma que "cualquier cosa que afecte a sistemas de producción necesita controles humanos", como en Moneybot de Cash App.
La creación de sistemas agénticos requiere pruebas rigurosas. Shopify realiza evaluaciones previas a la implementación usando pruebas humanas y simulaciones con evaluadores LLM. McNamara explica: "Una vez que tu evaluador coincide de forma fiable con los evaluadores humanos, puedes confiar en él a gran escala". Gurtu recomienda "tratar a los agentes como sistemas regulados, realizar cambios en entornos de pruebas y probar en simulaciones".
La observabilidad debe ir más allá de la monitorización tradicional para capturar por qué los agentes fallaron o eligieron ciertas acciones. Kussberg afirma: "La observabilidad debe integrarse desde el primer día. Se necesita transparencia en cada paso: indicaciones, llamadas a herramientas, decisiones intermedias y resultados finales".
Proporcionar datos mínimos y relevantes es fundamental para evitar saturar las ventanas de contexto. Brosamer señala que "la calidad de la salida de un agente está directamente ligada a la calidad de su contexto". En Block, mantienen archivos README claros y convenciones semánticas. Kussberg añade: "Los sistemas eficaces proporcionan a los agentes herramientas de descubrimiento versátiles y les permiten ejecutar bucles de recuperación hasta que determinan que disponen de suficiente contexto". Shopify utiliza entrega modular de instrucciones y contexto justo a tiempo.

No todo necesita ser 'agentificado'. Combinar LLM con MCP es ideal para situaciones novedosas, pero puede ser excesivo para automatización determinista. Kilcommins recomienda codificar el comportamiento determinista para dar estabilidad. Ramsey sugiere empezar por procesos de alta fricción como solicitudes de servicio o incorporación de nuevos contratados. Gurtu aconseja "empezar por las decisiones, no por las demostraciones" y limitar la autonomía: "Los agentes funcionan mejor como especialistas".
Shopify establece límites en la cantidad de herramientas (entre 20 y 50) y opta por una arquitectura de subagentes con herramientas de bajo nivel. McNamara recomienda "evitar las arquitecturas multiagente en las primeras fases". Otros consejos incluyen usar infraestructura abierta, pensar primero en API, mantener datos sincronizados con arquitecturas basadas en eventos, equilibrar acceso con control y mejorar continuamente para evitar la deriva de los agentes.
Los patrones de sistemas agénticos están empezando a consolidarse. Brosamer prevé "experimentos con marcos para estructurar fábricas de agentes que coordinen la producción de trabajo intelectual complejo, empezando por la programación". También se espera un mayor énfasis en nubes alternativas e inferencia en el borde para reducir latencia. Weil, de Akamai, afirma: "El futuro de la IA competitiva exige proximidad, no solo potencia de procesamiento".
En definitiva, construir sistemas basados en agentes es una tarea compleja que requiere una combinación de tecnologías novedosas, un enfoque de diseño similar a microservicios y medidas de seguridad. El diseño inteligente será lo que distinga los resultados exitosos de los proyectos piloto fallidos.
Fuente original: ComputerWorld. Análisis y adaptación por ForgeNEX.