Parte II · LA ERA DE LOS GRANDES MODELOS

Los agentes de IA: del chatbot al actor autónomo

Capítulo 626 min de lecturaActualizado: junio de 2026

6.1Del modelo al agente

Es el paso del copiloto (que te asiste mientras trabajas) al empleado digital (digital worker) (a quien delegas la tarea entera). Este vuelco es tan central que el periodo 2025-2026 se apodó ampliamente «el año de los agentes».

6.2Anatomía de un agente

Esquema6.1. El bucle de un agente. El ciclo «pensar, actuar, observar» se repite hasta la consecución del objetivo. La memoria y las herramientas son lo que distingue a un agente de un simple modelo de conversación.

En concreto, el procedimiento se desarrolla en dos tiempos. Previamente, se trocean los documentos en fragmentos (chunks) y se transforma cada uno en un embedding (capítulo 2), un vector de números que captura el sentido, almacenado en una base vectorial. En el momento de la pregunta, se convierte también la pregunta en vector, se recuperan los fragmentos cuyo sentido es más cercano (búsqueda semántica) y se añaden al prompt. Los beneficios son triples: respuestas actualizadas y especializadas (sobre datos privados que el modelo nunca ha visto), menos alucinaciones y la posibilidad de citar sus fuentes, y por tanto de verificar. Es hoy el ladrillo rey de las aplicaciones empresariales.

El RAG clásico recupera una vez y luego responde. El RAG agéntico (agentic RAG) va más lejos al confiar la recuperación a un agente: este decide si hay que buscar, reformula la consulta, interroga varias fuentes o herramientas, evalúa la calidad de lo encontrado y vuelve a empezar si es insuficiente, antes de sintetizar. Donde el RAG simple es un reflejo, el RAG agéntico es una pequeña investigación: se adapta a las preguntas complejas en varias etapas, a costa de un coste y una latencia más elevados. Es una de las maneras en que la frontera entre «modelo que responde» y «agente que actúa» se difumina.

6.3El Model Context Protocol (MCP) y el uso de herramientas

6.4Los frameworks de agentes

Dos proyectos dominan esta categoría, con perfiles contrastados: OpenClaw, el pionero viral, y Hermes Agent, más atento a la seguridad. Son lo bastante importantes, y representativos, como para merecer cada uno un estudio de caso (secciones 6.8 y 6.9). Juntos ilustran tanto la democratización de los agentes (soberanía, datos locales, capítulo 9) como los riesgos propios de los agentes muy autónomos (capítulo 20).

6.5Agentes informáticos (computer-use) y navegación web

6.6Sistemas multiagente

Esta imagen de «corporaciones de IA» trabajando al unísono no es banal: es precisamente la visión que describen los escenarios prospectivos más avanzados, en los que miles de copias de un modelo colaboran a un ritmo sobrehumano. Volveremos sobre ello en el capítulo 24, pues está en el corazón de las cuestiones de alineación y de control.

6.7El vibe coding: programar en lenguaje natural

6.8Estudio de caso: OpenClaw

6.9Estudio de caso: Hermes Agent


Para recordar (capítulo 6)

  • Un agente no responde, actúa: se le confía un objetivo y lo cumple de forma autónoma, mediante un bucle «pensar, actuar, observar». Es el paso del copiloto al empleado digital.
  • Un agente asocia un cerebro (LLM) a cuatro facultades: percepción, memoria, herramientas, planificación.
  • El MCP (norma abierta lanzada por Anthropic a finales de 2024, adoptada por la industria) es «el USB-C de la IA»: conecta cualquier IA a cualquier herramienta.
  • Unos frameworks (LangChain/LangGraph, CrewAI, AutoGen) y unas herramientas no-code (n8n, Make, Zapier) facilitan la construcción de agentes.
  • Los agentes informáticos (computer-use) usan un ordenador como un humano, lo cual es potente pero plantea riesgos de fiabilidad y de seguridad (inyección de instrucciones).
  • Los sistemas multiagente hacen colaborar a varios agentes, prefigurando las «corporaciones de IA» de los escenarios prospectivos (capítulo 24).
  • Una oleada de agentes personales autoalojados (OpenClaw, Hermes Agent) hace funcionar a un asistente que actúa sobre la propia máquina, agnóstico al modelo y con memoria persistente: fuerte autonomía y soberanía, pero nueva superficie de ataque (capítulo 20).
  • El vibe coding (describir un software en lenguaje natural y dejar que la IA lo escriba) democratiza la creación de software y acelera a los expertos, pero expone a código mal comprendido, a fallos de seguridad (capítulo 20) y al desaprendizaje.

Hemos recorrido el «qué» y el «cómo». El capítulo 7 traza el mapa del «quién»: los laboratorios estadounidenses, chinos y europeos, la división entre modelos cerrados y abiertos, y los rostros de las personas que dan forma a esta revolución.