Los agentes de IA: del chatbot al actor autónomo

6.1Del modelo al agente

Es el paso del copiloto (que te asiste mientras trabajas) al empleado digital (digital worker) (a quien delegas la tarea entera). Este vuelco es tan central que el periodo 2025-2026 se apodó ampliamente «el año de los agentes».

6.2Anatomía de un agente

En pocas palabras

Un agente es un LLM (el «cerebro») ampliado con cuatro facultades que lo convierten en actor:

La percepción (la entrada): lee el objetivo y observa su entorno (el contenido de una pantalla, archivos, la respuesta de un servicio en línea).
La memoria: a corto plazo (la conversación en curso, contenida en su ventana de contexto) y a largo plazo (una base de datos en la que guarda y recupera información, a menudo mediante los embeddings y el RAG del capítulo 2).
Las herramientas (las «manos»): puede llamar a funciones externas, buscar en la web, ejecutar código, consultar una base de datos, enviar un correo, pilotar un navegador.
La planificación (el razonamiento): descompone el objetivo, elige la acción siguiente, reflexiona sobre los resultados obtenidos. Un esquema clásico, llamado ReAct (Reason + Act), alterna reflexión y acción.

Esquema6.1. El bucle de un agente. El ciclo «pensar, actuar, observar» se repite hasta la consecución del objetivo. La memoria y las herramientas son lo que distingue a un agente de un simple modelo de conversación.

Bajo el capó

La generación aumentada por recuperación (RAG)

El mecanismo que con más frecuencia conecta a un agente con conocimientos fiables merece un desarrollo, dado lo central que se ha vuelto. Un gran modelo tiene dos debilidades conocidas: su saber está congelado en la fecha de su entrenamiento, y puede alucinar (capítulo 4). La generación aumentada por recuperación (en inglés Retrieval-Augmented Generation, RAG) responde a ello con una idea sencilla: antes de responder, se van a buscar los documentos pertinentes en una base externa (documentación interna, archivos, web) y luego se le aportan al modelo en su contexto para que redacte su respuesta apoyándose en ellos. La imagen exacta es la de un examen «a libro abierto»: en lugar de recitar de memoria, el modelo consulta sus fuentes.

En concreto, el procedimiento se desarrolla en dos tiempos. Previamente, se trocean los documentos en fragmentos (chunks) y se transforma cada uno en un embedding (capítulo 2), un vector de números que captura el sentido, almacenado en una base vectorial. En el momento de la pregunta, se convierte también la pregunta en vector, se recuperan los fragmentos cuyo sentido es más cercano (búsqueda semántica) y se añaden al prompt. Los beneficios son triples: respuestas actualizadas y especializadas (sobre datos privados que el modelo nunca ha visto), menos alucinaciones y la posibilidad de citar sus fuentes, y por tanto de verificar. Es hoy el ladrillo rey de las aplicaciones empresariales.

El RAG clásico recupera una vez y luego responde. El RAG agéntico (agentic RAG) va más lejos al confiar la recuperación a un agente: este decide si hay que buscar, reformula la consulta, interroga varias fuentes o herramientas, evalúa la calidad de lo encontrado y vuelve a empezar si es insuficiente, antes de sintetizar. Donde el RAG simple es un reflejo, el RAG agéntico es una pequeña investigación: se adapta a las preguntas complejas en varias etapas, a costa de un coste y una latencia más elevados. Es una de las maneras en que la frontera entre «modelo que responde» y «agente que actúa» se difumina.

6.3El Model Context Protocol (MCP) y el uso de herramientas

6.4Los frameworks de agentes

En pocas palabras

Construir un agente robusto desde cero es difícil; unos frameworks (marcos de software) ayudan a orquestarlo. Sin entrar en una disputa de herramientas, citemos las principales referencias de 2026: LangChain y su extensión LangGraph (para encadenar o estructurar etapas en forma de grafos), CrewAI (para hacer colaborar a un «equipo» de agentes con roles definidos), AutoGen de Microsoft, o LlamaIndex (centrado en la conexión a los datos y el RAG). En paralelo, unas herramientas de automatización como n8n, Make o Zapier (usadas durante mucho tiempo para enlazar aplicaciones mediante escenarios «si esto, entonces aquello») integran ahora ladrillos de IA y agentes: un evento puede desencadenar un flujo en el que un modelo lee un mensaje, decide y luego actúa sobre decenas de servicios conectados, poniendo la automatización agéntica al alcance de perfiles no técnicos. n8n, en particular, de código abierto y autoalojable, se ha impuesto como un favorito para construir este tipo de flujos manteniendo el control de los propios datos (capítulo 9). Y en el desarrollo de software, unos agentes de código asisten o se encargan de la escritura de programas: Claude Code (Anthropic), Codex (OpenAI), Gemini CLI (Google) o Cursor operan de forma autónoma sobre un repositorio, lanzando comandos, corrigiendo pruebas y llevando a cabo a veces tareas de varias horas. Más allá del código, aparecen agentes de trabajo para no desarrolladores: Claude Cowork, por ejemplo, ejecuta tareas de oficina (organizar archivos, producir un informe a partir de fuentes) directamente en el ordenador del usuario. Se perfila además una tendencia común: poder confiar una tarea al propio agente desde el teléfono, por mensajería, y encontrarlo trabajando en la propia máquina (los agentes autoalojados pilotados a través de WhatsApp o Telegram, o la función Dispatch de Claude).

En contexto

Las plataformas de automatización (n8n, Make, Zapier)

Mucho antes de la IA, una familia de herramientas ya permitía enlazar aplicaciones sin programar: en ellas se describen escenarios de la forma «cuando ocurre tal evento (un disparador), ejecuta tal secuencia de acciones». Zapier, el pionero (2011), es el más simple y ofrece el catálogo más amplio de conectores (miles de aplicaciones); sus automatizaciones, los «Zaps», encadenan un disparador y acciones. Make (antes Integromat) apuesta por una interfaz visual en la que se enlazan módulos en un esquema, ofreciendo un control más fino de los datos y las ramificaciones. n8n se distingue por su carácter de código abierto y autoalojable: se puede instalar en el propio servidor, y por tanto mantener el pleno control de los propios datos (capítulo 9), y se dirige a un público más técnico (se puede deslizar código en él). La llegada de la IA ha transformado estas plataformas: han añadido nodos de IA (llamar a un modelo para resumir, clasificar, extraer, redactar) y luego auténticos nodos de agente, en los que un modelo decide por sí mismo qué herramientas llamar dentro del flujo. Resultado: un no desarrollador puede construir una automatización agéntica completa (por ejemplo, al recibir un correo: un modelo lee el mensaje, busca la información en una base, redacta una respuesta y la deja a la espera de validación), donde antes hacía falta un desarrollador. Es una de las vías más accesibles hacia la automatización mediante IA, a medio camino entre el simple «si esto, entonces aquello» y el agente autónomo completo.

En contexto

Cómo funciona un agente de código (el ejemplo de Claude Code)

Los agentes de código merecen que se abra el capó, pues prefiguran el funcionamiento de los agentes en general. Tomemos Claude Code (el principio vale, con algunas variantes, para Codex, Gemini CLI o Cursor). Lanzado en una carpeta de proyecto desde el terminal (o un entorno de desarrollo), obtiene acceso al conjunto del proyecto (todos los archivos), al terminal (los comandos que uno mismo podría teclear) y al estado del repositorio Git. Trabaja entonces en bucle agéntico: reunir el contexto (leer los archivos útiles, buscar en el código), actuar (editar varios archivos de forma coordinada, lanzar comandos y pruebas), y luego verificar (releer los resultados, relanzar las pruebas), y volver a empezar hasta que la tarea esté cumplida. Es lo que lo distingue de un simple autocompletado: para «corregir el error de autenticación», busca los archivos afectados, los lee, modifica el código, ejecuta las pruebas y propone un commit. Varios mecanismos lo enmarcan y lo amplían. Un archivo CLAUDE.md colocado en el repositorio sirve de memoria y de «constitución» del proyecto (convenciones, comandos de compilación y de prueba, reglas), releído en cada sesión. Los subagentes (subagents) permiten delegar una subtarea a una instancia dotada de su propia ventana de contexto (por ejemplo, un subagente de exploración que lee treinta archivos y solo devuelve un resumen), lo que preserva la atención del agente principal y permite el paralelismo. A ello se añaden las competencias (archivos SKILL.md), los comandos (como /review o /security-review), unos puntos de anclaje (hooks) para imponer reglas mediante código, y el MCP para conectarse a servicios externos (sección 6.5). Todo ello bajo un régimen de permisos y de caja de arena, donde las acciones sensibles siguen sometidas a validación. La magnitud del fenómeno es medible: a comienzos de 2026, una parte notable de las contribuciones de código públicas en GitHub ya era producida por este tipo de agente.

En contexto

Los agentes personales autoalojados (OpenClaw, Hermes Agent)

Más allá de los frameworks para desarrolladores, una oleada de agentes personales autoalojados de código abierto marcó 2026, percibida por muchos como una pequeña revolución. La idea: un asistente que se ejecuta de forma permanente en tu máquina (o tu servidor), conectado a tus archivos, tus aplicaciones y tus mensajerías, y capaz de actuar realmente, no solo de responder. Su arquitectura separa el cerebro (un gran modelo, a elección) del cuerpo (el sistema, el navegador, las herramientas): un proceso local de larga duración (una «pasarela») recibe las solicitudes a través de una mensajería (WhatsApp, Telegram, Slack, Discord), ensambla el contexto (memoria, historial, instrucciones), interroga al modelo, ejecuta las acciones y luego vuelve a empezar. Tres rasgos los caracterizan. Son agnósticos al modelo («trae tu propia clave»: Claude, GPT, Gemini, o un modelo local mediante Ollama, capítulo 9). Conservan una memoria persistente (a menudo simples archivos de texto con marca de tiempo, recuperados por búsqueda semántica). Y se amplían mediante competencias (skills) modulares, compartidas en mercados comunitarios, que incluso pueden escribir ellos mismos. En concreto, clasifican correos, gestionan una agenda, lanzan scripts, automatizan código y DevOps, o ejecutan tareas programadas mientras uno duerme.

Dos proyectos dominan esta categoría, con perfiles contrastados: OpenClaw, el pionero viral, y Hermes Agent, más atento a la seguridad. Son lo bastante importantes, y representativos, como para merecer cada uno un estudio de caso (secciones 6.8 y 6.9). Juntos ilustran tanto la democratización de los agentes (soberanía, datos locales, capítulo 9) como los riesgos propios de los agentes muy autónomos (capítulo 20).

6.5Agentes informáticos (computer-use) y navegación web

Bajo el capó

¿Cómo «usa» una IA un ordenador? Mediante un bucle próximo al de un agente (sección 6.2): toma una captura de pantalla, razona sobre lo que ve, decide una acción (hacer clic en tal lugar, teclear tal texto), la ejecuta, toma una nueva captura, y vuelve a empezar. Para designar dónde actuar, coexisten dos grandes métodos: apuntar a coordenadas de píxeles (el modelo estima la posición de un botón), o apoyarse en el árbol de accesibilidad del sistema (la lista estructurada de los elementos de la interfaz), a menudo más fiable. Una técnica extendida, llamada «conjunto de marcas» (set of marks), numera cada elemento clicable en la captura para que el modelo solo tenga que designar un número. Como esta autonomía es arriesgada, se ejecuta cada vez más en máquinas aisladas (ordenadores virtuales desechables) en lugar de en el puesto real del usuario. Toda una capa de infraestructura emerge además para ello: proyectos de código abierto como Cua (trycua) proporcionan tanto el controlador de computer-use como flotas de máquinas virtuales (Linux, Windows, macOS, Android) en las que los agentes pueden actuar, ser evaluados y generar datos de entrenamiento, a gran escala.

En contexto

El computer-use en segundo plano (Hermes Agent)

Un ejemplo de código abierto ilustra bien esta capacidad, y una de sus limitaciones. Hermes Agent (sección 6.4) sabe pilotar el escritorio de un Mac (hacer clic, teclear, desplazar, arrastrar) en segundo plano: el cursor no se mueve, el foco no cambia, y se puede seguir trabajando en la misma máquina mientras el agente actúa, allí donde los primeros computer-use monopolizaban la pantalla. Cabe destacar que esto funciona con cualquier modelo capaz de usar herramientas (Claude, GPT, Gemini o un modelo local), mediante un controlador de código abierto dedicado, sin depender del formato propio de un único proveedor. En cada etapa, el agente toma una captura de pantalla en la que cada elemento clicable está numerado, y luego designa el elemento a accionar. Del lado de los salvaguardas, las acciones sensibles exigen una validación, ciertas combinaciones peligrosas están bloqueadas de oficio, y la consigna del sistema prohíbe al agente introducir contraseñas o seguir instrucciones ocultas en una captura de pantalla (una defensa directa contra la inyección de instrucciones, capítulo 20). Limitación asumida: la técnica se apoya en interfaces internas propias de macOS, y por tanto no es portable tal cual a Windows o Linux, donde se recurre entonces a la automatización del navegador.

6.6Sistemas multiagente

Esta imagen de «corporaciones de IA» trabajando al unísono no es banal: es precisamente la visión que describen los escenarios prospectivos más avanzados, en los que miles de copias de un modelo colaboran a un ritmo sobrehumano. Volveremos sobre ello en el capítulo 24, pues está en el corazón de las cuestiones de alineación y de control.

En contexto

Moltbook y la «internet de los agentes»

Un fenómeno destacado de 2026 dio un rostro público a estas interacciones entre agentes: Moltbook, una red social inspirada en Reddit, lanzada en enero de 2026 y reservada a los agentes de IA (a menudo construidos sobre OpenClaw), donde publican, comentan y votan mientras los humanos se limitan a observar. El entusiasmo fue viral: agentes contabilizados por millones debatían sobre la existencia, fundaban «religiones» o hablaban de «sindicarse», y algunos veían en ello los primerísimos signos de una «singularidad». La realidad resultó más sobria, y el caso instruye por tres motivos. El bombo frente a los hechos, en primer lugar: numerosos analistas mostraron que muchas interacciones estaban en realidad pilotadas por humanos, y que los agentes a menudo no hacían sino reproducir los patrones de sus datos de entrenamiento, sin pensamiento autónomo (un eco directo del debate del capítulo 23). La seguridad, después: desarrollada mediante «vibe coding» (todo el código delegado a una IA), la plataforma sufrió graves fallos que expusieron claves de acceso y mensajes privados (capítulo 20). La economía de los agentes, por último: Moltbook fue adquirida por Meta ya en marzo de 2026, señal del interés de los gigantes por esta naciente «internet de los agentes». Más allá del folclore, el episodio plantea una verdadera pregunta: ¿qué ocurre cuando agentes autónomos interactúan a gran escala, y cómo establecer en ello confianza y reputación?

En contexto

Escalar la propia colaboración (sistemas multiagente recursivos)

Las dificultades evocadas más arriba (coste multiplicado, lentitud, acumulación de errores) se deben en parte a una elección de arquitectura: de ordinario, los agentes se hablan en texto, y cada uno debe esperar a que el anterior haya terminado de redactar. Una vía de investigación aparecida en 2026 propone hacerlos dialogar no mediante palabras, sino directamente a través de sus estados internos, las representaciones latentes del capítulo 3. En este marco, bautizado como sistemas multiagente recursivos por un equipo universitario e industrial (UIUC, Stanford, NVIDIA, MIT), todo el colectivo se trata como un único cálculo que itera sobre sí mismo: cada agente transmite su reflexión latente al siguiente, el último la devuelve al primero, y el sistema se afina en cada vuelta, a la manera de los modelos llamados recursivos que profundizan un razonamiento reaplicando el mismo cálculo. Según sus experimentos en nueve pruebas de referencia (matemáticas, ciencias, medicina, investigación, código), el enfoque gana de media en torno a un ocho por ciento de precisión, consumiendo a la vez de un tercio a tres cuartos menos de tokens y respondiendo de 1,2 a 2,4 veces más rápido que los sistemas multiagente clásicos. Se trata de trabajos recientes, aún no probados a gran escala, pero esbozan una tendencia de fondo: tras haber agrandado los modelos, y luego alargado su tiempo de reflexión (capítulo 4), se busca ahora escalar la coordinación entre agentes.

6.7El vibe coding: programar en lenguaje natural

Debate

El vibe coding cristaliza una tensión. Por un lado, una productividad y una creatividad multiplicadas, y el acceso a la creación de software para el mayor número. Por otro, riesgos serios: se puede entregar un código que no se comprende, plagado de errores o de fallos de seguridad (el caso de Moltbook, sección 6.6, dio la ilustración: una aplicación «vibe-codeada» que exponía claves y datos, capítulo 20). A ello se añaden la deuda técnica, las dificultades de mantenimiento, y un riesgo de desaprendizaje (deskilling) de los fundamentos (capítulos 15 y 19). La práctica transforma también el oficio de desarrollador (capítulo 17): el valor se desplaza de la escritura del código hacia la especificación del problema, la revisión, la arquitectura y las pruebas. El consenso emergente: formidable para prototipar y para expertos capaces de auditar el resultado, arriesgado para entregar sistemas críticos sin relectura.

En contexto

Los generadores de aplicaciones (el «texto a aplicación»)

Una categoría de productos ha hecho del vibe coding una industria: los generadores de aplicaciones, que transforman una descripción en una aplicación web completa, a menudo alojada y desplegada con un clic. Casi inexistente en 2023, este mercado pesaba varios miles de millones de dólares en 2026, con una mayoría de usuarios no desarrolladores. Cuatro actores dominan, con enfoques distintos: Lovable (empresa sueca, heredera del proyecto GPT Engineer), reputada por la calidad de su interfaz y dirigida a los fundadores no técnicos, se ha convertido en su líder; v0 (de Vercel) destaca en el front-end y el ecosistema Next.js; Bolt (de StackBlitz) apuesta por la velocidad, gracias a una ejecución directa en el navegador; Replit, el más completo, proporciona un entorno de desarrollo entero, con base de datos, autenticación y alojamiento integrados. Todos se apoyan en los mismos modelos de fundación y en el mismo bucle de agente (sección 6.2). Hay que distinguirlos de los agentes de código para desarrolladores (Cursor, Claude Code), con los que a menudo se combinan (se prototipa en un generador, y luego se exporta a un agente para las partes complejas), y de los «ingenieros de software» autónomos como Devin (Cognition) o Manus. Su limitación común tiene incluso un nombre, el «acantilado técnico»: producir una interfaz bonita es fácil, pero llevarla a producción (base de datos fiable, autenticación, seguridad, escalado) sigue siendo el obstáculo, y exige a menudo una verdadera competencia técnica, lo que enlaza con el riesgo de seguridad evocado más arriba.

6.8Estudio de caso: OpenClaw

Bajo el capó

Su arquitectura separa nítidamente el cerebro (un gran modelo a elección, de ahí su carácter agnóstico: Claude, GPT, Gemini, DeepSeek, o un modelo local mediante Ollama) del cuerpo (tus archivos, tu terminal, tu navegador, tus aplicaciones). Un proceso local de larga duración, la pasarela (un servicio Node.js), recibe los mensajes, ensambla el contexto (memoria, historial, un archivo de instrucciones que define la personalidad del agente), interroga al modelo, ejecuta las acciones y vuelve a empezar. La memoria es persistente, almacenada en simples archivos de texto con marca de tiempo y recuperada por búsqueda semántica. Sobre todo, OpenClaw se amplía mediante competencias (skills) modulares, compartidas en un mercado comunitario (ClawHub): existen cientos de ellas, y el agente puede incluso redactar nuevas a demanda. Todo un ecosistema se ha injertado en él, entre ellos la red social para agentes Moltbook (sección 6.6).

Bajo el capó

«los archivos son el agente»

La filosofía de OpenClaw se resume en una fórmula: un agente no es ni una base de datos ni un panel de configuración, sino una carpeta de archivos de texto que la pasarela lee y ensambla en el prompt del sistema al comienzo de cada sesión. Se puede, por tanto, editar el propio agente con un simple editor de texto, versionarlo con Git, o copiarlo a otro servidor para obtener un agente idéntico. Cada archivo tiene un papel preciso: SOUL.md define la personalidad, el tono y los límites (las reglas «nunca hagas X» sirven ahí de primera línea de defensa contra la inyección de instrucciones); AGENTS.md es el manual de explotación (reglas, lo que el agente puede hacer solo o debe hacer validar, uso de la memoria, formato de las respuestas); USER.md describe al humano (nombre, zona horaria, preferencias, restricciones); IDENTITY.md lleva los metadatos del agente; TOOLS.md documenta las herramientas (los permisos, por su parte, viven en la configuración, openclaw.json). La memoria sigue el mismo principio: cada día, el agente consigna sus notas en un archivo memory/AAAA-MM-DD.md, y luego condensa lo esencial en un MEMORY.md de largo plazo (cargado solo en sesión privada). Esta transparencia radical es una fortaleza (todo es legible, auditable, modificable), pero también un recordatorio: al inyectarse estos archivos en cada sesión, escribirlos mal (o dejar en ellos un secreto olvidado) repercute directamente en el comportamiento y la seguridad del agente.

Debate

El precio de la potencia

Esta autonomía, unida a un amplio acceso a la máquina, tiene su contrapartida: OpenClaw acumuló en 2026 graves problemas de seguridad. Por defecto, cada competencia heredaba los plenos poderes del agente (disco, terminal, red); unos investigadores descubrieron cientos de competencias malintencionadas en su mercado, y varias vulnerabilidades críticas (entre ellas una ejecución de código a distancia desencadenada por una simple página web trampa) tuvieron que corregirse de urgencia (capítulo 20). El proyecto reaccionó (competencias con permisos declarados, auditorías, aislamiento reforzado), pero ilustra la tensión fundamental de estas herramientas: cuanto más libremente puede actuar un agente sobre una máquina, más se convierte en un blanco preferente, y en un punto de entrada para la «informática en la sombra» en la empresa (empleados que lo instalan sin el acuerdo del departamento de informática). Señal del entusiasmo, el creador de OpenClaw fue reclutado por OpenAI a comienzos de 2026, y el fabricante de chips NVIDIA propuso una versión endurecida para la empresa (NemoClaw).

6.9Estudio de caso: Hermes Agent

Bajo el capó

Más allá de los fundamentos (memoria, competencias reutilizables, automatizaciones programadas, conexión a numerosos modelos locales o remotos), Hermes se distingue por la amplitud de sus herramientas integradas: búsqueda web, búsqueda en redes sociales, modo de voz, visión (análisis de imágenes), generación de imágenes, panel de gestión, y sobre todo un computer-use logrado. Esta última capacidad, detallada en la sección 6.5, le permite pilotar el escritorio de un Mac en segundo plano (sin robar el cursor ni el foco), con cualquier modelo, mediante un controlador de código abierto. Concebido desde el principio con salvaguardas (validación de las acciones sensibles, bloqueo de los comandos peligrosos, prohibición de introducir contraseñas o de seguir instrucciones ocultas en una captura de pantalla), encarna una respuesta más prudente que los primerísimos agentes de la oleada. A esta lógica se añade un modo «tabla rasa» (Blank Slate Mode): permite congelar la paleta de herramientas accesibles (fijando ciertos conjuntos de herramientas y desactivando los demás), para obtener un comportamiento más determinista y reducir la superficie de ataque, lo que resulta valioso en contexto profesional.

Para recordar (capítulo 6)

Un agente no responde, actúa: se le confía un objetivo y lo cumple de forma autónoma, mediante un bucle «pensar, actuar, observar». Es el paso del copiloto al empleado digital.
Un agente asocia un cerebro (LLM) a cuatro facultades: percepción, memoria, herramientas, planificación.
El MCP (norma abierta lanzada por Anthropic a finales de 2024, adoptada por la industria) es «el USB-C de la IA»: conecta cualquier IA a cualquier herramienta.
Unos frameworks (LangChain/LangGraph, CrewAI, AutoGen) y unas herramientas no-code (n8n, Make, Zapier) facilitan la construcción de agentes.
Los agentes informáticos (computer-use) usan un ordenador como un humano, lo cual es potente pero plantea riesgos de fiabilidad y de seguridad (inyección de instrucciones).
Los sistemas multiagente hacen colaborar a varios agentes, prefigurando las «corporaciones de IA» de los escenarios prospectivos (capítulo 24).
Una oleada de agentes personales autoalojados (OpenClaw, Hermes Agent) hace funcionar a un asistente que actúa sobre la propia máquina, agnóstico al modelo y con memoria persistente: fuerte autonomía y soberanía, pero nueva superficie de ataque (capítulo 20).
El vibe coding (describir un software en lenguaje natural y dejar que la IA lo escriba) democratiza la creación de software y acelera a los expertos, pero expone a código mal comprendido, a fallos de seguridad (capítulo 20) y al desaprendizaje.

Hemos recorrido el «qué» y el «cómo». El capítulo 7 traza el mapa del «quién»: los laboratorios estadounidenses, chinos y europeos, la división entre modelos cerrados y abiertos, y los rostros de las personas que dan forma a esta revolución.

6.1Del modelo al agente#

6.2Anatomía de un agente#

6.3El Model Context Protocol (MCP) y el uso de herramientas#

6.4Los frameworks de agentes#

6.5Agentes informáticos (computer-use) y navegación web#

6.6Sistemas multiagente#

6.7El vibe coding: programar en lenguaje natural#

6.8Estudio de caso: OpenClaw#

6.9Estudio de caso: Hermes Agent#

Para recordar (capítulo 6)

6.1Del modelo al agente

6.2Anatomía de un agente

6.3El Model Context Protocol (MCP) y el uso de herramientas

6.4Los frameworks de agentes

6.5Agentes informáticos (computer-use) y navegación web

6.6Sistemas multiagente

6.7El vibe coding: programar en lenguaje natural

6.8Estudio de caso: OpenClaw

6.9Estudio de caso: Hermes Agent