Partie II · L'ère des grands modèles

Les agents IA : du chatbot à l'acteur autonome

Chapitre 625 min de lectureMis à jour : juin 2026

6.1Du modèle à l'agent

C'est le passage du copilote (qui vous assiste pendant que vous travaillez) à l'employé numérique (à qui vous déléguez la tâche entière). Ce basculement est si central que la période 2025-2026 a été largement surnommée « l'année des agents ».

6.2Anatomie d'un agent

Schéma6.1. La boucle d'un agent. Le cycle « penser, agir, observer » se répète jusqu'à l'accomplissement de l'objectif. La mémoire et les outils sont ce qui distingue un agent d'un simple modèle de conversation.

Concrètement, le procédé se déroule en deux temps. En amont, on découpe les documents en morceaux (chunks) et on transforme chacun en un plongement (embedding, chapitre 2), un vecteur de nombres qui capture le sens, rangé dans une base vectorielle. Au moment de la question, on convertit aussi la question en vecteur, on récupère les morceaux dont le sens est le plus proche (recherche sémantique) et on les ajoute à l'invite. Les bénéfices sont triples : des réponses à jour et spécialisées (sur des données privées que le modèle n'a jamais vues), moins d'hallucinations, et la possibilité de citer ses sources, donc de vérifier. C'est aujourd'hui la brique reine des applications d'entreprise.

Le RAG classique récupère une fois, puis répond. Le RAG agentique (agentic RAG) va plus loin en confiant la récupération à un agent : celui-ci décide s'il faut chercher, reformule la requête, interroge plusieurs sources ou outils, évalue la qualité de ce qu'il a trouvé et recommence si c'est insuffisant, avant de synthétiser. Là où le RAG simple est un réflexe, le RAG agentique est une petite enquête : il s'adapte aux questions complexes en plusieurs étapes, au prix d'un coût et d'une latence plus élevés. C'est l'une des manières dont la frontière entre « modèle qui répond » et « agent qui agit » s'estompe.

6.3Le Model Context Protocol (MCP) et l'usage d'outils

6.4Les frameworks d'agents

Deux projets dominent cette catégorie, aux profils contrastés : OpenClaw, le pionnier viral, et Hermes Agent, plus soucieux de sûreté. Ils sont assez importants, et représentatifs, pour mériter chacun une étude de cas (sections 6.8 et 6.9). Ensemble, ils illustrent autant la démocratisation des agents (souveraineté, données locales, chapitre 9) que les risques propres aux agents très autonomes (chapitre 20).

6.5Agents informatiques (computer-use) et navigation web

6.6Systèmes multi-agents

Cette image de « corporations d'IA » travaillant de concert n'est pas anodine : c'est précisément la vision que décrivent les scénarios prospectifs les plus avancés, où des milliers de copies d'un modèle collaborent à un rythme surhumain. Nous y reviendrons au chapitre 24, car elle est au cœur des questions d'alignement et de contrôle.

6.7Le vibe coding : programmer en langage naturel

6.8Étude de cas : OpenClaw

6.9Étude de cas : Hermes Agent


À retenir (chapitre 6)

  • Un agent ne répond pas, il agit : on lui confie un objectif et il l'accomplit en autonomie, par une boucle « penser, agir, observer ». C'est le passage du copilote à l'employé numérique.
  • Un agent associe un cerveau (LLM) à quatre facultés : perception, mémoire, outils, planification.
  • Le MCP (norme ouverte lancée par Anthropic fin 2024, adoptée par l'industrie) est « l'USB-C de l'IA » : il relie n'importe quelle IA à n'importe quel outil.
  • Des frameworks (LangChain/LangGraph, CrewAI, AutoGen) et des outils no-code (n8n, Make, Zapier) facilitent la construction d'agents.
  • Les agents informatiques (computer-use) utilisent un ordinateur comme un humain, ce qui est puissant mais soulève des risques de fiabilité et de sécurité (injection d'instructions).
  • Les systèmes multi-agents font collaborer plusieurs agents, préfigurant les « corporations d'IA » des scénarios prospectifs (chapitre 24).
  • Une vague d'agents personnels auto-hébergés (OpenClaw, Hermes Agent) fait tourner un assistant qui agit sur sa propre machine, agnostique au modèle et à mémoire persistante : forte autonomie et souveraineté, mais nouvelle surface d'attaque (chapitre 20).
  • Le vibe coding (décrire un logiciel en langage naturel et laisser l'IA l'écrire) démocratise la création logicielle et accélère les experts, mais expose à du code mal compris, à des failles de sécurité (chapitre 20) et au désapprentissage.

Nous avons fait le tour du « quoi » et du « comment ». Le chapitre 7 dresse la carte du « qui » : les laboratoires américains, chinois et européens, le clivage entre modèles fermés et ouverts, et les visages des personnes qui façonnent cette révolution.