Composants d'un Agent de Codage : Comment les Outils, la Mémoire et le Contexte Étendent les LLM

Sebastian Raschka décrit l'architecture des agents de codage, qui sont des systèmes qui enveloppent les LLM dans des couches applicatives pour améliorer les performances sur les tâches de programmation. Il distingue les LLM, les modèles de raisonnement et les agents, expliquant qu'une grande partie des progrès pratiques dans les systèmes LLM provient des composants système environnants plutôt que de meilleurs modèles uniquement.
Composants clés des agents de codage
L'article identifie six éléments constitutifs principaux qui rendent les agents de codage efficaces :
- Contexte de dépôt : Navigation et gestion des informations du dépôt de code
- Conception d'outils : Intégration d'outils et de fonctions externes
- Stabilité du cache d'invites : Gestion cohérente des invites entre les sessions
- Mémoire : Rétention d'état et continuité de session
- Continuité des sessions longues : Maintien du contexte sur des interactions prolongées
- Choix du modèle : Sélection du LLM ou modèle de raisonnement approprié
Couches architecturales
Raschka définit plusieurs concepts clés dans l'écosystème des agents :
- LLM : Le modèle de prédiction de token suivant de base
- Modèle de raisonnement : Un LLM entraîné ou invité à consacrer plus de puissance de calcul d'inférence au raisonnement intermédiaire, à la vérification ou à la recherche parmi des réponses candidates
- Agent : Une boucle de contrôle autour du modèle qui décide quoi inspecter ensuite, quels outils appeler, comment mettre à jour son état et quand s'arrêter
- Harnais d'agent : L'échafaudage logiciel autour d'un agent qui gère le contexte, l'utilisation des outils, les invites, l'état et le flux de contrôle
- Harnais de codage : Un cas particulier de harnais d'agent spécifiquement pour l'ingénierie logicielle qui gère le contexte du code, les outils, l'exécution et les retours itératifs
Il note que Claude Code et Codex CLI peuvent être considérés comme des harnais de codage. La relation est décrite ainsi : le LLM est le moteur, un modèle de raisonnement est un moteur renforcé, et un harnais d'agent nous aide à utiliser le modèle efficacement.
Le travail de codage implique plus que la simple génération de tokens suivants – il nécessite la navigation dans les dépôts, la recherche, la consultation de fonctions, l'application de différences, l'exécution de tests, l'inspection d'erreurs et la gestion du contexte. Les harnais de codage combinent trois couches : la famille de modèles, une boucle d'agent et des supports d'exécution.
📖 Read the full source: HN AI Agents
👀 See Also

Exécuter OpenClaw, ClawdBot et MoltBot avec un budget limité
Découvrez comment exécuter OpenClaw, ClawdBot et MoltBot sans vous ruiner. Explorez des conseils de budgétisation et des alternatives gratuites, comme discuté par les passionnés sur r/clawdbot.

Structurer les projets de code Claude avec CLAUDE.md, Skills et MCP
Un développeur partage des améliorations de flux de travail pour Claude Code, notamment démarrer en mode planification, maintenir un fichier CLAUDE.md pour la mémoire du projet, créer des Compétences réutilisables pour les tâches récurrentes, et utiliser MCP pour se connecter à des outils externes.

Réduisez les coûts de Claude de 60x en déléguant les tâches mécaniques à DeepSeek V4 Flash via MCP
Un utilisateur de Reddit a réduit de 60 fois les dépenses liées à l'API Claude en déléguant la classification de fichiers, le reformatage JSON et l'extraction de champs à DeepSeek V4 Flash via un simple outil MCP et une règle de liste noire dans CLAUDE.md.

Comment exécuter des agents OpenClaw gratuitement en utilisant des API cloud ou des modèles locaux
Un guide détaillé explique comment exécuter des agents OpenClaw sans frais en utilisant les niveaux gratuits du cloud d'OpenRouter, Gemini et Groq, ou en exécutant des modèles locaux via Ollama avec des conseils de configuration spécifiques pour éviter les pièges courants.