Sandbox externe pour agents : Exécution durable et démarrages à froid

Le blog de Mendral soutient que le harnais de l'agent — la boucle qui pilote un LLM en envoyant des invites, exécutant des appels d'outils et renvoyant les résultats — devrait s'exécuter en dehors du sandbox, en particulier pour les agents multi-utilisateurs. Ils comparent deux architectures et détaillent les trois défis qu'ils ont résolus en adoptant le modèle externe.

Deux architectures

Harnais à l'intérieur du sandbox : La boucle vit dans le même conteneur que le code sur lequel elle travaille. Les appels d'outils (bash, read, write) s'exécutent localement. Les compétences et les mémoires sont des fichiers sur le système de fichiers du conteneur. C'est ce que fait Claude Code localement. Modèle d'exécution simple, mais les identifiants sont à l'intérieur du sandbox, le sandbox est la session (le perdre fait perdre la progression), et le multi-utilisateur devient un problème de système de fichiers distribué.
Harnais à l'extérieur du sandbox : La boucle s'exécute sur le backend et appelle un sandbox via une API pour exécuter des outils. Les identifiants restent en dehors du sandbox (aucun modèle de permissions nécessaire). Les sandbox peuvent être suspendus lorsqu'ils sont inactifs, deviennent du bétail (survivent aux pannes), et le partage multi-utilisateur est un problème de base de données partagée, pas de système de fichiers distribué.

Trois défis résolus

Exécution durable : Les sessions d'agent peuvent durer des heures et doivent survivre aux déploiements et aux pannes. Mendral utilise Inngest pour le checkpointing — chaque tour est une étape, et la boucle reprend là où elle s'est arrêtée si le serveur redémarre.
Cycle de vie du sandbox avec des démarrages à froid faibles : La boucle est suspendue la plupart du temps (par exemple, pendant les appels LLM). Ils utilisent Blaxel pour reprendre les sandbox depuis un état d'attente en ~25ms, évitant les démarrages à froid de plusieurs secondes lors des tours interactifs.
Abstraction du système de fichiers : Avec le harnais et le sandbox sur des machines différentes, un système de fichiers partagé n'est plus disponible. Mendral note qu'ils ont dû gérer cela, mais l'article se concentre sur les deux premiers comme problèmes clés résolus.

L'article conclut que le modèle externe est supérieur pour les configurations multi-utilisateurs malgré la complexité de l'exécution durable et de la gestion des démarrages à froid.

📖 Read the full source: HN AI Agents

Sandbox externe pour agents : Exécution durable et démarrages à froid

Deux architectures

Trois défis résolus

👀 See Also

Claude-Code v2.1.79 ajoute le contrôle à distance, corrige les blocages de sous-processus et améliore l'utilisation de la mémoire.

Uber épuise en 4 mois le budget IA 2026 avec Claude Code — 500 à 2 000 $ par ingénieur par mois

L'API Claude a connu des taux d'erreur élevés sur plusieurs modèles le 25 février 2026.

Claude-Code v2.1.31 : Principales mises à jour et corrections de bogues