ToolLoop : Framework d'Agent Open-Source pour Outils de Style Claude avec N'importe Quel Modèle

Ce que fait ToolLoop
ToolLoop est un framework Python open-source conçu pour offrir des fonctionnalités de type Claude Code sans être lié à un seul fournisseur. Le framework comprend 11 outils couvrant les opérations sur fichiers, la recherche de code, l'accès au shell et des sous-agents, et fonctionne avec n'importe quel LLM grâce à l'intégration LiteLLM.
Fonctionnalités principales
- Framework open-source écrit en Python
- Environ 2 700 lignes de code
- 11 outils intégrés : opérations sur fichiers, recherche de code, shell, sous-agents
- Fonctionne avec n'importe quel LLM via LiteLLM
- Prend en charge n'importe quel modèle sur Bedrock (DeepSeek, Llama, Mistral) ou n'importe quelle API (OpenAI, Moonshot, points de terminaison locaux)
- Changer de modèle en cours de conversation avec un contexte partagé
- Les mêmes outils et prompts fonctionnent sur différents modèles
Exemple de code
Voici l'exemple d'utilisation du SDK provenant de la source :
from sdk import query, ToolLoopOptions
async for event in query(
prompt="Find all TODO comments, fix them, run the tests",
options=ToolLoopOptions(
model="bedrock/converse/deepseek.v3.2",
allowed_tools=["Read", "Edit", "Grep", "Glob", "Bash"],
),
):
print(event)
Vous pouvez remplacer deepseek.v3.2 par n'importe quel modèle tout en conservant la même structure d'outils et de prompts.
À qui cela s'adresse
Développeurs qui souhaitent des fonctionnalités d'agent de type Claude Code mais ont besoin de flexibilité pour utiliser différents modèles sur divers fournisseurs et configurations locales.
📖 Source : r/LocalLLaMA
👀 See Also

Claude Code Ajoute un Système de Revue de Code Multi-Agent
Anthropic a lancé Code Review pour Claude Code, un système multi-agents qui déploie des équipes d'agents IA pour examiner les demandes de fusion. Le système détecte des bogues que les réviseurs humains manquent souvent, avec 54 % des PR recevant désormais des commentaires de revue substantiels contre 16 % auparavant.

Le Référentiel de Créativité Humaine : Distinguer Convergence et Divergence dans l'Évaluation de la Créativité de l'IA
Contra Labs présente le Human Creativity Benchmark (HCB), un cadre qui distingue les critères objectivement vérifiables (ex. respect de la consigne) des goûts subjectifs (ex. attrait visuel) dans l'évaluation de l'IA générative pour le travail créatif. Le benchmark révèle qu'aucun modèle actuel n'est à la fois fiable et orientable, abordant l'effondrement modal et le besoin de résultats différenciés.

bareguard : Une barrière de sécurité légère pour les agents IA — désormais sur npm
bareguard v1.0 est une couche de sécurité d'environ 1 000 lignes, avec une seule dépendance, pour les agents IA qui bloque les actions destructrices (rm -rf, DROP TABLE) et impose des limites de budget avec escalade humaine. Faisant partie de la suite bare, disponible sur npm.
Claude Code vs Codex : 36 vs 28 fichiers, 2,50 $ vs 2,04 $, boucle infinie détectée — comparaison réelle
Un développeur exécute les deux mêmes tâches sur Claude Code et Codex (Cursor) : robot de tri des PR et interface de révision de code en temps réel. Résultats : 36 contre 28 fichiers, 2,50 $ contre 2,04 $, Claude a produit moins d'erreurs TypeScript, Codex avait une boucle React infinie.