Les frameworks d'agents gaspillent plus de 350 000 jetons par session en renvoyant des fichiers statiques.

✍️ OpenClawRadar📅 Publié: April 13, 2026🔗 Source
Les frameworks d'agents gaspillent plus de 350 000 jetons par session en renvoyant des fichiers statiques.
Ad

Résultats du benchmark sur le gaspillage de tokens

Des mesures sur une configuration locale Qwen 3.5 122B ont révélé que les frameworks d'agents gaspillent plus de 350 000 tokens par session en renvoyant à plusieurs reprises des fichiers statiques. La source décrit ces chiffres comme "irréels".

Approche d'optimisation

Une approche de compilation a été découverte qui réduit le contexte de requête de 1 373 tokens à seulement 73 tokens. Cela représente une réduction de 95 % de l'utilisation des tokens pour ce contexte spécifique.

Le benchmark a également constaté qu'une conversion JSON naïve aggrave le problème de 30 %, augmentant le gaspillage de tokens au-delà des mesures de base.

Ad

Contexte technique

Les frameworks d'agents incluent généralement des invites système, des définitions d'outils et d'autres données de configuration qui restent statiques à travers plusieurs interactions au sein d'une session. Lorsque ces données sont renvoyées avec chaque requête, elles consomment des tokens sans fournir de nouvelles informations au modèle. Cela est particulièrement coûteux avec les grands modèles comme Qwen 3.5 122B où le traitement des tokens impacte directement à la fois les performances et le coût.

L'approche de compilation implique probablement un prétraitement des éléments statiques pour qu'ils soient référencés plutôt que renvoyés, similaire à la façon dont les applications web modernes mettent en cache les ressources statiques. Pour les développeurs travaillant avec des agents de codage IA, réduire cette surcharge peut significativement améliorer les temps de réponse et réduire les coûts opérationnels.

📖 Read the full source: r/LocalLLaMA

Ad

👀 See Also

Serveur de recherche MCP avec classement piloté par les retours pour Claude Desktop
Tools

Serveur de recherche MCP avec classement piloté par les retours pour Claude Desktop

Un serveur de recherche MCP construit par la communauté pour Claude Desktop exécute les moteurs de recherche Exa et Tavily en parallèle sans nécessiter de clés API. Après avoir utilisé un résultat, les utilisateurs indiquent s'il a fonctionné via un outil de retour, qui alimente le classement pour prioriser les URL qui aident les agents à réussir.

OpenClawRadar
CC-Ledger : Suivi des coûts de Claude Code par session et par PR avec SQLite local
Tools

CC-Ledger : Suivi des coûts de Claude Code par session et par PR avec SQLite local

CC-Ledger est un binaire Rust qui s'accroche à Claude Code, enregistrant chaque tour dans une base SQLite locale. Repérez les sessions hors de contrôle en direct et obtenez une ventilation des coûts par PR sans clé API. Comprend une barre de menus macOS, un tableau de bord web et une interface CLI.

OpenClawRadar
Des chercheurs de Stanford publient OpenJarvis : un framework local-first pour les agents d'IA sur appareil.
Tools

Des chercheurs de Stanford publient OpenJarvis : un framework local-first pour les agents d'IA sur appareil.

Des chercheurs de Stanford ont publié OpenJarvis, un framework local-first pour construire des agents d'IA personnels sur appareil, dotés d'outils, de mémoire et de capacités d'apprentissage. Le projet inclut des liens vers un dépôt GitHub et un site web pour que les développeurs puissent l'explorer.

OpenClawRadar
Développeur Crée une Compétence IA Open Source pour Valider des Idées de Start-up, Tue sa Propre Idée en 10 Minutes
Tools

Développeur Crée une Compétence IA Open Source pour Valider des Idées de Start-up, Tue sa Propre Idée en 10 Minutes

Un développeur a créé une compétence IA open source appelée startup-design qui parcourt 8 phases de validation de startup, du brainstorming aux projections financières. En la testant sur sa propre idée de startup, la compétence a posé des questions difficiles qui ont révélé qu'il n'était pas le fondateur idéal pour ce concept particulier.

OpenClawRadar