CAL : Couche d'Optimisation de Contexte Open-Source pour Agents LLM

✍️ OpenClawRadar📅 Publié: April 15, 2026🔗 Source
CAL : Couche d'Optimisation de Contexte Open-Source pour Agents LLM
Ad

Ce que fait CAL

CAL est une bibliothèque Python qui s'intercale entre votre code existant et les appels d'API LLM, sélectionnant, compressant et assemblant intelligemment le contexte pour chaque requête. Elle répond aux problèmes de coût et de contexte dans les configurations d'agents gourmands en tokens, particulièrement pertinents avec les récents changements d'abonnement Claude Pro/Max.

Performances de référence

En production avec Claude Opus 4 et 103 morceaux de contexte :

  • Sans CAL : Chaque requête envoie les 103 morceaux (~23 000 tokens) à 0,043 $ par requête
  • Avec CAL : Réduit à ~6 morceaux et 4 100 tokens à 0,008 $ par requête
  • Résultats : Réduction de 83 % des tokens, réduction de 81 % du coût

Validé sur 5 000 invites WildChat (un jeu de données académique ouvert de conversations réelles d'LLM dans 57 langues) avec une économie moyenne de 97,6 %.

Fonctionnalités clés

  • Sélecteur : Un score pondéré par IDF sélectionne uniquement les morceaux pertinents par requête. Utilise un préfixe stable + des morceaux dynamiques sélectionnés par requête.
  • Ébauches d'outils : Chargement paresseux à trois niveaux avec des ébauches légères jusqu'à ce que le modèle signale l'intention d'utiliser un outil spécifique.
  • Moteur de coût : Calculateur d'économies conscient du fournisseur qui connaît les 4 niveaux d'entrée d'Anthropic et les tarifs de stockage en cache de Google.
  • Suppression du bruit : Seuil IDF + portes "require-any" pour empêcher les mots courants de charger des morceaux non pertinents à chaque requête.
  • Ordonnancement stable pour le cache : Utilise les scores uniquement pour la sélection, puis l'ordre alphabétique pour la position afin de maintenir les succès de cache.
Ad

Détails techniques

Gestion du contexte multi-tours : Les ébauches d'outils sont conscientes de l'historique. Si le modèle a utilisé un outil dans un tour précédent, le schéma complet reste chargé pour maintenir la continuité de la conversation.

Support des fournisseurs : CAL est agnostique des fournisseurs et fonctionne avec tout fournisseur ayant un point de terminaison de complétion de chat. Le moteur de coût gère déjà les 4 niveaux d'entrée d'Anthropic et les tarifs de stockage en cache de Google.

Cas limites : Utilise des seuils IDF et une suppression du bruit pour les requêtes ambiguës. Un score hybride mot-clé+sémantique est prévu.

Installation et licence

pip install cal-context

Sous licence MIT. PyPI : https://pypi.org/project/cal-context/

GitHub : https://github.com/vjc-lab/context-assembly-layer

📖 Read the full source: r/openclaw

Ad

👀 See Also

La chute silencieuse de Claude : l'échec de la couche d'action lorsque les agents IA investissent les sites d'affaires
Tools

La chute silencieuse de Claude : l'échec de la couche d'action lorsque les agents IA investissent les sites d'affaires

Claude peut lire les sites web professionnels (tarifs, processus de réservation, formulaires) mais échoue au niveau de l'action — réservation, soumission ou routage — en raison de l'absence de points de terminaison appelables. Cela provoque une perte d'utilisateurs invisible, sans aucun signal d'analyse.

OpenClawRadar
Compétence OpenClaw Réduit le Transfert d'Agent en Permettant l'Exécution Automatique
Tools

Compétence OpenClaw Réduit le Transfert d'Agent en Permettant l'Exécution Automatique

Une nouvelle compétence pour les agents OpenClaw aborde le problème courant où les agents identifient l'étape suivante mais s'arrêtent à 'voici ce qu'il faut faire ensuite', nécessitant un transfert à un humain. La compétence permet aux agents d'effectuer certaines actions eux-mêmes, comme s'inscrire, publier, répondre et signer.

OpenClawRadar
Plugin Quick-Question Automatise le Développement Unity avec Claude Code
Tools

Plugin Quick-Question Automatise le Développement Unity avec Claude Code

Un développeur a publié quick-question, un plugin macOS pour Unity 2021.3+ qui automatise la compilation, les tests et la revue de code croisée lors de l'utilisation de Claude Code. L'outil inclut 20 commandes slash et utilise un modèle 'Tribunal' où Codex et Claude examinent mutuellement leurs découvertes.

OpenClawRadar
OpenClaw 2026.3.23 ajoute le fournisseur DeepSeek, le paiement à l'usage pour Qwen et des améliorations du MCP Chrome.
Tools

OpenClaw 2026.3.23 ajoute le fournisseur DeepSeek, le paiement à l'usage pour Qwen et des améliorations du MCP Chrome.

OpenClaw v2026.3.23 introduit un plugin fournisseur DeepSeek, une tarification à l'usage pour Qwen, une tarification automatique OpenRouter avec ordre de réflexion Anthropic, une attente des onglets Chrome MCP, et des correctifs pour Discord/Slack/Matrix et l'interface Web.

OpenClawRadar