Context Gateway : Proxy Open-Source pour Compresser le Contexte des Agents IA

Ce que fait Context Gateway

Context Gateway est un proxy agentique qui se place entre les agents de codage IA (comme Claude Code, OpenClaw ou Cursor) et l'API LLM. Lorsque les sorties d'outils comme les lectures de fichiers ou les résultats de grep déversent des milliers de tokens dans la fenêtre de contexte, le proxy compresse ce contenu avant qu'il n'atteigne le LLM. La motivation vient de recherches montrant que les benchmarks à long contexte subissent des chutes importantes de précision à mesure que le contexte s'allonge—l'évaluation GPT-5.4 d'OpenAI chuterait apparemment de 97,2% à 32k tokens à 36,6% à 1M tokens.

Comment fonctionne la compression

Le système utilise de petits modèles de langage (SLM) qui examinent les internes du modèle et entraînent des classificateurs pour détecter quelles parties du contexte portent le plus de signal. Lorsqu'un outil renvoie une sortie, la compression se fait conditionnée par l'intention de l'appel d'outil. Par exemple, si un agent a appelé grep pour chercher des modèles de gestion d'erreurs, le SLM conserve les correspondances pertinentes et supprime le reste. Si le modèle a besoin plus tard de quelque chose qui a été supprimé, il peut appeler expand() pour récupérer la sortie originale.

Fonctionnalités clés et configuration

Compaction en arrière-plan: Déclenchée à 85% de la capacité de la fenêtre, avec des résumés pré-calculés pour ne pas attendre la compaction
Descriptions d'outils chargées à la demande: Le modèle ne voit que les outils pertinents pour l'étape en cours
Plafonds de dépenses: Contrôlez les coûts avec des limites budgétaires
Tableau de bord: Suivez les sessions en cours et passées
Notifications Slack: Soyez notifié lorsqu'un agent attend votre intervention
Agents supportés: Claude Code, Cursor, OpenClaw, ou configurations personnalisées

Pour commencer

Installez avec :

curl -fsSL https://compresr.ai/api/install | sh

Puis exécutez context-gateway pour lancer un assistant TUI interactif qui vous aide à :

Choisir un agent (claude_code, cursor, openclaw, ou personnalisé)
Créer/modifier la configuration, y compris le modèle de synthèse et la clé API
Activer les notifications Slack si nécessaire
Définir le seuil de déclenchement pour la compression (par défaut : 75%)

L'outil est open-source, principalement développé en Go (90,9%), et maintenu par Compresr, une entreprise soutenue par YC. Vous pouvez consulter les journaux de compaction dans logs/history_compaction.jsonl pour voir ce qui se passe en coulisses.

📖 Lire la source complète : HN LLM Tools

Passerelle de Contexte : Un Proxy Open-Source pour Compresser le Contexte des Agents IA

Ce que fait Context Gateway

Comment fonctionne la compression

Fonctionnalités clés et configuration

Pour commencer

👀 See Also

L'outil de sauvegarde Databasus PostgreSQL bénéficie désormais du support open source d'Anthropic

Fehu : Comptabilité en Partie Double en Ligne de Commande avec Intégration Claude AI MCP

VibeAround : Démon Local Connecte les Agents de Codage à Telegram et Discord

Claude Code contre OpenCode : Principales différences techniques relevées par un développeur