Passerelle de Contexte : Un Proxy Open-Source pour Compresser le Contexte des Agents IA

Ce que fait Context Gateway
Context Gateway est un proxy agentique qui se place entre les agents de codage IA (comme Claude Code, OpenClaw ou Cursor) et l'API LLM. Lorsque les sorties d'outils comme les lectures de fichiers ou les résultats de grep déversent des milliers de tokens dans la fenêtre de contexte, le proxy compresse ce contenu avant qu'il n'atteigne le LLM. La motivation vient de recherches montrant que les benchmarks à long contexte subissent des chutes importantes de précision à mesure que le contexte s'allonge—l'évaluation GPT-5.4 d'OpenAI chuterait apparemment de 97,2% à 32k tokens à 36,6% à 1M tokens.
Comment fonctionne la compression
Le système utilise de petits modèles de langage (SLM) qui examinent les internes du modèle et entraînent des classificateurs pour détecter quelles parties du contexte portent le plus de signal. Lorsqu'un outil renvoie une sortie, la compression se fait conditionnée par l'intention de l'appel d'outil. Par exemple, si un agent a appelé grep pour chercher des modèles de gestion d'erreurs, le SLM conserve les correspondances pertinentes et supprime le reste. Si le modèle a besoin plus tard de quelque chose qui a été supprimé, il peut appeler expand() pour récupérer la sortie originale.
Fonctionnalités clés et configuration
- Compaction en arrière-plan: Déclenchée à 85% de la capacité de la fenêtre, avec des résumés pré-calculés pour ne pas attendre la compaction
- Descriptions d'outils chargées à la demande: Le modèle ne voit que les outils pertinents pour l'étape en cours
- Plafonds de dépenses: Contrôlez les coûts avec des limites budgétaires
- Tableau de bord: Suivez les sessions en cours et passées
- Notifications Slack: Soyez notifié lorsqu'un agent attend votre intervention
- Agents supportés: Claude Code, Cursor, OpenClaw, ou configurations personnalisées
Pour commencer
Installez avec :
curl -fsSL https://compresr.ai/api/install | sh
Puis exécutez context-gateway pour lancer un assistant TUI interactif qui vous aide à :
- Choisir un agent (claude_code, cursor, openclaw, ou personnalisé)
- Créer/modifier la configuration, y compris le modèle de synthèse et la clé API
- Activer les notifications Slack si nécessaire
- Définir le seuil de déclenchement pour la compression (par défaut : 75%)
L'outil est open-source, principalement développé en Go (90,9%), et maintenu par Compresr, une entreprise soutenue par YC. Vous pouvez consulter les journaux de compaction dans logs/history_compaction.jsonl pour voir ce qui se passe en coulisses.
📖 Lire la source complète : HN LLM Tools
👀 See Also

BotCost.dev : Analyseur gratuit pour voir combien coûtent les bots IA à votre site
BotCost.dev est un outil gratuit qui analyse vos journaux serveur par rapport à 18 empreintes de bots d'IA connus (GPTBot, ClaudeBot, Perplexity, etc.) et estime le coût mensuel de bande passante — aucun téléchargement requis, tout s'exécute dans le navigateur.

Trois dépôts pour le développement de RAG et d'Agents IA
Un post Reddit met en lumière trois dépôts pour les développeurs travaillant avec RAG et les agents IA : memvid pour la mémoire des agents, llama_index pour les pipelines RAG, et Continue pour les assistants de codage. L'auteur note que le RAG pur fonctionne mieux pour la récupération de connaissances, tandis que les systèmes de mémoire sont plus adaptés aux agents, les approches hybrides étant courantes dans les outils réels.

Passeport de Décision : Une Couche d'Audit pour la Gouvernance de l'Exécution des Agents IA
La fuite du code Claude met en lumière une lacune dans la gouvernance des agents d'IA. Decision Passport répond à cela avec des enregistrements d'exécution en ajout uniquement, des paquets de preuve portables et une vérification hors ligne pour des pistes d'audit résistantes à la falsification.

Claude-Control : Télécommande mobile pour les sessions de code Claude
Claude-control est un outil open-source qui vous permet de gérer les sessions Claude Code depuis votre téléphone via HTTPS et WebSocket. Il exécute Claude Code dans un véritable PTY à l'intérieur de tmux, détecte les invites de permission et envoie des notifications push avec des boutons Autoriser/Refuser.