CrabMeat v0.1.0 : Une passerelle d'agents axée sur la sécurité qui ne fait pas confiance au LLM en matière de frontière de sécurité

CrabMeat v0.1.0 est sorti hier sous licence Apache 2.0, construit sur une thèse de conception : le LLM ne détient jamais la frontière de sécurité. Le projet est une réponse directe à des échecs comme celui de l'agent de Summer Yue qui a supprimé plus de 200 e-mails — où une instruction de sécurité était une invite qui a été compactée.
Protections clés (toutes toujours actives, pas de bascule de configuration)
- Indirection des ID de capacité — Le modèle voit des ID opaques dérivés de HMAC par session comme
cap_a4f9e2b71c83, jamais les vrais noms d'outils. Il ne peut pas deviner ou falsifier un nom d'outil car il n'en connaît aucun. - Classes d'effet — Chaque outil déclare une classe (
read,write,exec,network). Chaque agent déclare les classes qu'il peut utiliser. La vérification est une fonction pure sans état d'exécution, facile à tester exhaustivement, difficile à contourner. - IRONCLAD_CONTEXT — Les instructions de sécurité critiques sont épinglées en haut de la fenêtre de contexte et explicitement marquées comme non compactables. Le mode de défaillance par compactage qui a supprimé l'instruction de Yue ne peut pas se produire.
- Chaîne d'audit inviolable — Chaque appel d'outil, opération privilégiée et exécution de planificateur entre dans le même journal chaîné par hachage SHA-256. La falsification est prouvable.
- Filtre de fuite de sortie en streaming — Les secrets (clés API, JWT, blocs PEM, ID de capacité) sont masqués en cours de streaming entre les limites des jetons avant d'atteindre le client.
- Pas de mode YOLO — Il n'y a pas de commutateur global « faire confiance au LLM pour tout ». L'extension des capacités se fait via des racines nommées avec portée, explicites, auditées et limitées.
Le README liste 15 protections toujours actives dans un tableau ; aucune ne peut être désactivée par configuration. La passerelle est locale par défaut, configurée pour Ollama, LM Studio, vLLM prête à l'emploi. Anthropic et OpenAI nécessitent une configuration explicite — pas d'envoi silencieux vers le cloud.
À qui cela s'adresse
Développeurs construisant des systèmes agentiques ayant besoin de garanties architecturales, et non de sécurité basée sur des invites, et souhaitant une passerelle à laquelle ils peuvent confier l'exécution d'outils et des données sensibles.
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Orchino : Système d'Orchestration Multi-Agents Local pour Windows avec Automatisation Parallèle de Navigateur et d'Interface Utilisateur
Orchino est un système d'orchestration multi-agents local pour Windows qui exécute en parallèle des tâches de navigation et des tâches Windows sans détourner l'interface utilisateur. Une démonstration montre 4 agents accomplissant 'Rechercher les écouteurs Sony sur Flipkart et Amazon, envoyer les résultats par email, sauvegarder dans le Bloc-notes' en 29,5 secondes grâce à une véritable exécution parallèle.

Agent OS Creux : Exécutez des agents de type Claude localement sur RTX 5070 avec Qwen 3.5 9B
Un système d'agents auto-modifiables utilisant Qwen 3.5 9B sur du matériel local réduit les coûts de l'API Claude de 50 %. Utilise une boucle de test itératif et d'auto-amélioration pour développer des logiciels sans intervention humaine.

jsongrep : Un outil de requête JSON basé sur un DFA qui surpasse jq dans les benchmarks
jsongrep est un outil en ligne de commande basé sur Rust permettant d'interroger des documents JSON en utilisant une syntaxe de langage régulier qui se compile en automates finis déterministes (DFA), obtenant des temps de recherche plus rapides que jq, jmespath, jsonpath-rust et jql dans les benchmarks.

Bespoke AI v0.8.1 : Extension d'auto-complétion VS Code pour le code et le texte
Bespoke AI v0.8.1 est une extension VS Code qui fournit une fonctionnalité d'autocomplétion à la fois pour le code et le texte, exploitant les abonnements Claude Code via le SDK Agent d'Anthropic pour éviter les frais d'API tout en prenant en charge plusieurs backends dont Ollama.