Calmkeep : Une couche de continuité externe pour contrer la dérive des LLM dans les sessions prolongées

✍️ OpenClawRadar📅 Publié: March 17, 2026🔗 Source
Calmkeep : Une couche de continuité externe pour contrer la dérive des LLM dans les sessions prolongées
Ad

Résoudre la dérive des LLM dans les flux de travail professionnels

Calmkeep est une couche de continuité externe construite spécifiquement pour contrer ce que son créateur appelle la "dérive structurelle" des LLM lors de sessions prolongées. Cette dérive se produit lorsque des LLM comme Claude abandonnent progressivement des décisions, des modèles ou des cadres établis précédemment, même lorsque la fenêtre de contexte complète les contient encore — non pas par hallucination, mais par un abandon systématique des modèles établis.

Résultats des tests et méthodologie

Le créateur a mené des audits adversariaux en utilisant Claude lui-même comme système d'évaluation, avec une méthodologie en aveugle et une notation basée sur des critères établis dans les cinq premiers tours. Claude a systématiquement attribué des notes plus élevées aux transcriptions de Calmkeep qu'à ses propres sorties.

Test de construction backend de 25 tours

  • Claude standard : 60 % d'intégrité finale, 8 violations architecturales, coefficient de dérive de 40 %
  • Calmkeep : 85 % d'intégrité, 3 violations architecturales, aucune régression après le tour 14

L'exemple le plus révélateur : Claude a introduit un middleware Zod au tour 14, puis est immédiatement revenu à parseInt brut pour les trois modules suivants, comme si la mise à niveau n'avait jamais eu lieu.

Ad

Session juridique/stratégique de 25 tours

  • Claude standard : 50 % d'intégrité stratégique, 5 violations incluant un changement de juridiction qui a invalidé le cadre juridique précédent, ~35 % d'exposition à la faute professionnelle
  • Calmkeep : 100 % d'intégrité, zéro violation, <5 % de risque

Implémentation technique

Calmkeep inclut :

  • Connecteur MCP
  • Plugin Claude Code
  • SDK Python

Le système fonctionne uniquement comme runtime externe, nécessite l'utilisation de votre propre clé Anthropic, n'a pas de mémoire cachée et ne modifie pas les poids du modèle sous-jacent.

Disponibilité et tests

Un essai gratuit de 14 jours est disponible via Stripe à l'adresse https://calmkeep.ai. Les rapports de test complets, la méthodologie, les classifications AVE, la grille de notation et les analyses tour par tour sont disponibles à :

  • https://calmkeep.ai/codetestreport
  • https://calmkeep.ai/legaltestreport

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

VibeSmith : Outil local pour détecter les conflits de compétences dans les projets de code Claude
Tools

VibeSmith : Outil local pour détecter les conflits de compétences dans les projets de code Claude

VibeSmith est une application de bureau macOS locale qui offre une visibilité unifiée sur les projets Claude Code, détectant les conflits lorsque des composants globaux et au niveau du projet partagent des noms, visualisant les dépendances sous forme de DAG et suivant l'utilisation des jetons de contexte.

OpenClawRadar
Serveur MCP OpenGalatea Connecte Claude aux Imprimantes 3D Prusa
Tools

Serveur MCP OpenGalatea Connecte Claude aux Imprimantes 3D Prusa

OpenGalatea est un serveur MCP open-source qui permet à Claude de contrôler des imprimantes 3D Prusa via PrusaLink, autorisant des commandes en langage naturel pour rechercher sur Printables.com, découper des modèles et gérer les impressions.

OpenClawRadar
Qwen 3.6 27B avec MTP sur V100 32GB : 54 t/s via la branche llama.cpp
Tools

Qwen 3.6 27B avec MTP sur V100 32GB : 54 t/s via la branche llama.cpp

La branche MTP d'am17an de llama.cc fait tourner Qwen 3.6 27B à 54 t/s sur V100 32GB via adaptateur PCIe, tombant à 29-30 t/s sans MTP.

OpenClawRadar
Application de Bureau Claude Fonction de Collaboration Permet la Communication IA-à-IA via Google Docs Partagés
Tools

Application de Bureau Claude Fonction de Collaboration Permet la Communication IA-à-IA via Google Docs Partagés

Les utilisateurs de Claude ont réussi à mettre en œuvre une communication Claude-à-Claude en utilisant la nouvelle fonction de collaboration dans l'application de bureau, avec deux agents d'IA lisant et écrivant dans un Google Doc partagé lors d'un dialogue structuré en cinq échanges.

OpenClawRadar