Calmkeep : 85% d'intégrité LLM sur 25 tours

Résoudre la dérive des LLM dans les flux de travail professionnels

Calmkeep est une couche de continuité externe construite spécifiquement pour contrer ce que son créateur appelle la "dérive structurelle" des LLM lors de sessions prolongées. Cette dérive se produit lorsque des LLM comme Claude abandonnent progressivement des décisions, des modèles ou des cadres établis précédemment, même lorsque la fenêtre de contexte complète les contient encore — non pas par hallucination, mais par un abandon systématique des modèles établis.

Résultats des tests et méthodologie

Le créateur a mené des audits adversariaux en utilisant Claude lui-même comme système d'évaluation, avec une méthodologie en aveugle et une notation basée sur des critères établis dans les cinq premiers tours. Claude a systématiquement attribué des notes plus élevées aux transcriptions de Calmkeep qu'à ses propres sorties.

Test de construction backend de 25 tours

Claude standard : 60 % d'intégrité finale, 8 violations architecturales, coefficient de dérive de 40 %
Calmkeep : 85 % d'intégrité, 3 violations architecturales, aucune régression après le tour 14

L'exemple le plus révélateur : Claude a introduit un middleware Zod au tour 14, puis est immédiatement revenu à parseInt brut pour les trois modules suivants, comme si la mise à niveau n'avait jamais eu lieu.

Session juridique/stratégique de 25 tours

Claude standard : 50 % d'intégrité stratégique, 5 violations incluant un changement de juridiction qui a invalidé le cadre juridique précédent, ~35 % d'exposition à la faute professionnelle
Calmkeep : 100 % d'intégrité, zéro violation, <5 % de risque

Implémentation technique

Calmkeep inclut :

Connecteur MCP
Plugin Claude Code
SDK Python

Le système fonctionne uniquement comme runtime externe, nécessite l'utilisation de votre propre clé Anthropic, n'a pas de mémoire cachée et ne modifie pas les poids du modèle sous-jacent.

Disponibilité et tests

Un essai gratuit de 14 jours est disponible via Stripe à l'adresse https://calmkeep.ai. Les rapports de test complets, la méthodologie, les classifications AVE, la grille de notation et les analyses tour par tour sont disponibles à :

https://calmkeep.ai/codetestreport
https://calmkeep.ai/legaltestreport

📖 Read the full source: r/ClaudeAI

Calmkeep : Une couche de continuité externe pour contrer la dérive des LLM dans les sessions prolongées

Résoudre la dérive des LLM dans les flux de travail professionnels

Résultats des tests et méthodologie

Test de construction backend de 25 tours

Session juridique/stratégique de 25 tours

Implémentation technique

Disponibilité et tests

👀 See Also

Tether : Un serveur MCP pour le partage de contexte entre modèles d'IA via SQLite

Développeur a créé un tableau d'emplois IA/ML en utilisant Claude Code pour la conception et le SEO

PhAIL Benchmark Évalue les Modèles VLA sur des Tâches Réelles de Robotique d'Entrepôt

Boucle de révision inter-modèles pour les agents d'IA de codage : détection des défauts critiques de planification