Calmkeep: Eine externe Kontinuitätsschicht zur Bekämpfung von LLM-Drift in Langzeitsitzungen

Bewältigung von LLM-Drift in professionellen Arbeitsabläufen
Calmkeep ist eine externe Kontinuitätsschicht, die speziell entwickelt wurde, um dem sogenannten "strukturellen Drift" in LLMs während längerer Sitzungen entgegenzuwirken. Dieser Drift tritt auf, wenn LLMs wie Claude nach und nach frühere Entscheidungen, Muster oder Rahmenbedingungen aufgeben, selbst wenn das gesamte Kontextfenster sie noch enthält – nicht durch Halluzinationen, sondern durch systematisches Verlassen etablierter Muster.
Testergebnisse und Methodik
Der Ersteller führte adversarische Audits durch, wobei Claude selbst als Bewertungssystem diente, mit einer Blindmethode und Bewertung nach Kriterien, die in den ersten fünf Zügen festgelegt wurden. Claude bewertete Calmkeep-Transkripte durchweg höher als seine eigenen Ausgaben.
25-Zug-Backend-Build-Test
- Standard-Claude: 60 % finale Integrität, 8 Architekturverletzungen, 40 % Drift-Koeffizient
- Calmkeep: 85 % Integrität, 3 Architekturverletzungen, kein Rückschritt nach Zug 14
Das aufschlussreichste Beispiel: Claude führte Zod-Middleware in Zug 14 ein, kehrte dann sofort für die nächsten drei Module zu raw parseInt zurück, als ob das Upgrade nie stattgefunden hätte.
25-Zug-Juristische/Strategische Sitzung
- Standard-Claude: 50 % strategische Integrität, 5 Verletzungen einschließlich einer Rechtsverschiebung, die den früheren rechtlichen Rahmen ungültig machte, ~35 % Fehlverhaltensrisiko
- Calmkeep: 100 % Integrität, null Verletzungen, <5 % Risiko
Technische Umsetzung
Calmkeep umfasst:
- MCP-Connector
- Claude Code-Plugin
- Python SDK
Das System arbeitet nur als externe Laufzeitumgebung, erfordert einen eigenen Anthropic-Schlüssel, hat keinen versteckten Speicher und nimmt keine Gewichtsänderungen am zugrunde liegenden Modell vor.
Verfügbarkeit und Tests
Eine kostenlose 14-tägige Testversion ist über Stripe unter https://calmkeep.ai erhältlich. Vollständige Testberichte, Methodik, AVE-Klassifizierungen, Bewertungsraster und Zug-für-Zug-Aufschlüsselungen sind verfügbar unter:
- https://calmkeep.ai/codetestreport
- https://calmkeep.ai/legaltestreport
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

memora: versionskontrollierter, typisierter Speicher für KI-Agenten – Git für KI-Überzeugungen
memora ist ein CLI-Tool in Rust, das KI-Agentenspeicher versioniert – typisiert, mit Herkunftsnachweis, verzweigbar und zusammenführbar.

free-claude-code fügt GLM-5-Unterstützung über NVIDIA NIM hinzu und erweitert auf OpenRouter und Discord
free-claude-code unterstützt jetzt GLM-5 über die kostenlose Stufe von NVIDIA NIM (40 Anfragen/Minute) und fügt OpenRouter-Integration, Discord-Bot-Unterstützung und LMStudio-Local-Provider-Kompatibilität hinzu. Das Tool wandelt Claude Codes Anthropic-API-Anfragen um, um mit alternativen Modell-Backends zu arbeiten.

LLM Circuit Finder: Verdreifachen Sie Schichten, um das Denkvermögen ohne Training zu steigern
Ein neues Toolkit findet 'Reasoning Circuits' in Transformer-Modellen – zusammenhängende Blöcke von 3-4 Schichten, die als unteilbare kognitive Einheiten fungieren. Das Duplizieren dieser Blöcke (Schichten 12-14 in Devstral-24B) verbessert die logische Deduktion von 0,22 auf 0,76 in BBH-Benchmarks, ohne Gewichtsänderungen oder Training.

Telegram-Bot zur CLI-Steuerung von Claude Code vom Mobilgerät aus
Ein Entwickler hat einen Telegram-Bot erstellt, der eine Brücke zur Claude Code CLI schlägt und die Steuerung über mobile Befehle wie /commit, /code_review und /simplify ermöglicht. Der Bot entdeckt automatisch benutzerdefinierte Fähigkeiten, verarbeitet Fotos/Dokumente/Sprachnachrichten und unterstützt Gruppenchat-Sitzungen.