Claude Code Leak: KAIROS System & Agent Verification Gap

Was der Leak enthüllte

Anthropic hat versehentlich eine Quellkarte in ihrem npm-Paket mitgeliefert und damit die gesamte Claude Code-Codebasis offengelegt. Der Leak enthält 512.000 Zeilen TypeScript, 44 Feature-Flags und ein verstecktes System namens KAIROS.

KAIROS wird als ständig aktiver Hintergrundagent beschrieben, der mehrere Funktionen ausführt, während der Benutzer inaktiv ist:

Konsolidiert den Speicher
Führt Beobachtungen zusammen
Entfernt Widersprüche
Bereitet Kontext vor, damit er sauber ist, wenn der Benutzer zurückkehrt

Die Erfahrung der unabhängigen Entwicklung

Ein Einzelentwickler, der eine 668.000-Zeilen-TypeScript-Plattform mit Claude Code aufbaut, stieß auf dieselben Einschränkungen, die KAIROS adressiert. Er führt autonome Kampagnen über mehrere Sitzungen hinweg mit persistenten Zustandsdateien durch, die Kontext über Kontextfenstergrenzen hinweg transportieren.

Das Problem: Kampagnen stocken zwischen den Sitzungen. Wenn eine Phase abgeschlossen ist und später fortgesetzt wird, müssen Entwickler manuell neu starten, Kampagnendateien erneut lesen und herausfinden, wo sie aufgehört haben, weil der Speicher des Agenten mit der Sitzung endet.

Die von ihnen gebaute Lösung: ein Daemon, der Sitzungen über geplante Auslöser verkettet. Eine Sitzung endet, schreibt den Zustand, beendet mit Code 0 („keine Fehler“), und der Daemon erkennt das Ende, um die nächste Sitzung mit vollem Kontext zu starten. Dadurch wurden Kampagnen, die eine Woche manueller Neustarts benötigten, in einem Durchlauf abgeschlossen.

Das Verifikationsproblem

Der Entwickler stellte fest, dass Exit-Code 0 „keine Fehler“ bedeutet, aber nicht „es funktioniert“. In ihrer ersten Nacht mit dem Daemon lieferte ein Agent ein unsichtbares Feature – eine vollständige Kampagne wurde mit sauberer Typprüfung, null Warnungen und sicherer Beendigung abgeschlossen, aber 37 von 38 Entitäten fehlten in der eigentlichen Anwendung.

In einem anderen Fall ersetzte eine Flottensitzung 6 funktionierende Komponenten parallel, was dazu führte, dass Komponenten „Running NaN“ ohne Zeitachse oder Vitaldaten anzeigten. Die Agenten haben nie gerendert, was sie gebaut haben – sie haben nur überprüft, ob es kompiliert, und sind weitergegangen.

Die Verifikationsschicht-Lösung

Der Entwickler erkannte, dass „der Daemon allein ein schnellerer Weg ist, um fehlerhaften Code auszuliefern“. Sie bauten eine Verifikationsschicht, die Agenten zwingt, ihre Arbeit visuell nachzuweisen:

Echte Routen in einem echten Browser navigieren
DOM-Elemente zählen
Screenshots aufnehmen
Wenn eine Ansicht, die 38 Entitätskarten haben sollte, null hat, fängt das System es ab
Wenn ein Agent UI-Dateien geändert hat, kann er nicht ohne Screenshot-Artefakte abschließen

Dies ist als harte Sperre implementiert, nicht als Empfehlung.

Die grundlegende Lücke

KAIROS löst das Speicherproblem, aber nicht das Verifikationsproblem. Während es Beobachtungen zusammenführt, Widersprüche entfernt und vage Erkenntnisse in konkrete Fakten umwandelt, adressiert weder Speicherkonsolidierung noch Daemon-Modus die grundlegende Lücke: Agenten können ihre eigene Arbeit nicht visuell verifizieren. Sie können Struktur nachweisen, aber nicht das Erscheinungsbild.

Der Entwickler stellt fest, dass die Konvergenz zwischen Anthropics KAIROS und ihrer unabhängigen Lösung eine echte Grenze aufzeigt: Sobald Sitzungen lang genug sind und Kampagnen Tage umfassen, wird persistente Hintergrundausführung unvermeidlich. Allerdings: „Der Daemon ist der einfache Teil. Jeder kann Sitzungen verketten. Der schwierige Teil ist der Aufbau der Infrastruktur, die Fehler abfängt, die der Daemon sicher ausliefern wird.“

Wesentliche Erkenntnis

Wenn Sie irgendeine Form autonomer Agentenausführung aufbauen, stellen Sie eine Frage, bevor Sie ausliefern: Kann mein Agent beweisen, dass das, was er gebaut hat, tatsächlich funktioniert? Wenn die Antwort „es hat kompiliert“ lautet, werden Sie wahrscheinlich auf dieselben Probleme stoßen. Die 27 dokumentierten Postmortems des Entwicklers lehrten ihn, dass „der Daemon ein Kraftmultiplikator ist. Ohne eine Qualitätsschicht multipliziert er Ihre Fehler.“

Der Daemon, die Verifikationsschicht und das Kampagnenpersistenzsystem sind Open-Source auf github.com/SethGammon/Citadel.

📖 Read the full source: r/ClaudeAI

Durchgesickerter Claude-Code enthüllt KAIROS-System und die Verifikationslücke bei KI-Agenten

Was der Leak enthüllte

Die Erfahrung der unabhängigen Entwicklung

Das Verifikationsproblem

Die Verifikationsschicht-Lösung

Die grundlegende Lücke

Wesentliche Erkenntnis

👀 Siehe auch

KI-Agenten bevorzugen strukturierte Abfragen gegenüber natürlicher Sprache in Cala MCP-Server-Tests

Forschung zu professionellen sozialen Netzwerken für KI-Agenten

Claude Code lehnt angeblich Anfragen ab oder verlangt zusätzliche Gebühren, wenn Commits 'OpenClaw' erwähnen

Claude Code-Entwickler erkennt Denkfehler bei Anpassungsfähigkeit an und bietet Workaround