Durchgesickerter Claude-Code enthüllt KAIROS-System und die Verifikationslücke bei KI-Agenten

✍️ OpenClawRadar📅 Veröffentlicht: 5. April 2026🔗 Source
Durchgesickerter Claude-Code enthüllt KAIROS-System und die Verifikationslücke bei KI-Agenten
Ad

Was der Leak enthüllte

Anthropic hat versehentlich eine Quellkarte in ihrem npm-Paket mitgeliefert und damit die gesamte Claude Code-Codebasis offengelegt. Der Leak enthält 512.000 Zeilen TypeScript, 44 Feature-Flags und ein verstecktes System namens KAIROS.

KAIROS wird als ständig aktiver Hintergrundagent beschrieben, der mehrere Funktionen ausführt, während der Benutzer inaktiv ist:

  • Konsolidiert den Speicher
  • Führt Beobachtungen zusammen
  • Entfernt Widersprüche
  • Bereitet Kontext vor, damit er sauber ist, wenn der Benutzer zurückkehrt

Die Erfahrung der unabhängigen Entwicklung

Ein Einzelentwickler, der eine 668.000-Zeilen-TypeScript-Plattform mit Claude Code aufbaut, stieß auf dieselben Einschränkungen, die KAIROS adressiert. Er führt autonome Kampagnen über mehrere Sitzungen hinweg mit persistenten Zustandsdateien durch, die Kontext über Kontextfenstergrenzen hinweg transportieren.

Das Problem: Kampagnen stocken zwischen den Sitzungen. Wenn eine Phase abgeschlossen ist und später fortgesetzt wird, müssen Entwickler manuell neu starten, Kampagnendateien erneut lesen und herausfinden, wo sie aufgehört haben, weil der Speicher des Agenten mit der Sitzung endet.

Die von ihnen gebaute Lösung: ein Daemon, der Sitzungen über geplante Auslöser verkettet. Eine Sitzung endet, schreibt den Zustand, beendet mit Code 0 („keine Fehler“), und der Daemon erkennt das Ende, um die nächste Sitzung mit vollem Kontext zu starten. Dadurch wurden Kampagnen, die eine Woche manueller Neustarts benötigten, in einem Durchlauf abgeschlossen.

Das Verifikationsproblem

Der Entwickler stellte fest, dass Exit-Code 0 „keine Fehler“ bedeutet, aber nicht „es funktioniert“. In ihrer ersten Nacht mit dem Daemon lieferte ein Agent ein unsichtbares Feature – eine vollständige Kampagne wurde mit sauberer Typprüfung, null Warnungen und sicherer Beendigung abgeschlossen, aber 37 von 38 Entitäten fehlten in der eigentlichen Anwendung.

In einem anderen Fall ersetzte eine Flottensitzung 6 funktionierende Komponenten parallel, was dazu führte, dass Komponenten „Running NaN“ ohne Zeitachse oder Vitaldaten anzeigten. Die Agenten haben nie gerendert, was sie gebaut haben – sie haben nur überprüft, ob es kompiliert, und sind weitergegangen.

Ad

Die Verifikationsschicht-Lösung

Der Entwickler erkannte, dass „der Daemon allein ein schnellerer Weg ist, um fehlerhaften Code auszuliefern“. Sie bauten eine Verifikationsschicht, die Agenten zwingt, ihre Arbeit visuell nachzuweisen:

  • Echte Routen in einem echten Browser navigieren
  • DOM-Elemente zählen
  • Screenshots aufnehmen
  • Wenn eine Ansicht, die 38 Entitätskarten haben sollte, null hat, fängt das System es ab
  • Wenn ein Agent UI-Dateien geändert hat, kann er nicht ohne Screenshot-Artefakte abschließen

Dies ist als harte Sperre implementiert, nicht als Empfehlung.

Die grundlegende Lücke

KAIROS löst das Speicherproblem, aber nicht das Verifikationsproblem. Während es Beobachtungen zusammenführt, Widersprüche entfernt und vage Erkenntnisse in konkrete Fakten umwandelt, adressiert weder Speicherkonsolidierung noch Daemon-Modus die grundlegende Lücke: Agenten können ihre eigene Arbeit nicht visuell verifizieren. Sie können Struktur nachweisen, aber nicht das Erscheinungsbild.

Der Entwickler stellt fest, dass die Konvergenz zwischen Anthropics KAIROS und ihrer unabhängigen Lösung eine echte Grenze aufzeigt: Sobald Sitzungen lang genug sind und Kampagnen Tage umfassen, wird persistente Hintergrundausführung unvermeidlich. Allerdings: „Der Daemon ist der einfache Teil. Jeder kann Sitzungen verketten. Der schwierige Teil ist der Aufbau der Infrastruktur, die Fehler abfängt, die der Daemon sicher ausliefern wird.“

Wesentliche Erkenntnis

Wenn Sie irgendeine Form autonomer Agentenausführung aufbauen, stellen Sie eine Frage, bevor Sie ausliefern: Kann mein Agent beweisen, dass das, was er gebaut hat, tatsächlich funktioniert? Wenn die Antwort „es hat kompiliert“ lautet, werden Sie wahrscheinlich auf dieselben Probleme stoßen. Die 27 dokumentierten Postmortems des Entwicklers lehrten ihn, dass „der Daemon ein Kraftmultiplikator ist. Ohne eine Qualitätsschicht multipliziert er Ihre Fehler.“

Der Daemon, die Verifikationsschicht und das Kampagnenpersistenzsystem sind Open-Source auf github.com/SethGammon/Citadel.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

OpenClaw Docker-Benutzer: Update 2026.3.13 – Fehlende Docker-Tags
Nachrichten

OpenClaw Docker-Benutzer: Update 2026.3.13 – Fehlende Docker-Tags

OpenClaw Version 2026.3.13 wurde veröffentlicht, aber Docker-Nutzer sollten ein Update vermeiden, da dem Docker-Image sowohl das 'latest'- als auch das '2026.3.13'-Tag fehlen. Nutzer, die npm oder git verwenden, sind nicht betroffen.

OpenClawRadar
OpenClaw Mistral Provider seit Update 2026.3.8 defekt, Community sucht nach Alternativen
Nachrichten

OpenClaw Mistral Provider seit Update 2026.3.8 defekt, Community sucht nach Alternativen

OpenClaw-Benutzer melden seit dem Update auf Version 2026.3.8 anhaltende HTTP-422-Fehler bei Mistral-Modellen, ohne dass in den nachfolgenden Versionen bis 2026.3.13 eine Lösung bereitgestellt wurde. Das Problem betrifft alle Mistral-bezogenen Funktionen, während direkte API-Aufrufe normal funktionieren.

OpenClawRadar
Klärung der Automatisierungsfähigkeiten von OpenClaw
Nachrichten

Klärung der Automatisierungsfähigkeiten von OpenClaw

OpenClaw führt keine vollständig automatisierten Aufgaben unabhängig aus; es benötigt Benutzeranleitungen für die Einrichtung und verhält sich mehr wie ein traditionelles LLM.

OpenClawRadar
Anthropic startet Claude Partner Network mit 100 Millionen US-Dollar Investition
Nachrichten

Anthropic startet Claude Partner Network mit 100 Millionen US-Dollar Investition

Anthropic startet das Claude Partner Network mit einer anfänglichen Investition von 100 Millionen US-Dollar für 2026, das Schulungen, technischen Support und gemeinsame Marktentwicklung für Organisationen bietet, die Unternehmen bei der Einführung von Claude unterstützen. Partner erhalten Zugang zu technischen Zertifizierungen, einem Partner-Portal mit Schulungsmaterialien und einem Code-Modernisierung-Starterkit für die Migration von Legacy-Code.

OpenClawRadar