Rekursive Selbstverbesserung für KI-Coding-Agenten mit Claude Code

Ein Entwickler hat ein Framework open-source gestellt, das KI-Coding-Agenten ermöglicht, sich selbst rekursiv mit Claude Code zu verbessern. Das System wurde nach monatelanger Forschung darüber entwickelt, wie Modellanbieter rekursive Agentenoptimierung implementieren.

So funktioniert es

Das Framework bietet einen strukturierten Ansatz zur Agentenverbesserung:

Fügen Sie Ihrem Agenten mit 2 Codezeilen Tracing hinzu (oder überspringen Sie zu Schritt 3, wenn Sie bereits Traces haben)
Führen Sie Ihren Agenten mehrmals aus, um Ausführungstraces zu sammeln
Führen Sie /recursive-improve in Claude Code aus
Das System analysiert Traces, findet Fehlermuster, plant Korrekturen und präsentiert sie zur Genehmigung
Wenden Sie Korrekturen an, führen Sie den Agenten erneut aus und überprüfen Sie die Verbesserung mit /benchmark gegenüber der Basislinie
Wiederholen Sie die Zyklen, um die Verbesserung fortzusetzen

Autonome Option

Für vollständig autonomen Betrieb (ähnlich wie Karpathys Autoresearch):

Führen Sie /ratchet aus, um die gesamte Verbesserungsschleife automatisch auszuführen
Das System verbessert, bewertet und behält oder macht Änderungen rückgängig
Nur Verbesserungen überleben
Kann über Nacht laufen, um mit einem besseren Agenten aufzuwachen

Leistungsergebnisse

Getestet an einem realen Enterprise-Agenten-Benchmark (tau2) mit vollautomatischem Skill-Betrieb:

25 % Leistungssteigerung nach einem einzigen Verbesserungszyklus

Technischer Hintergrund

Die ursprüngliche Forschung umfasste den Aufbau einer rekursiven Sprachmodellarchitektur mit sandboxed REPL für Trace-Analyse im großen Maßstab, Multi-Agenten-Pipelines und anderen Komponenten. Der Entwickler stellte fest, dass die meisten Leute, die Agenten bauen, diese Komplexität nicht benötigen und dass Claude Code ausreichende Fähigkeiten für rekursive Selbstverbesserung bietet.

Das Framework sagt Ihrem Coding-Agenten: Hier sind die Traces, hier ist, wie man sie analysiert, hier ist, wie man Korrekturen priorisiert, und hier ist, wie man sie verifiziert.

Open-Source-Repository: https://github.com/kayba-ai/recursive-improve

📖 Read the full source: r/ClaudeAI