Rekursiver Selbstverbesserungsrahmen für KI-Codierungsagenten mit Claude Code

Ein Entwickler hat ein Framework open-source gestellt, das KI-Coding-Agenten ermöglicht, sich selbst rekursiv mit Claude Code zu verbessern. Das System wurde nach monatelanger Forschung darüber entwickelt, wie Modellanbieter rekursive Agentenoptimierung implementieren.
So funktioniert es
Das Framework bietet einen strukturierten Ansatz zur Agentenverbesserung:
- Fügen Sie Ihrem Agenten mit 2 Codezeilen Tracing hinzu (oder überspringen Sie zu Schritt 3, wenn Sie bereits Traces haben)
- Führen Sie Ihren Agenten mehrmals aus, um Ausführungstraces zu sammeln
- Führen Sie
/recursive-improvein Claude Code aus - Das System analysiert Traces, findet Fehlermuster, plant Korrekturen und präsentiert sie zur Genehmigung
- Wenden Sie Korrekturen an, führen Sie den Agenten erneut aus und überprüfen Sie die Verbesserung mit
/benchmarkgegenüber der Basislinie - Wiederholen Sie die Zyklen, um die Verbesserung fortzusetzen
Autonome Option
Für vollständig autonomen Betrieb (ähnlich wie Karpathys Autoresearch):
- Führen Sie
/ratchetaus, um die gesamte Verbesserungsschleife automatisch auszuführen - Das System verbessert, bewertet und behält oder macht Änderungen rückgängig
- Nur Verbesserungen überleben
- Kann über Nacht laufen, um mit einem besseren Agenten aufzuwachen
Leistungsergebnisse
Getestet an einem realen Enterprise-Agenten-Benchmark (tau2) mit vollautomatischem Skill-Betrieb:
- 25 % Leistungssteigerung nach einem einzigen Verbesserungszyklus
Technischer Hintergrund
Die ursprüngliche Forschung umfasste den Aufbau einer rekursiven Sprachmodellarchitektur mit sandboxed REPL für Trace-Analyse im großen Maßstab, Multi-Agenten-Pipelines und anderen Komponenten. Der Entwickler stellte fest, dass die meisten Leute, die Agenten bauen, diese Komplexität nicht benötigen und dass Claude Code ausreichende Fähigkeiten für rekursive Selbstverbesserung bietet.
Das Framework sagt Ihrem Coding-Agenten: Hier sind die Traces, hier ist, wie man sie analysiert, hier ist, wie man Korrekturen priorisiert, und hier ist, wie man sie verifiziert.
Open-Source-Repository: https://github.com/kayba-ai/recursive-improve
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Lokales 35B MoE-Modell senkt Fehlerrate des Agent OS-Codes auf 0%
Ein Entwickler berichtet, dass das Umschalten der Laufzeit eines Multi-Agenten-Systems auf Qwen 3.6 35B A3B (MoE, 3B aktive Parameter) Code-Fehler beseitigte und durch ein 5-stufiges Validierungs-Gate eine 100%ige Erfolgsquote erzielte.

OpenClaws QMD-Speichersuche-Schnellpfad hatte stille Fehler
Die integrierte Speichersuche von OpenClaw verwendet einfache Schlüsselwortabgleiche, aber Benutzer können auf QMD umschalten, um semantische Suche über Workspace-Markdown-Dateien durchzuführen. Ein schneller Pfad durch MCPorter war durch drei Fehler unterbrochen, die jeden Aufruf zum stillen Scheitern brachten und auf langsamere CLI-Ausführung zurückfielen.

Microsoft Teams SDK fügt HTTP-Server-Adapter für bestehende KI-Agenten hinzu
Das Microsoft Teams SDK enthält nun einen HTTP-Server-Adapter, der Entwicklern ermöglicht, bestehende KI-Agenten mit Teams zu verbinden, ohne ihren Code neu schreiben zu müssen. Er funktioniert mit LangChain-Ketten, Slack-Bots und Azure-Foundry-Bereitstellungen, indem er einen POST /api/messages-Endpunkt in bestehende Express-Server einfügt.

Memorine: Ein lokales Speichersystem für OpenClaw-Agenten unter Verwendung von Python und SQLite
Memorine ist ein lokales Speichersystem für OpenClaw-Agenten, das ausschließlich Python und SQLite verwendet, ohne externe Abhängigkeiten, API-Aufrufe oder Telemetrie. Es bietet Fakten-Speicherung mit Volltextsuche, Gedächtnisverfall, Widerspruchserkennung, kausaler Ereignisverkettung und optionaler semantischer Suche über fastembed und sqlite-vec.