OpenEvol: Offline-Selbstverbesserungspipeline für LLMs unter Verwendung von Konversationsverlauf

Was OpenEvol macht
OpenEvol ist eine Offline-Selbstverbesserungspipeline für große Sprachmodelle, die KI-Konversationsverläufe automatisch in Trainingsdaten umwandelt. Das Tool extrahiert hochwertige Austausche aus Konversationen, bewertet deren Qualität und erstellt Feinabstimmungsdatensätze ohne manuelle Kennzeichnung oder proprietäre Daten-Flywheels.
Wie es funktioniert
Die Pipeline durchläuft vier automatisierte Stufen:
- Hochwertige Austausche aus Konversationen extrahieren
- Qualität mithilfe von Regeln mit optionalem Lehrer-LLM bewerten
- SFT-, Präferenz- und Vortrainingsdatensätze synthetisieren
- Mit einem Befehl feinabstimmen
Dies schafft einen geschlossenen Kreislauf, in dem das Modell aus seinen eigenen Erfahrungen lernt.
Technische Details
Zum Starten wird keine GPU benötigt – die gesamte Pipeline läuft auf CPU mit einem Mock- oder OpenAI-kompatiblen Lehrer-Backend. Eine GPU kann hinzugefügt werden, wenn das Training beginnen soll.
Fünf Lehrer-Backends werden unterstützt:
- Mock
- Regelbasiert
- OpenAI-kompatible API (jeder lokale Proxy funktioniert)
- HuggingFace Transformers
- vLLM
Nutzungsoptionen
Drei Möglichkeiten, OpenEvol zu verwenden:
- CLI für Offline-Stapelverarbeitung
- REST-API-Server für Automatisierung
- OpenClaw-Desktop-Plugin, das Pipeline-Ausführungen direkt aus dem Chat auslöst
Qualitätskontrolle
Jeder Batch wird automatisch bewertet. Wenn die Genehmigungsrate unter 80% fällt, wird das Training blockiert und zur manuellen Überprüfung markiert, sodass Benutzer die Kontrolle darüber haben, welche Daten für das Training verwendet werden.
Dieses Tool ist nützlich für Entwickler, die ihre KI-Coding-Agenten mithilfe tatsächlicher Konversationsverläufe verbessern möchten, ohne Daten an externe Dienste zu senden.
📖 Read the full source: r/openclaw
👀 Siehe auch

Antikörpersystem: Out-of-Band-Watchdog für OpenClaw-Agenten
Das Antikörper-System ist eine Open-Source-Wächterlösung, die auf einem separaten Rechner läuft und OpenClaw-Agenten über SSH überwacht. Es implementiert abgestufte Reaktionen von der Erkennung bis zur Dienstwiederherstellung und ist so konzipiert, dass es Ausfälle übersteht, die den primären Agenten lahmlegen.

Layerkit: KI-Bildeditor mit bearbeitbaren Ebenen – entwickelt mit Claude Code
Ein Entwickler hat Layerkit erstellt, einen browserbasierten KI-Bildeditor, der Szenen mit bearbeitbaren Ebenen generiert, um ständiges Neu-Eingeben von Prompts zu vermeiden. Das Tool verwendet eine mehrstufige KI-Pipeline, bei der ein LLM die Komposition plant, ein Bildmodell die Szene generiert und ein weiteres LLM das tatsächliche Bild analysiert, um lesbaren Text zu platzieren.

Start Engine MCP Server bietet eine 39-Tool-Pipeline für die Geschäftsvalidierung.
Launch Engine ist ein MCP-Server, der Claude eine strukturierte Pipeline mit 39 miteinander verbundenen SOP-Tools bietet, die in 5 Ebenen organisiert sind, um Geschäftsideen von der Konzeption bis zur validierten Umsatzgenerierung zu führen. Das System umfasst spezialisierte Subagenten, Voraussetzungsprüfungen sowie Tools für Batch-Auswertungen und schnelles Testen.

ELBO-Plattform: KI-gestütztes Training für kritisches Denken und Kommunikationsfähigkeiten
ELBO ist eine Live-Trainingsplattform, die mit Claude Code entwickelt wurde und KI nutzt, um Benutzern durch simulierte Szenarien und Debatten dabei zu helfen, kritisches Denken, Überzeugungskraft, Verhandlungsgeschick und öffentliches Sprechen zu üben.