OpenEvol: Offline-Selbstverbesserungspipeline für LLMs unter Verwendung von Konversationsverlauf

✍️ OpenClawRadar📅 Veröffentlicht: 31. März 2026🔗 Source
OpenEvol: Offline-Selbstverbesserungspipeline für LLMs unter Verwendung von Konversationsverlauf
Ad

Was OpenEvol macht

OpenEvol ist eine Offline-Selbstverbesserungspipeline für große Sprachmodelle, die KI-Konversationsverläufe automatisch in Trainingsdaten umwandelt. Das Tool extrahiert hochwertige Austausche aus Konversationen, bewertet deren Qualität und erstellt Feinabstimmungsdatensätze ohne manuelle Kennzeichnung oder proprietäre Daten-Flywheels.

Wie es funktioniert

Die Pipeline durchläuft vier automatisierte Stufen:

  • Hochwertige Austausche aus Konversationen extrahieren
  • Qualität mithilfe von Regeln mit optionalem Lehrer-LLM bewerten
  • SFT-, Präferenz- und Vortrainingsdatensätze synthetisieren
  • Mit einem Befehl feinabstimmen

Dies schafft einen geschlossenen Kreislauf, in dem das Modell aus seinen eigenen Erfahrungen lernt.

Technische Details

Zum Starten wird keine GPU benötigt – die gesamte Pipeline läuft auf CPU mit einem Mock- oder OpenAI-kompatiblen Lehrer-Backend. Eine GPU kann hinzugefügt werden, wenn das Training beginnen soll.

Fünf Lehrer-Backends werden unterstützt:

  • Mock
  • Regelbasiert
  • OpenAI-kompatible API (jeder lokale Proxy funktioniert)
  • HuggingFace Transformers
  • vLLM
Ad

Nutzungsoptionen

Drei Möglichkeiten, OpenEvol zu verwenden:

  • CLI für Offline-Stapelverarbeitung
  • REST-API-Server für Automatisierung
  • OpenClaw-Desktop-Plugin, das Pipeline-Ausführungen direkt aus dem Chat auslöst

Qualitätskontrolle

Jeder Batch wird automatisch bewertet. Wenn die Genehmigungsrate unter 80% fällt, wird das Training blockiert und zur manuellen Überprüfung markiert, sodass Benutzer die Kontrolle darüber haben, welche Daten für das Training verwendet werden.

Dieses Tool ist nützlich für Entwickler, die ihre KI-Coding-Agenten mithilfe tatsächlicher Konversationsverläufe verbessern möchten, ohne Daten an externe Dienste zu senden.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

Antikörpersystem: Out-of-Band-Watchdog für OpenClaw-Agenten
Werkzeuge

Antikörpersystem: Out-of-Band-Watchdog für OpenClaw-Agenten

Das Antikörper-System ist eine Open-Source-Wächterlösung, die auf einem separaten Rechner läuft und OpenClaw-Agenten über SSH überwacht. Es implementiert abgestufte Reaktionen von der Erkennung bis zur Dienstwiederherstellung und ist so konzipiert, dass es Ausfälle übersteht, die den primären Agenten lahmlegen.

OpenClawRadar
Layerkit: KI-Bildeditor mit bearbeitbaren Ebenen – entwickelt mit Claude Code
Werkzeuge

Layerkit: KI-Bildeditor mit bearbeitbaren Ebenen – entwickelt mit Claude Code

Ein Entwickler hat Layerkit erstellt, einen browserbasierten KI-Bildeditor, der Szenen mit bearbeitbaren Ebenen generiert, um ständiges Neu-Eingeben von Prompts zu vermeiden. Das Tool verwendet eine mehrstufige KI-Pipeline, bei der ein LLM die Komposition plant, ein Bildmodell die Szene generiert und ein weiteres LLM das tatsächliche Bild analysiert, um lesbaren Text zu platzieren.

OpenClawRadar
Start Engine MCP Server bietet eine 39-Tool-Pipeline für die Geschäftsvalidierung.
Werkzeuge

Start Engine MCP Server bietet eine 39-Tool-Pipeline für die Geschäftsvalidierung.

Launch Engine ist ein MCP-Server, der Claude eine strukturierte Pipeline mit 39 miteinander verbundenen SOP-Tools bietet, die in 5 Ebenen organisiert sind, um Geschäftsideen von der Konzeption bis zur validierten Umsatzgenerierung zu führen. Das System umfasst spezialisierte Subagenten, Voraussetzungsprüfungen sowie Tools für Batch-Auswertungen und schnelles Testen.

OpenClawRadar
ELBO-Plattform: KI-gestütztes Training für kritisches Denken und Kommunikationsfähigkeiten
Werkzeuge

ELBO-Plattform: KI-gestütztes Training für kritisches Denken und Kommunikationsfähigkeiten

ELBO ist eine Live-Trainingsplattform, die mit Claude Code entwickelt wurde und KI nutzt, um Benutzern durch simulierte Szenarien und Debatten dabei zu helfen, kritisches Denken, Überzeugungskraft, Verhandlungsgeschick und öffentliches Sprechen zu üben.

OpenClawRadar