OpenEvol v0.1.1: Offline LLM Self-Improvement Using Conversation History

Was OpenEvol macht

OpenEvol ist eine Offline-Selbstverbesserungspipeline für große Sprachmodelle, die KI-Konversationsverläufe automatisch in Trainingsdaten umwandelt. Das Tool extrahiert hochwertige Austausche aus Konversationen, bewertet deren Qualität und erstellt Feinabstimmungsdatensätze ohne manuelle Kennzeichnung oder proprietäre Daten-Flywheels.

Wie es funktioniert

Die Pipeline durchläuft vier automatisierte Stufen:

Hochwertige Austausche aus Konversationen extrahieren
Qualität mithilfe von Regeln mit optionalem Lehrer-LLM bewerten
SFT-, Präferenz- und Vortrainingsdatensätze synthetisieren
Mit einem Befehl feinabstimmen

Dies schafft einen geschlossenen Kreislauf, in dem das Modell aus seinen eigenen Erfahrungen lernt.

Technische Details

Zum Starten wird keine GPU benötigt – die gesamte Pipeline läuft auf CPU mit einem Mock- oder OpenAI-kompatiblen Lehrer-Backend. Eine GPU kann hinzugefügt werden, wenn das Training beginnen soll.

Fünf Lehrer-Backends werden unterstützt:

Mock
Regelbasiert
OpenAI-kompatible API (jeder lokale Proxy funktioniert)
HuggingFace Transformers
vLLM

Nutzungsoptionen

Drei Möglichkeiten, OpenEvol zu verwenden:

CLI für Offline-Stapelverarbeitung
REST-API-Server für Automatisierung
OpenClaw-Desktop-Plugin, das Pipeline-Ausführungen direkt aus dem Chat auslöst

Qualitätskontrolle

Jeder Batch wird automatisch bewertet. Wenn die Genehmigungsrate unter 80% fällt, wird das Training blockiert und zur manuellen Überprüfung markiert, sodass Benutzer die Kontrolle darüber haben, welche Daten für das Training verwendet werden.

Dieses Tool ist nützlich für Entwickler, die ihre KI-Coding-Agenten mithilfe tatsächlicher Konversationsverläufe verbessern möchten, ohne Daten an externe Dienste zu senden.

📖 Read the full source: r/openclaw

OpenEvol: Offline-Selbstverbesserungspipeline für LLMs unter Verwendung von Konversationsverlauf

Was OpenEvol macht

Wie es funktioniert

Technische Details

Nutzungsoptionen

Qualitätskontrolle

👀 Siehe auch

OpenClaw Skill Pack: Ein Command-Set mit über 2.500 Befehlen für echte autonome Operationen auf Ubuntu

Benchmark zeigt: KI-Browser-Automatisierungstools variieren um das 2,6-fache bei den Token-Kosten trotz identischer Genauigkeit

Claude Workflow-Bibliothek verfolgt und bewertet jetzt automatisch Workflows aus Reddit

Claude-voice: Lokale TTS mit Wort-Hervorhebung für Claude Code