OpenEvol: Offline-Selbstverbesserungspipeline für LLMs unter Verwendung von Konversationsverlauf

✍️ OpenClawRadar📅 Veröffentlicht: 31. März 2026🔗 Source
OpenEvol: Offline-Selbstverbesserungspipeline für LLMs unter Verwendung von Konversationsverlauf
Ad

Was OpenEvol macht

OpenEvol ist eine Offline-Selbstverbesserungspipeline für große Sprachmodelle, die KI-Konversationsverläufe automatisch in Trainingsdaten umwandelt. Das Tool extrahiert hochwertige Austausche aus Konversationen, bewertet deren Qualität und erstellt Feinabstimmungsdatensätze ohne manuelle Kennzeichnung oder proprietäre Daten-Flywheels.

Wie es funktioniert

Die Pipeline durchläuft vier automatisierte Stufen:

  • Hochwertige Austausche aus Konversationen extrahieren
  • Qualität mithilfe von Regeln mit optionalem Lehrer-LLM bewerten
  • SFT-, Präferenz- und Vortrainingsdatensätze synthetisieren
  • Mit einem Befehl feinabstimmen

Dies schafft einen geschlossenen Kreislauf, in dem das Modell aus seinen eigenen Erfahrungen lernt.

Technische Details

Zum Starten wird keine GPU benötigt – die gesamte Pipeline läuft auf CPU mit einem Mock- oder OpenAI-kompatiblen Lehrer-Backend. Eine GPU kann hinzugefügt werden, wenn das Training beginnen soll.

Fünf Lehrer-Backends werden unterstützt:

  • Mock
  • Regelbasiert
  • OpenAI-kompatible API (jeder lokale Proxy funktioniert)
  • HuggingFace Transformers
  • vLLM
Ad

Nutzungsoptionen

Drei Möglichkeiten, OpenEvol zu verwenden:

  • CLI für Offline-Stapelverarbeitung
  • REST-API-Server für Automatisierung
  • OpenClaw-Desktop-Plugin, das Pipeline-Ausführungen direkt aus dem Chat auslöst

Qualitätskontrolle

Jeder Batch wird automatisch bewertet. Wenn die Genehmigungsrate unter 80% fällt, wird das Training blockiert und zur manuellen Überprüfung markiert, sodass Benutzer die Kontrolle darüber haben, welche Daten für das Training verwendet werden.

Dieses Tool ist nützlich für Entwickler, die ihre KI-Coding-Agenten mithilfe tatsächlicher Konversationsverläufe verbessern möchten, ohne Daten an externe Dienste zu senden.

📖 Read the full source: r/openclaw

Ad

👀 Siehe auch

Verwendung des Obliteratus-Toolkits, um Ablehnungsgewichte aus KI-Modellen zu entfernen
Werkzeuge

Verwendung des Obliteratus-Toolkits, um Ablehnungsgewichte aus KI-Modellen zu entfernen

Ein Reddit-Nutzer verwendete das Obliteratus-Toolkit, um gezielt bestimmte Gewichte zu entfernen, die für Ablehnungsverhalten in KI-Modellen verantwortlich sind, und zeigte am Modell Qwen 1.5B von Alibaba, dass dies Trainingsursachen ohne Neustraining offenbaren kann.

OpenClawRadar
Alibis monatlicher 10-Dollar-Codierplan bietet OpenClaw-Nutzern umfangreichen Zugang zu mehreren KI-Modellen.
Werkzeuge

Alibis monatlicher 10-Dollar-Codierplan bietet OpenClaw-Nutzern umfangreichen Zugang zu mehreren KI-Modellen.

Für 10 US-Dollar pro Monat bietet Alibabas Plan Zugang zu den Modellen Qwen3.5-Plus, Kimi-K2.5, GLM-5 und MiniMax-M2.5 mit Kontingenten von 1.200 Anfragen pro 5 Stunden, 9.000 pro Woche und 18.000 pro Monat.

OpenClawRadar
OpenClaw-superpowers fügt Zuverlässigkeitsfunktionen für betriebliche Ausfallmodi hinzu
Werkzeuge

OpenClaw-superpowers fügt Zuverlässigkeitsfunktionen für betriebliche Ausfallmodi hinzu

Das openclaw-superpowers-Repository wurde um acht neue, auf Zuverlässigkeit ausgerichtete Fähigkeiten erweitert, darunter Preflight-Checks für Bereitstellungen, Nachweis der Cron-Ausführung, Wiederherstellung nach Sitzungsrücksetzungen und MCP-Auth-Lebenszyklusverwaltung. Diese Ergänzungen erhöhen die Gesamtzahl auf 60 Fähigkeiten, wovon 44 OpenClaw-nativ sind und 23 für Cron-Planung konzipiert wurden.

OpenClawRadar
Token Enhancer reduziert den Tokenverbrauch von Webseiten für KI-Agenten.
Werkzeuge

Token Enhancer reduziert den Tokenverbrauch von Webseiten für KI-Agenten.

Ein Entwickler stellte fest, dass rohes HTML von Webabrufen übermäßig viele Tokens im KI-Agenten-Kontext verbraucht, wobei Yahoo-Finance-Seiten 704.000 Tokens verwendeten. Durch den Einsatz von Token Enhancer als MCP-Server konnte dies auf 2.600 Tokens reduziert werden.

OpenClawRadar