Coding-Agent-Protokolle: Lokal speichern für offenes Training

Wenn Sie Codierungsagenten wie Claude Code oder Codex CLI im Agentenmodus verwenden, protokollieren sie umfassende Sitzungsdaten lokal auf Ihrem Computer. Diese Protokolle erfassen die gesamte Interaktionsschleife: Ihre ursprüngliche Aufgabe, den Denkprozess des Modells, jeden Tool-Aufruf, jede Umgebungsantwort, jeden aufgetretenen Fehler und jeden Wiederholungsversuch. Dadurch entstehen vollständige (Zustand → Aktion → Belohnung → nächster Zustand)-Tupel – genau das Datenformat, das Forscher für bestärkendes Lernen benötigen.

Was in den Protokollen steht

Der Autor der Quelle überprüfte seine eigenen Computer und fand:

Mac Mini: ~/.claude/projects/ mit 3,1 GB über 1103 Dateien aus 574 agentischen Sitzungen
MacBook: ~/.codex/sessions/ mit 2,4 GB über 3530 Dateien aus 79 agentischen Sitzungen
MacBook: ~/.claude/projects/ mit 652 MB über 316 Dateien aus 99 agentischen Sitzungen

Insgesamt identifizierten sie 775 Sitzungen mit echten Tool-Aufrufen, die etwa 41 Millionen Tokens enthalten. Hochgerechnet auf Tausende von Entwicklern könnte dies Hunderte von Milliarden Tokens an echten agentischen Trajektoriedaten darstellen – Daten, für die es derzeit kein offenes Äquivalent wie den Pile-Datensatz gibt.

Warum diese Daten wichtig sind

Die Umgebung liefert klare Rückmeldungssignale: Exit-Code 0 oder nicht, Tests bestehen oder nicht. Dies bietet das fehlende Trainingssignal für kausales Denken, Fehlerbehebung und langfristige Planung – Bereiche, in denen aktuelle Modelle Schwierigkeiten haben. Große KI-Labore sammeln diese Daten bereits intern, um ihre proprietären Modelle zu trainieren, aber es gibt kein offenes Äquivalent, weil die Daten über einzelne Entwicklercomputer verstreut sind.

Der Vorschlag: Föderiertes Lernen

Der Beitrag schlägt föderiertes Lernen vor, bei dem Ihre Daten niemals Ihren Computer verlassen. Sie würden einen kleinen LoRA-Adapter lokal trainieren, nur die Gewichte mit hinzugefügtem Differential-Privacy-Rauschen teilen und im Gegenzug ein verbessertes globales Modell erhalten. Jeder trägt Rechenleistung und Signale bei, ohne seine Rohdaten preiszugeben. Alternativ könnte die Community die Daten anonymisieren, um einen Datensatz für das Feinabstimmen von Modellen zu erstellen.

Praktische Schritte

Um Ihre Protokolle zu erhalten (Claude Code löscht sie standardmäßig nach 30 Tagen):

echo '{"cleanupPeriodDays": 36500}' > ~/.claude/settings.json

Um zu überprüfen, was auf Ihren eigenen Computern gespeichert ist:

du -sh ~/.codex/sessions/ 2>/dev/null
du -sh ~/.claude/projects/ 2>/dev/null
find ~/.codex/sessions/ -name "*.jsonl" | wc -l
find ~/.claude/projects/ -name "*.jsonl" | wc -l

Der Reddit-Beitrag ermutigt Entwickler, ihre Zahlen in den Kommentaren zu teilen, um das tatsächliche Ausmaß ungenutzter Daten in der Community einzuschätzen, mit dem Ziel, ein offenes Äquivalent aufzubauen, wenn genügend Interesse besteht.

📖 Read the full source: r/LocalLLaMA

Coding-Agent-Sitzungsprotokolle werden lokal gespeichert, könnten offenes föderiertes Training ermöglichen

Was in den Protokollen steht

Warum diese Daten wichtig sind

Der Vorschlag: Föderiertes Lernen

Praktische Schritte

👀 Siehe auch

Lovable bietet 100 US-Dollar kostenlose Claude-API-Guthaben zum Internationalen Frauentag an.

Ford stellt über 300 erfahrene Ingenieure wieder ein, nachdem KI-Qualitätskontrollen hinter den Erwartungen zurückblieben

Kritik an der Abstraktionsgrenze und Service-Integrationsansatz des MCP

Statt KI zu verbannen, entwarf ein Professor mit Studierenden einen Klassenvertrag