Verwendung von Claude Code zur Automatisierung von KI-Forschungsexperimenten für 12 Stunden

Automatisierte KI-Forschung mit Claude Code
Ein Entwickler dokumentierte die Nutzung von Claude Code zur Automatisierung von KI-Forschungsexperimenten über 12 Stunden hinweg. Das Projekt konzentrierte sich auf CLaaS, ein Echtzeit-Framework für kontinuierliches Lernen, das Kontext durch Selbst-Distillation in Gewichte überführt.
Experimenteller Aufbau
Das Ziel war es, Selbst-Distillation-Trainingsläufe so zu optimieren, dass die Einhaltung verschiedener Präferenzprüfer durch das Modell maximiert wird, wie etwa präzise Antworten und keine Emojis. Die Experimente liefen lokal auf einer RTX 5090 über Nacht.
Systemarchitektur
Das Repository wurde für hohe Konfigurierbarkeit aufgebaut:
- Jeder einstellbare Parameter über die Kommandozeile mittels Hydra-Konfigurationsmanagement verfügbar gemacht
- HTML-Dashboards für jeden Trainingsschritt und jede Evaluierung
- Metriken, Eingaben und Ausgaben über Dashboards beobachtbar gemacht
- Claude Code konnte Dashboards über curl-Anfragen abfragen, um den Fortschritt zu prüfen
Experimentverwaltung
Der Arbeitsablauf wurde durch eine lokale EXPERIMENTS.md-Datei mit spezifischen Regeln gesteuert:
- Jedes Experiment durfte höchstens eine Variable ändern oder eine Codeänderung vornehmen
- Zwischen Experimenten musste das Modell die vorherige Änderung basierend auf den Ergebnissen entweder übernehmen oder rückgängig machen
- Alle neuen Codeänderungen mussten über Konfigurationen für spätere Optimierungen verfügbar gemacht werden
- Das Modell dokumentierte alle Fortschritte, Hypothesen und Ergebnisse in der Datei als fortlaufendes Protokoll
- Nutze eine "Ralph Wiggum-Schleife" mit dem Ziel, die Präferenzeinhaltung zu maximieren
Ergebnisse
Über 12 Stunden führte das System 9 Experimente durch:
- Entdeckte und behebt einen Modellkollaps-Fehler im ersten Durchlauf
- Optimierte die Gradientenschritte pro Batch auf 4
- Optimierte die Lernrate auf 3e-5
- Die Compliance verbesserte sich von 0,000 auf 1,000
- Der Tokenverbrauch war überraschend niedrig, da die meiste Zeit mit Warten auf Trainingsläufe zwischen den Experimenten verbracht wurde
Die gleiche Aufgabe wurde auch mit Codex für 2 Stunden unter Verwendung einer einfachen Eingabeaufforderung durchgeführt, und sie konvergierte unabhängig auf die gleichen Hyperparameter.
Projektrepository: https://github.com/kfallah/CLaaS
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Täglicher 3,5-Stunden-Sprach- + Claude-Workflow: Spezifikationen beim Gehen diktieren, mit Claude Code erstellen
Ein Entwickler geht mit 3 Hunden 12+ Mal am Tag spazieren (3,5 Stunden) und nutzt dabei Spracheingabe + Claude, um zu brainstormen, zu recherchieren und spec.md-Dateien zu erstellen. Anschließend baut Claude Code basierend auf diesen Spezifikationen.

Claude Opus 4.7 im echten Incident Response: Alleinige Behebung eines Healthcare-Malware-Vorfalls in 5 Stunden
Ein Sicherheitsingenieur nutzte Claude Opus 4.7, um einen Python-Bytecode-RAT zu reverse-engineeren, HIPAA-Risikobewertungen zu entwerfen und 12 forensische Skripte zu schreiben – und erledigte einen Malware-Vorfall in einer 60-Personen-Praxis allein in 5 Stunden, statt wie sonst üblich mit einem 3-6-köpfigen Team eine Woche zu benötigen.

Automatisierung von LinkedIn-Outreach mit Claude Cowork geplanten Aufgaben
Ein Entwickler erstellte eine geplante Claude Cowork-Aufgabe, die täglich automatisch 10 personalisierte LinkedIn-Nachrichten versendet, indem sie auf LinkedIn Sales Navigator zugreift, Profile liest, kürzliche Beiträge prüft und maßgeschneiderte Kontaktnachrichten verfasst.

KI-YouTube-Ersteller berichtet über Monetarisierungseinnahmen und Workflow-Veränderung
Ein Entwickler, der Claude Opus 4.6 für Skripte nutzt, berichtete von einem Einkommen von 12,20 US-Dollar aus 28.400 Aufrufen auf seinem KI-generierten YouTube-Kanal, was zu einer Neuausrichtung hin zu freiberuflicher Inhaltserstellung für Unternehmen führte.