Karpathys Autoresearch-Projekt: KI-Agenten führen über Nacht LLM-Trainingsexperimente durch

Was Karpathys Autoresearch-Projekt macht
Andrej Karpathy hat ein winziges Repository namens "autoresearch" veröffentlicht, das das Konzept eines "KI-Forschers in der Schleife" demonstriert. Das System nutzt einen KI-Agenten, um über Nacht autonom LLM-Trainingsexperimente auf einer einzelnen GPU durchzuführen.
Wie es funktioniert
Der Agent folgt diesem Arbeitsablauf:
- Bearbeitet kontinuierlich die Datei
train.py - Führt 5-minütige Nanochat-Trainingsexperimente durch
- Prüft, ob sich die Validierungs-Bits-pro-Byte-Metrik (
val_bpb) verbessert hat - Wiederholt diesen Zyklus, während Sie schlafen
Einrichtung und Konfiguration
Das Projekt hat einen super-minimalen Aufbau:
- Hardware: Eine GPU
- Dateien: Eine Hauptdatei
- Metriken: Eine primäre Metrik (
val_bpb)
Der Mensch schreibt die Forschungsorganisationsaufforderung in program.md, und der Agent übernimmt die Code-Iteration.
Experimentdurchsatz
Mit einem festen Budget von 5 Minuten pro Experiment kann das System ungefähr 12 Experimente pro Stunde durchführen.
Dieser Ansatz zeigt eine praktische Implementierung von automatisiertem Forschung, bei der KI-Agenten Parameterräume und Trainingskonfigurationen autonom erkunden können, was möglicherweise die Experimentierzyklen für Entwickler, die mit Sprachmodellen arbeiten, beschleunigt.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

AIBrain fügt Claude Code persistente Speicherfähigkeit und Selbstverbesserung hinzu.
AIBrain ist ein Tool, das Claude Code persistenten Speicher zwischen Sitzungen bietet, mit semantischer Suchabfrage und Selbstverbesserungszyklen. Es umfasst 53 Workflows, 44 Fähigkeiten, 9 MCP-Server und unterstützt Multi-Agent-Mesh-Netzwerke über Tailscale.

Vier ClawHub-Fähigkeiten für Echtzeit-Suchdaten in KI-Agenten
Vier ClawHub-Fähigkeiten bieten strukturierte Suchfunktionen für KI-Agenten: Google (Web, Nachrichten, Bilder, Karten), Amazon (Produktsuche über 12 Marktplätze), Walmart (Produktsuche mit Lieferfiltern) und YouTube (Videosuche mit Transkripten). Installation über clawhub install-Befehle mit einem API-Schlüssel.

Claude AI entwickelte in Stunden einen UFO-Datenvisualisierer mit Regierungsdaten
Ein Reddit-Nutzer hat mit Claude AI einen Full-Stack-UFO-Sichtungs-Visualizer aus neu veröffentlichten Daten des US-Kriegsministeriums erstellt, der auf Cloudflare gehostet wird – und das in nur wenigen Stunden.

OnPrem.LLM AgentExecutor: Starten Sie abgesicherte KI-Agenten mit integrierten Tools
Der AgentExecutor von OnPrem.LLM ermöglicht es Ihnen, autonome KI-Agenten zu erstellen, die komplexe Aufgaben mithilfe von Cloud- oder lokalen Modellen ausführen, mit neun integrierten Tools einschließlich Dateioperationen, Shell-Befehlen und Websuche. Sie können Agenten in abgesicherten Containern für mehr Sicherheit ausführen.