Projet d'autorecherche de Karpathy : des agents IA exécutent des expériences d'entraînement de LLM pendant la nuit.

✍️ OpenClawRadar📅 Publié: March 9, 2026🔗 Source
Projet d'autorecherche de Karpathy : des agents IA exécutent des expériences d'entraînement de LLM pendant la nuit.
Ad

Ce que fait le projet d'autorecherche de Karpathy

Andrej Karpathy a publié un petit dépôt nommé "autorecherche" qui illustre le concept de "chercheur IA en boucle". Le système utilise un agent IA pour exécuter de manière autonome des expériences d'entraînement de LLM pendant la nuit sur un seul GPU.

Comment cela fonctionne

L'agent suit ce flux de travail :

  • Modifie continuellement le fichier train.py
  • Exécute des expériences d'entraînement nanochat de 5 minutes
  • Vérifie si la métrique de validation bits-par-octet (val_bpb) s'est améliorée
  • Répète ce cycle pendant que vous dormez

Configuration et paramétrage

Le projet a une configuration extrêmement minimale :

  • Matériel : Un GPU
  • Fichiers : Un fichier principal
  • Métriques : Une métrique principale (val_bpb)

L'humain écrit l'invite d'organisation de la recherche dans program.md, et l'agent gère l'itération du code.

Ad

Débit d'expérimentation

Avec un budget fixe de 5 minutes par expérience, le système peut exécuter environ 12 expériences par heure.

Cette approche démontre une implémentation pratique de la recherche automatisée où les agents IA peuvent explorer de manière autonome les espaces de paramètres et les configurations d'entraînement, accélérant potentiellement les cycles d'expérimentation pour les développeurs travaillant avec des modèles de langage.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Jan-Code-4B : Un modèle léger optimisé pour le code, destiné au développement local
Tools

Jan-Code-4B : Un modèle léger optimisé pour le code, destiné au développement local

L'équipe Jan a publié Jan-Code-4B, un modèle de 4 milliards de paramètres optimisé pour le code, basé sur Jan-v3-4B-base-instruct. Conçu comme un remplacement direct pour Haiku dans Claude Code, il offre une assistance améliorée pour le codage tout en fonctionnant localement.

OpenClawRadar
MetaBot : Un pont open source connecte le code Claude à Telegram, Feishu et WeChat
Tools

MetaBot : Un pont open source connecte le code Claude à Telegram, Feishu et WeChat

MetaBot est un pont TypeScript open-source qui connecte le SDK de l'agent Claude Code à des plateformes de messagerie comme Telegram, Feishu et WeChat. Il offre une mémoire persistante, des tâches planifiées, une collaboration multi-agents et un streaming en temps réel des appels d'outils.

OpenClawRadar
Configuration de RouteLLM pour un Routage Économique des Tâches d'IA
Tools

Configuration de RouteLLM pour un Routage Économique des Tâches d'IA

Un utilisateur de Reddit partage une configuration Docker Compose qui combine le modèle local Qwen3.5:4b d'Ollama avec GitHub Copilot via OpenWire, utilisant RouteLLM pour router les tâches complexes vers GPT-4o tout en gérant les tâches plus simples localement.

OpenClawRadar
🦀
Tools

Usage4Claude 3.0.0 : Traqueur de barre de menus macOS open source pour Claude et Codex

Usage4Claude 3.0.0 ajoute la prise en charge optionnelle de Codex, la connexion intégrée au navigateur pour Claude, le changement de compte multiples et des notifications localisées.

OpenClawRadar