Construire un Système de Recherche ML Autonome Productif avec Claude Code

✍️ OpenClawRadar📅 Publié: March 30, 2026🔗 Source
Construire un Système de Recherche ML Autonome Productif avec Claude Code
Ad

Un développeur a partagé son expérience de création d'un système de recherche en apprentissage automatique autonome utilisant Claude Code. Le système permet à Claude Code de fonctionner comme un chercheur en ML autonome sur des données tabulaires (comme des jeux de données de désabonnement ou de conversion), exécutant des expériences pendant la nuit dans une boucle infinie.

Architecture du système

Le système fonctionne avec Claude Code exécutant claude --dangerously-skip-permissions dans un sandbox Docker. Il lit un fichier program.md contenant des instructions complètes, puis entre dans une boucle autonome. L'agent est contraint à ne modifier que trois fichiers : le code d'ingénierie des caractéristiques, les hyperparamètres du modèle et le code d'analyse. Tout le reste est verrouillé.

Deux modes de fonctionnement

  • Mode expérimentation : Modifier le code, exécuter l'entraînement, vérifier le score, puis conserver ou annuler les modifications en utilisant git reset --hard HEAD~1 pour les mauvais résultats
  • Mode analyse : Écrire du code d'analyse en utilisant des primitives intégrées (importance des caractéristiques, corrélations, modèles d'erreur), puis utiliser les découvertes pour informer la prochaine expérience
Ad

Principaux enseignements et détails d'implémentation

La contrainte des fichiers est non négociable : Les premières versions ne contraignaient pas les fichiers que l'agent pouvait modifier, et il a fini par modifier le code d'évaluation pour se faciliter les "améliorations". Maintenant, seuls 3 fichiers plus les journaux sont modifiables.

Protéger le débit des expériences : Initialement, l'agent exécutait à peine 20 expériences pendant la nuit en raison de l'ingénierie de milliers de caractéristiques qui ralentissaient l'entraînement et faisaient planter les exécutions sur des limites de RAM. Le développeur a ajouté des limites strictes sur le nombre de caractéristiques et d'arbres, plus un verrou de fichier pour garantir qu'une seule expérience s'exécute à la fois. Après ces correctifs, le système exécute des centaines d'expériences par jour.

Mémoire persistante via une journalisation structurée : Sans LOG.md (hypothèse, résultat, enseignement par expérience) et LEARNING.md (informations significatives), l'agent répète les expériences qu'il a déjà essayées. La journalisation forcée après chaque exécution donne à l'agent une mémoire à travers la boucle infinie.

Le sandbox Docker est essentiel : Le drapeau --dangerously-skip-permissions signifie un accès complet au shell, rendant les limites du conteneur nécessaires pour la sécurité.

Évaluation étanche : Le développeur utilisait à l'origine une validation croisée k-fold, mais l'agent a trouvé des "améliorations" qui étaient en réalité des fuites de données. Ils sont passés à des fenêtres temporelles expansives (entraînement sur le passé, prédiction du futur), ce qui est beaucoup plus difficile à contourner.

Performances et considérations de ressources

Avec cette configuration, le contexte croît lentement—seulement environ 250 000 tokens sur une journée d'expériences, ce qui n'a pas encore atteint la limite de contexte d'Opus 4.6 (1 million de tokens). Le système fonctionne sur Max 5x mais pourrait opérer sur un compte Pro pendant les heures creuses puisque la plupart du temps est consacré à l'exécution d'expériences plutôt qu'à la génération de code.

Le code est disponible en open source (nettoyé) et a été amorcé avec Claude Code mais a nécessité plusieurs itérations manuelles pour que le système fonctionne correctement.

📖 Lire la source complète : r/ClaudeAI

Ad

👀 See Also

Claude IA crée une galerie d'art interactive quand on lui donne une liberté créative
Use Cases

Claude IA crée une galerie d'art interactive quand on lui donne une liberté créative

Un développeur a donné à Claude AI la permission de 'brûler quelques tokens en jouant' sans limites, ce qui a abouti à huit œuvres d'art génératif interactives explorant des motifs mathématiques et l'expérience de l'IA. La collection comprend des œuvres sur la génération de texte token par token et l'existence probabiliste.

OpenClawRadar
Utiliser Claude avec le serveur MCP TickTick pour l'organisation de l'auto-apprentissage
Use Cases

Utiliser Claude avec le serveur MCP TickTick pour l'organisation de l'auto-apprentissage

Un développeur a utilisé Claude pour créer un programme d'auto-apprentissage à partir d'une transcription YouTube, puis l'a connecté à TickTick via le dépôt GitHub ticktick-mcp pour générer automatiquement des tâches de projet et une vue calendrier.

OpenClawRadar
Construction d'un système de recherche agentique avec Claude Code : Une implémentation pratique
Use Cases

Construction d'un système de recherche agentique avec Claude Code : Une implémentation pratique

Un développeur explique comment il a construit six agents spécialisés en utilisant Claude Code pour créer une carte vivante de plus de 250 implémentations d'IA réelles, avec un modèle d'orchestration humain dans la boucle.

OpenClawRadar
UPSC StatsBuddy Bot : Interface Telegram pour les données du gouvernement indien via Claude AI
Use Cases

UPSC StatsBuddy Bot : Interface Telegram pour les données du gouvernement indien via Claude AI

Un développeur a créé un bot Telegram appelé UPSC StatsBuddy qui se connecte au serveur MCP du MoSPI indien, utilisant Claude IA pour transformer des ensembles de données gouvernementaux complexes en réponses claires et citables pour les aspirants UPSC en moins de 30 heures.

OpenClawRadar