Utilisation de Claude Code pour automatiser les expériences de recherche en IA pendant 12 heures

Recherche en IA automatisée avec Claude Code
Un développeur a documenté l'utilisation de Claude Code pour automatiser des expériences de recherche en IA pendant 12 heures d'affilée. Le projet s'est concentré sur CLaaS, un cadre d'apprentissage continu en temps réel qui déplace le contexte dans les poids en utilisant l'auto-distillation.
Configuration expérimentale
L'objectif était d'ajuster les exécutions d'entraînement par auto-distillation pour maximiser la conformité d'un modèle à différents vérificateurs de préférences, tels que des réponses concises et l'absence d'émojis. Les expériences ont été exécutées localement sur un RTX 5090 pendant la nuit.
Architecture du système
Le dépôt a été conçu pour être hautement configurable :
- Chaque paramètre ajustable exposé via CLI en utilisant la gestion de configuration Hydra
- Tableaux de bord HTML pour chaque étape d'entraînement et exécution d'évaluation
- Métriques, entrées et sorties rendues observables via des tableaux de bord
- Claude Code pouvait interroger les tableaux de bord via des requêtes curl pour vérifier la progression
Gestion des expériences
Le flux de travail était contrôlé par un fichier EXPERIMENTS.md local avec des règles spécifiques :
- Chaque expérience pouvait modifier au plus une variable ou apporter un changement de code
- Entre les expériences, le modèle devait soit accepter soit annuler le changement précédent en fonction des résultats
- Tout nouveau changement de code devait être exposé via la configuration pour un ajustement ultérieur
- Le modèle enregistrait toute la progression, les hypothèses et les résultats dans le fichier comme un journal continu
- Utilisation d'une "boucle Ralph Wiggum" avec l'objectif de maximiser la conformité aux préférences
Résultats
Sur 12 heures, le système a exécuté 9 expériences :
- Détecté et corrigé un bogue d'effondrement du modèle lors de la première exécution
- Ajusté les étapes de gradient par lot à 4
- Ajusté le taux d'apprentissage à 3e-5
- La conformité est passée de 0,000 à 1,000
- L'utilisation de jetons était étonnamment faible car la plupart du temps était consacré à l'attente des exécutions d'entraînement entre les expériences
La même tâche a également été exécutée avec Codex pendant 2 heures en utilisant une invite simple, et elle a convergé indépendamment vers les mêmes hyperparamètres.
Dépôt du projet : https://github.com/kfallah/CLaaS
📖 Lire la source complète : r/ClaudeAI
👀 See Also

Connexion d'OpenClaw à un téléphone à cadran via les API SIP et vocales
Un développeur a connecté un téléphone à cadran Benotek à OpenClaw en utilisant un adaptateur téléphonique analogique Grandstream HT801 v2, Twilio SIP, Deepgram pour la reconnaissance vocale et ElevenLabs pour la synthèse vocale, avec diffusion audio via WebSocket et ngrok.

Développeur Construit un Serveur MCP WhatsApp Business avec Claude Code en une Seule Session
Un développeur a utilisé Claude Code pour créer un serveur MCP WhatsApp Business complet avec 35 outils, 72 tests et support multi-locataires en une seule session de codage. Le serveur connecte Claude à l'API WhatsApp Business et inclut une fonctionnalité webhook unique pour recevoir les messages entrants.

L'agent IA OpenClaw aide l'équipe à sauver la journée de démonstration avec un prototype rapide.
Une équipe de développement a utilisé l'agent IA d'OpenClaw pour créer un site de démonstration fonctionnel avec des données fictives en 10 minutes, après que leur pivot produit a menacé leur participation à la journée de démonstration de South Park Commons.

Construire un livre technique avec Claude Code : Processus et écueils
Un développeur a créé un livre EPUB sur les fonctionnalités intermédiaires de Claude Code en utilisant Claude pour collecter la documentation d'Anthropic, en recherchant des exemples concrets dans la finance, et en structurant les chapitres avec des caractéristiques techniques suivies d'applications pratiques. Le processus a révélé des contraintes spécifiques de flux de travail lors de l'utilisation d'agents.