Codev : Flux de travail de l'agent IA pour 106 PR en 14 jours

✍️ OpenClawRadar📅 Publié: March 1, 2026🔗 Source
Codev : Flux de travail de l'agent IA pour 106 PR en 14 jours
Ad

Codev est un système open-source de coordination d'agents d'IA qui impose un flux de travail structuré de développement. Le projet démontre comment faire passer l'IA du prototypage à un travail de production avec des pratiques spécifiques extraites de la gestion de 106 demandes de fusion en 14 jours.

Six pratiques fondamentales

  • Les spécifications et plans sont du code source : Les spécifications et plans résident dans git aux côtés du code source, pas dans l'historique des discussions. Un nouvel agent lit arch.md pour la vue d'ensemble, puis sa spécification particulière. Cela garantit que vous savez toujours pourquoi quelque chose a été construit.
  • Trois modèles examinent chaque phase : Claude, Gemini et Codex détectent des bogues presque entièrement différents. Aucun modèle unique n'a trouvé plus de 55 % des problèmes. Lors des tests, 20 bogues ont été détectés avant la mise en production : Claude Code en a trouvé 5, tandis que Gemini et Codex en ont détecté 15 autres, y compris un problème de sécurité grave que Claude a manqué.
  • Imposer le processus, ne pas le suggérer : Une machine à états force Spécification → Plan → Implémentation → Revue → PR. L'IA ne peut pas sauter d'étapes, et les tests doivent réussir avant d'avancer. Le système fournit des garde-fous car les IA ne respectent pas le plan par elles-mêmes.
  • Annoter, ne pas éditer : La plupart du travail implique d'écrire des spécifications et des revues qui guident le code, plutôt que de bidouiller des fichiers dans une discussion ouverte.
  • Les agents coordonnent les agents : Un agent architecte génère des agents constructeurs dans des espaces de travail git isolés. Vous dirigez l'architecte ; il dirige les constructeurs. Ils s'envoient des messages de manière asynchrone.
  • Gérer l'ensemble du cycle de vie : La plupart des outils d'IA aident à écrire du code plus rapidement (environ 30 % du travail). Les autres 70 % impliquent la planification, la revue, l'intégration, les scripts de déploiement et la gestion des environnements de test par rapport à la production. Codev fait exécuter par l'IA l'ensemble du pipeline, de la spécification à la PR et au-delà.
Ad

Résultats et coûts

Le système a permis à un ingénieur de produire ce qu'une équipe de 3-4 personnes ferait typiquement. La qualité du code a été mesurée à 1,2 point de mieux sur une échelle de 10 points par rapport à l'utilisation de Claude Code seul. L'approche prend plus de temps et utilise plus de tokens, mais les coûts restent raisonnables à environ 1,60 $ par PR.

Selon le développeur, l'application du protocole est le changement majeur : "Je constatais que l'IA ne respectait tout simplement pas les spécifications ou les plans." La coordination des agents s'est également avérée efficace, avec l'agent architecte gérant plusieurs agents constructeurs corrigeant différents bogues simultanément.

📖 Lire la source complète : HN AI Agents

Ad

👀 See Also

Inférence LLM souveraine au Royaume-Uni : Relax.ai publie des documents publics
Tools

Inférence LLM souveraine au Royaume-Uni : Relax.ai publie des documents publics

Relax.ai a publié la documentation pour l'inférence de LLM souverain britannique, redirigeant vers /docs/getting-started/introduction. Le service a été partagé sur HN avec 104 points.

OpenClawRadar
Chromeflow : L'extension Chrome automatise les tâches d'interface web pour Claude
Tools

Chromeflow : L'extension Chrome automatise les tâches d'interface web pour Claude

Chromeflow est une extension Chrome gratuite et open-source ainsi qu'un serveur MCP construit avec Claude Code qui donne à Claude le contrôle du navigateur pour automatiser les tâches manuelles d'interface web comme la configuration de Stripe, Supabase ou SendGrid. Il met en évidence les éléments à cliquer, remplit les champs, clique sur Enregistrer et écrit directement les clés API dans les fichiers .env.

OpenClawRadar
Stagent : Couche opérationnelle open-source pour le SDK Agent Claude avec gouvernance locale et orchestration de flux de travail
Tools

Stagent : Couche opérationnelle open-source pour le SDK Agent Claude avec gouvernance locale et orchestration de flux de travail

Stagent est un espace de coordination open-source, local-first, construit sur le SDK Agent Claude et l'API Claude, qui fournit l'orchestration des workflows, des garde-fous budgétaires et une gouvernance avec intervention humaine pour les agents IA. Il comprend 15 interfaces produit, 6 modèles de workflow, plus de 52 profils d'agents réutilisables, et fonctionne entièrement en local avec SQLite.

OpenClawRadar
Transformer le Code Claude en une Équipe d'Ingénierie Autonome
Tools

Transformer le Code Claude en une Équipe d'Ingénierie Autonome

La configuration ~/.claude/ transforme Claude Code en un système de construction autonome, générant et testant du code de manière autonome.

OpenClawRadar