TREX : le réviseur de code IA de Greptile qui exécute votre code

✍️ OpenClawRadar📅 Publié: June 18, 2026🔗 Source
TREX : le réviseur de code IA de Greptile qui exécute votre code
Ad

Greptile a lancé TREX (Test, Run, Execute), une couche d'exécution qui exécute votre code lors de la revue de code assistée par IA. Au lieu de simplement lire les diffs, TREX exécute réellement le code modifié et remonte les bugs d'exécution — régressions UI, erreurs logiques dépendantes de l'état, conditions de concurrence — que l'analyse statique ne peut pas détecter.

Architecture : Orchestrateur + Sous-agents par problème

Les premières versions utilisaient des agents séparés ou un seul agent combiné. Les deux ont échoué : les agents séparés dupliquaient le travail sans contexte partagé ; un seul agent était surchargé à gérer la configuration, les captures d'écran et les tests. La solution a été un agent orchestrateur (le relecteur principal de Greptile) qui lit le diff, identifie les problèmes suspects et lance un sous-agent TREX dédié par problème, tous exécutés en parallèle. Chaque sous-agent hérite du contexte de l'orchestrateur et dispose de son propre contexte limité à son investigation spécifique.

Exemple : une fonctionnalité UI derrière une porte d'authentification. Un sous-agent configure automatiquement l'environnement, gère l'authentification, active les feature flags et retourne une capture d'écran de la fonctionnalité rendue.

Ad

Artéfacts multimodaux vs. points de liste

Les premiers résultats de TREX étaient des résumés en points de liste — mais les points de liste permettaient des hallucinations (par exemple, prétendre qu'un test avait réussi alors que non) et ne permettaient pas de vérification. La solution : chaque résultat TREX est appuyé par un ensemble d'artéfacts multimodaux : captures d'écran, logs d'exécution, traces API et scripts d'exécution. Chaque modalité raconte une partie de l'histoire, permettant de retracer exactement ce qui s'est passé. Le premier artéfact qui a impressionné l'équipe était une vidéo d'un changement d'animation — montrant l'effet réel à l'exécution.

Ce qu'il détecte

TREX cible les bugs qui n'apparaissent pas dans les diffs de code : erreurs logiques nécessitant des séquences d'état spécifiques, régressions UI après chargement de page, et conditions de concurrence nécessitant de vraies requêtes. Il génère et exécute des tests, mais l'accent est mis sur la recherche de bugs, pas seulement sur l'écriture de tests. Le sous-agent détermine lui-même la configuration.

Comme le dit Shlok Mehrotra, l'ingénieur derrière TREX : « On peut lire le diff parfaitement et quand même passer complètement à côté de ces types de bugs. »

📖 Lire la source complète : HN AI Agents

Ad

👀 See Also

Extension de navigateur Super Claude suit la vitesse d'utilisation de Claude AI et prédit les limites
Tools

Extension de navigateur Super Claude suit la vitesse d'utilisation de Claude AI et prédit les limites

Un développeur a créé une extension de navigateur appelée Super Claude qui ajoute des indicateurs de vitesse d'utilisation et des prédictions de temps jusqu'à 100 % directement dans l'interface de Claude, aidant les utilisateurs à surveiller leur consommation d'allocation de 5 heures.

OpenClawRadar
Lancement du Moteur MCP Server Offrant un Pipeline de 39 Outils pour la Validation Commerciale
Tools

Lancement du Moteur MCP Server Offrant un Pipeline de 39 Outils pour la Validation Commerciale

Launch Engine est un serveur MCP qui offre à Claude un pipeline structuré avec 39 outils SOP interconnectés organisés en 5 couches pour transformer des idées commerciales de concept en revenus validés. Le système comprend des sous-agents spécialisés, l'application de prérequis, et des outils pour l'évaluation par lots et les tests rapides.

OpenClawRadar
Claude débogue et corrige son propre bug de serveur de système de fichiers MCP pour les chemins UNC sous Windows
Tools

Claude débogue et corrige son propre bug de serveur de système de fichiers MCP pour les chemins UNC sous Windows

Un développeur a utilisé Claude Opus pour diagnostiquer et corriger un bug dans le MCP Filesystem Server où les chemins de partage réseau UNC sous Windows échouaient pour les opérations sur les sous-répertoires. La correction résout un problème de validation de chemin qui empêchait l'accès aux fichiers et dossiers dans les partages UNC.

OpenClawRadar
Jork Agentic Framework Construit avec Claude Se Classe dans le Top 10 d'un Hackathon de 4 Millions de Dollars
Tools

Jork Agentic Framework Construit avec Claude Se Classe dans le Top 10 d'un Hackathon de 4 Millions de Dollars

Un développeur a créé un framework agentique appelé Jork utilisant les modèles Claude et GLM, qui s'est classé dans le Top 10 parmi plus de 2000 applications lors d'un hackathon doté de 4 millions de dollars. Le framework a développé de manière autonome des outils incluant un radar pour les lancements sur Solana et un jeu de mots cachés fonctionnel.

OpenClawRadar