TREX : Un relecteur de code IA qui exécute réellement votre code

Greptile a lancé TREX (Test, Run, Execute), une couche d'exécution qui exécute votre code lors de la revue de code assistée par IA. Au lieu de simplement lire les diffs, TREX exécute réellement le code modifié et remonte les bugs d'exécution — régressions UI, erreurs logiques dépendantes de l'état, conditions de concurrence — que l'analyse statique ne peut pas détecter.

Architecture : Orchestrateur + Sous-agents par problème

Les premières versions utilisaient des agents séparés ou un seul agent combiné. Les deux ont échoué : les agents séparés dupliquaient le travail sans contexte partagé ; un seul agent était surchargé à gérer la configuration, les captures d'écran et les tests. La solution a été un agent orchestrateur (le relecteur principal de Greptile) qui lit le diff, identifie les problèmes suspects et lance un sous-agent TREX dédié par problème, tous exécutés en parallèle. Chaque sous-agent hérite du contexte de l'orchestrateur et dispose de son propre contexte limité à son investigation spécifique.

Exemple : une fonctionnalité UI derrière une porte d'authentification. Un sous-agent configure automatiquement l'environnement, gère l'authentification, active les feature flags et retourne une capture d'écran de la fonctionnalité rendue.

Artéfacts multimodaux vs. points de liste

Les premiers résultats de TREX étaient des résumés en points de liste — mais les points de liste permettaient des hallucinations (par exemple, prétendre qu'un test avait réussi alors que non) et ne permettaient pas de vérification. La solution : chaque résultat TREX est appuyé par un ensemble d'artéfacts multimodaux : captures d'écran, logs d'exécution, traces API et scripts d'exécution. Chaque modalité raconte une partie de l'histoire, permettant de retracer exactement ce qui s'est passé. Le premier artéfact qui a impressionné l'équipe était une vidéo d'un changement d'animation — montrant l'effet réel à l'exécution.

Ce qu'il détecte

TREX cible les bugs qui n'apparaissent pas dans les diffs de code : erreurs logiques nécessitant des séquences d'état spécifiques, régressions UI après chargement de page, et conditions de concurrence nécessitant de vraies requêtes. Il génère et exécute des tests, mais l'accent est mis sur la recherche de bugs, pas seulement sur l'écriture de tests. Le sous-agent détermine lui-même la configuration.

Comme le dit Shlok Mehrotra, l'ingénieur derrière TREX : « On peut lire le diff parfaitement et quand même passer complètement à côté de ces types de bugs. »

📖 Lire la source complète : HN AI Agents

TREX : le réviseur de code IA de Greptile qui exécute votre code

Architecture : Orchestrateur + Sous-agents par problème

Artéfacts multimodaux vs. points de liste

Ce qu'il détecte

👀 See Also

Extension de navigateur Super Claude suit la vitesse d'utilisation de Claude AI et prédit les limites

Lancement du Moteur MCP Server Offrant un Pipeline de 39 Outils pour la Validation Commerciale

Claude débogue et corrige son propre bug de serveur de système de fichiers MCP pour les chemins UNC sous Windows

Jork Agentic Framework Construit avec Claude Se Classe dans le Top 10 d'un Hackathon de 4 Millions de Dollars