TREX: Revisor de Código con IA que Realmente Ejecuta tu Código

Greptile lanzó TREX (Test, Run, Execute), una capa de ejecución que ejecuta tu código durante la revisión de código con IA. En lugar de solo leer diferencias, TREX ejecuta el código modificado y saca a la luz errores de ejecución — regresiones de UI, errores lógicos dependientes del estado, condiciones de carrera — que el análisis estático no puede detectar.

Arquitectura: Orquestador + Subagentes por Problema

Las primeras versiones probaron agentes separados o un solo agente combinado. Ambos fallaron: los agentes separados duplicaban trabajo sin contexto compartido; un solo agente se sobrecargaba gestionando configuración, capturas de pantalla y pruebas. La solución fue un agente orquestador (el revisor principal de Greptile) que lee el diff, identifica problemas sospechosos y lanza un subagente TREX dedicado por problema, todos ejecutándose en paralelo. Cada subagente hereda el contexto del orquestador y tiene su propia ventana de contexto limitada a su investigación específica.

Ejemplo: una funcionalidad de UI detrás de una puerta de autenticación. Un subagente configura el entorno de forma autónoma, maneja la autenticación, activa banderas de funcionalidad y devuelve una captura de pantalla de la funcionalidad renderizada.

Artefactos Multimodales vs. Viñetas

Inicialmente, la salida de TREX consistía en resúmenes con viñetas — pero las viñetas permitían alucinaciones (por ejemplo, afirmar que una prueba pasó cuando no lo hizo) y no daban forma de verificar. La solución: cada hallazgo de TREX está respaldado por un conjunto de artefactos multimodales: capturas de pantalla, registros de ejecución, trazas de API y scripts de ejecución. Cada modalidad cuenta parte de la historia, haciendo posible rastrear exactamente lo que ocurrió. El primer artefacto que impresionó al equipo fue una captura de video de un cambio de animación, mostrando el efecto real en tiempo de ejecución.

Qué Detecta

TREX se enfoca en errores que no aparecen en los diffs de código: errores lógicos que requieren secuencias de estado específicas, regresiones de UI después de cargar la página, y condiciones de carrera que necesitan solicitudes reales. Genera y ejecuta pruebas, pero el objetivo es encontrar errores, no solo escribir pruebas. El subagente descubre la configuración por sí mismo.

Como dice Shlok Mehrotra, el ingeniero detrás de TREX: "Puedes leer el diff perfectamente y aún así perderte completamente este tipo de errores."

📖 Lea la fuente completa: HN AI Agents

TREX: El revisor de código AI de Greptile que ejecuta tu código

Arquitectura: Orquestador + Subagentes por Problema

Artefactos Multimodales vs. Viñetas

Qué Detecta

👀 Ver también

HostMyClaudeHTML: Compartir con un clic para artefactos HTML de Claude

Configuración de iTerm2 de 4 Paneles para CLI de Código Claude Separa Roles de IA

Claude Code Plugin de Grado de Producción v3.0 Lanzado: Pipeline de Desarrollo de Software Autónomo

Sistema de memoria persistente de código abierto para Claude Code que resuelve la pérdida de contexto entre sesiones