TREX: El revisor de código AI de Greptile que ejecuta tu código

✍️ OpenClawRadar📅 Publicado: 18 de junio de 2026🔗 Source
TREX: El revisor de código AI de Greptile que ejecuta tu código
Ad

Greptile lanzó TREX (Test, Run, Execute), una capa de ejecución que ejecuta tu código durante la revisión de código con IA. En lugar de solo leer diferencias, TREX ejecuta el código modificado y saca a la luz errores de ejecución — regresiones de UI, errores lógicos dependientes del estado, condiciones de carrera — que el análisis estático no puede detectar.

Arquitectura: Orquestador + Subagentes por Problema

Las primeras versiones probaron agentes separados o un solo agente combinado. Ambos fallaron: los agentes separados duplicaban trabajo sin contexto compartido; un solo agente se sobrecargaba gestionando configuración, capturas de pantalla y pruebas. La solución fue un agente orquestador (el revisor principal de Greptile) que lee el diff, identifica problemas sospechosos y lanza un subagente TREX dedicado por problema, todos ejecutándose en paralelo. Cada subagente hereda el contexto del orquestador y tiene su propia ventana de contexto limitada a su investigación específica.

Ejemplo: una funcionalidad de UI detrás de una puerta de autenticación. Un subagente configura el entorno de forma autónoma, maneja la autenticación, activa banderas de funcionalidad y devuelve una captura de pantalla de la funcionalidad renderizada.

Ad

Artefactos Multimodales vs. Viñetas

Inicialmente, la salida de TREX consistía en resúmenes con viñetas — pero las viñetas permitían alucinaciones (por ejemplo, afirmar que una prueba pasó cuando no lo hizo) y no daban forma de verificar. La solución: cada hallazgo de TREX está respaldado por un conjunto de artefactos multimodales: capturas de pantalla, registros de ejecución, trazas de API y scripts de ejecución. Cada modalidad cuenta parte de la historia, haciendo posible rastrear exactamente lo que ocurrió. El primer artefacto que impresionó al equipo fue una captura de video de un cambio de animación, mostrando el efecto real en tiempo de ejecución.

Qué Detecta

TREX se enfoca en errores que no aparecen en los diffs de código: errores lógicos que requieren secuencias de estado específicas, regresiones de UI después de cargar la página, y condiciones de carrera que necesitan solicitudes reales. Genera y ejecuta pruebas, pero el objetivo es encontrar errores, no solo escribir pruebas. El subagente descubre la configuración por sí mismo.

Como dice Shlok Mehrotra, el ingeniero detrás de TREX: "Puedes leer el diff perfectamente y aún así perderte completamente este tipo de errores."

📖 Lea la fuente completa: HN AI Agents

Ad

👀 Ver también

HostMyClaudeHTML: Compartir con un clic para artefactos HTML de Claude
Herramientas

HostMyClaudeHTML: Compartir con un clic para artefactos HTML de Claude

Un desarrollador creó hostmyclaudehtml.com, una herramienta gratuita que te permite compartir artefactos HTML generados por Claude como URLs en vivo arrastrando y soltando el archivo .html. No se requiere cuenta para quienes suben o ven el contenido.

OpenClawRadar
Configuración de iTerm2 de 4 Paneles para CLI de Código Claude Separa Roles de IA
Herramientas

Configuración de iTerm2 de 4 Paneles para CLI de Código Claude Separa Roles de IA

Un desarrollador creó una configuración de terminal iTerm2 de cuatro paneles específicamente para Claude Code CLI para abordar la deriva de contexto y el sesgo de autoevaluación. Cada panel está bloqueado a un rol específico con modelos y permisos dedicados.

OpenClawRadar
Claude Code Plugin de Grado de Producción v3.0 Lanzado: Pipeline de Desarrollo de Software Autónomo
Herramientas

Claude Code Plugin de Grado de Producción v3.0 Lanzado: Pipeline de Desarrollo de Software Autónomo

El Plugin de Grado de Producción v3.0 para Claude Code ya está disponible como software gratuito de código abierto bajo licencia MIT. El plugin crea una canalización de desarrollo completa desde los requisitos hasta la implementación con 13 habilidades de IA que actúan como un equipo de ingeniería.

OpenClawRadar
Sistema de memoria persistente de código abierto para Claude Code que resuelve la pérdida de contexto entre sesiones
Herramientas

Sistema de memoria persistente de código abierto para Claude Code que resuelve la pérdida de contexto entre sesiones

Un desarrollador creó un sistema de memoria basado en archivos para Claude Code que captura automáticamente el contexto del proyecto sin necesidad de complementos ni claves API. Utiliza transcripciones de conversaciones, un archivo de bandeja de entrada y trabajos cron nocturnos para mantener una memoria persistente entre sesiones.

OpenClawRadar