TREX: ИИ-ревьюер кода от Greptile, который запускает ваш код

Компания Greptile выпустила TREX (Test, Run, Execute) — исполнительный слой, который запускает ваш код во время AI-ревью. Вместо простого чтения diff'ов TREX фактически выполняет изменённый код и выявляет баги времени выполнения — регрессии UI, логические ошибки, зависящие от состояния, состояния гонки — которые не может поймать статический анализ.
Архитектура: Оркестратор + под-агенты для каждой проблемы
Ранние версии использовали отдельные агенты или один комбинированный. Оба варианта провалились: отдельные агенты дублировали работу без общего контекста; один агент перегружался управлением настройкой, скриншотами и тестами. Решением стал оркестратор (главный ревьюер Greptile), который читает diff, выявляет подозрительные проблемы и запускает выделенного под-агента TREX для каждой проблемы, работающих параллельно. Каждый под-агент наследует контекст оркестратора и имеет собственное окно контекста, ограниченное своим исследованием.
Пример: функция UI за шлюзом аутентификации. Под-агент автономно настраивает окружение, обрабатывает аутентификацию, переключает флаги функций и возвращает скриншот отображаемой функции.
Мультимодальные артефакты vs. маркированные списки
Изначальный вывод TREX был в виде тезисов — но тезисы допускали галлюцинации (например, утверждение, что тест пройден, хотя это не так) и не давали возможности проверить. Исправление: каждый результат TREX подкреплён набором мультимодальных артефактов: скриншоты, логи выполнения, трассы API и скрипты выполнения. Каждый модальность рассказывает часть истории, позволяя точно отследить, что произошло. Первым впечатляющим артефактом стала видеозапись изменения анимации — показывающая реальный эффект во время выполнения.
Что он ловит
TREX нацелен на баги, которые не видны в diff'ах кода: логические ошибки, требующие определённых последовательностей состояний, регрессии UI после загрузки страницы и состояния гонки, требующие реальных запросов. Он генерирует и запускает тесты, но фокус на поиске багов, а не просто на написании тестов. Под-агент сам разбирается с настройкой.
Как говорит Шлок Мехротра, инженер, стоящий за TREX: «Можно идеально прочитать diff и всё равно полностью пропустить такие баги».
📖 Читать полный источник: HN AI Agents
👀 Смотрите также

Гиппокамп: Система устойчивой памяти для ИИ-агентов с использованием деревьев уплотнения
Hipocampus решает проблему потери контекста ИИ-агентами между сессиями, внедряя дерево компрессии, которое сжимает историю диалогов через пять уровней: исходный → ежедневный → еженедельный → ежемесячный → корневой, с тематическим указателем под названием ROOT.md.

Hollow AgentOS сокращает использование токенов кода Claude на 68,5% благодаря JSON-ориентированной операционной системе для ИИ-агентов.
Hollow AgentOS — это JSON-ориентированная операционная система для ИИ-агентов, которая сокращает использование токенов в Claude Code на 68,5%, устраняя избыточные накладные расходы на выполнение shell-команд. Она интегрируется в Claude Code через MCP, запускает локальные вычисления через Ollama и распространяется под лицензией MIT.

Система Торгового Совета с Мульти-Агентами на основе GPT-5.1 и Claude 4.6
Разработчик создал многокомпонентную торговую систему, использующую ZagiHQ для оркестрации с тремя параллельными агентами сбора данных и тремя LLM (GPT-5.1, Claude 4.6 Opus, Claude 4.6 Sonnet), которые должны согласовывать сделки. Система отсеивает торговые сетапы через несогласие и требует ручного подтверждения.

Сервер Octopoda MCP добавляет постоянную память, обнаружение циклов и журналы аудита в код Claude.
Разработчик создал Octopoda, сервер MCP, который интегрируется с Claude Code, предоставляя постоянную память, обнаружение циклов, аудиторские журналы и общие пространства знаний для ИИ-агентов. Система использует PostgreSQL с pgvector для семантического поиска, FastAPI и React-панель управления.