Агент-Xray: Инструмент с открытым исходным кодом для отладки сбоев ИИ-агентов на основе журналов трассировки

Agent-Xray — это инструмент с открытым кодом для отладки ИИ-агентов путём анализа их журналов трассировки. Он был создан для решения проблемы, когда агенты не справляются с задачами без явных ошибок — ситуаций, в которых код выполняется корректно, но агент принимает неверные решения, например, многократно вызывает неправильный инструмент, несмотря на сообщения об ошибках, указывающие на правильный.
Ключевые возможности
Инструмент читает журналы трассировки и предоставляет структурную оценку и классификацию первопричин сбоев агентов. Он воссоздаёт, что видел агент на каждом шаге, чтобы помочь понять, почему были приняты ошибочные решения.
Категории сбоев
- spin
- tool_bug
- early_abort
Режим enforcement
По словам создателя, наиболее значимой функцией является режим enforcement. После исправления ошибки агента этот режим запускает сложные задачи для проверки ваших исправлений на устойчивость. Он проверяет:
- Жёстко заданные возвращаемые значения
- Ослабленные утверждения
Это решает проблему, когда исправления могут работать на конкретных тестовых задачах, но на самом деле являются хрупкими, или когда агенты учатся обходить тесты.
Интеграция в рабочий процесс
Инструмент работает как инструменты MCP, позволяя Claude Code использовать его напрямую. Типичный рабочий процесс, описанный в источнике:
- Попросите Claude Code проанализировать трассировки агентов
- Он находит самый серьёзный сбой
- Воспроизводит, что видел агент
- Предлагает исправление
- Режим enforcement проверяет, что исправление действительно работает
Создатель описывает это как «агенты отлаживают агентов».
Технические детали
- Установка:
pip install agent-xray - Быстрый старт:
agent-xray quickstart(включает примеры трассировок для тестирования без ваших данных) - Лицензия: MIT
- Нет зависимостей
- Работает офлайн
- Совместим с трассировками OpenAI, Anthropic, LangChain, CrewAI, OpenTelemetry
- Возраст проекта: около 9 дней на момент публикации
Сценарий использования
Этот инструмент предназначен для разработчиков, работающих с ИИ-агентами, которым необходимо отлаживать сбои, не приводящие к традиционным ошибкам или трассировкам стека — ситуации, когда агенты принимают неверные решения, несмотря на доступ к правильным инструментам и информации.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Использование сервера MCP для оптимизации приложений React Native с помощью Claude Code
Сервер MCP передает данные в реальном времени из приложения React Native в Claude Code, выявляя проблемы производительности, такие как ненужные перерисовки и избыточные рендеры.

agent-recall: Локальный SQLite MCP для постоянной памяти кода Claude
agent-recall — это MCP-сервер, который предоставляет Claude Code постоянную память между сессиями с использованием локального файла SQLite. Он предлагает 9 инструментов MCP для сохранения сущностей, связей и наблюдений, а также предоставляет сводки, сгенерированные ИИ, в начале сессии вместо выгрузки сырых данных.

OpenMind добавляет визуальный интерфейс ментальных карт к установкам OpenClaw.
OpenMind — это инструмент с открытым исходным кодом, который преобразует установки OpenClaw в интерактивные, редактируемые в реальном времени ментальные карты с визуализацией памяти, горячей заменой логики и полнотекстовым поиском по всем узлам.

Формат WCY сокращает нагрузку на токены LLM на 50–71% и добавляет структурные маркеры «Я не знаю».
WCY (Watch-Compute-Yield) — это построчный формат, который сокращает накладные расходы на токены JSON на 50-71% и вводит структурные маркеры '?' для обозначения неопределённости в рассуждениях ИИ. Формат не требует тонкой настройки — достаточно всего трёх примеров.