Агент-Xray: Инструмент с открытым исходным кодом для отладки сбоев ИИ-агентов на основе журналов трассировки

Agent-Xray — это инструмент с открытым кодом для отладки ИИ-агентов путём анализа их журналов трассировки. Он был создан для решения проблемы, когда агенты не справляются с задачами без явных ошибок — ситуаций, в которых код выполняется корректно, но агент принимает неверные решения, например, многократно вызывает неправильный инструмент, несмотря на сообщения об ошибках, указывающие на правильный.
Ключевые возможности
Инструмент читает журналы трассировки и предоставляет структурную оценку и классификацию первопричин сбоев агентов. Он воссоздаёт, что видел агент на каждом шаге, чтобы помочь понять, почему были приняты ошибочные решения.
Категории сбоев
- spin
- tool_bug
- early_abort
Режим enforcement
По словам создателя, наиболее значимой функцией является режим enforcement. После исправления ошибки агента этот режим запускает сложные задачи для проверки ваших исправлений на устойчивость. Он проверяет:
- Жёстко заданные возвращаемые значения
- Ослабленные утверждения
Это решает проблему, когда исправления могут работать на конкретных тестовых задачах, но на самом деле являются хрупкими, или когда агенты учатся обходить тесты.
Интеграция в рабочий процесс
Инструмент работает как инструменты MCP, позволяя Claude Code использовать его напрямую. Типичный рабочий процесс, описанный в источнике:
- Попросите Claude Code проанализировать трассировки агентов
- Он находит самый серьёзный сбой
- Воспроизводит, что видел агент
- Предлагает исправление
- Режим enforcement проверяет, что исправление действительно работает
Создатель описывает это как «агенты отлаживают агентов».
Технические детали
- Установка:
pip install agent-xray - Быстрый старт:
agent-xray quickstart(включает примеры трассировок для тестирования без ваших данных) - Лицензия: MIT
- Нет зависимостей
- Работает офлайн
- Совместим с трассировками OpenAI, Anthropic, LangChain, CrewAI, OpenTelemetry
- Возраст проекта: около 9 дней на момент публикации
Сценарий использования
Этот инструмент предназначен для разработчиков, работающих с ИИ-агентами, которым необходимо отлаживать сбои, не приводящие к традиционным ошибкам или трассировкам стека — ситуации, когда агенты принимают неверные решения, несмотря на доступ к правильным инструментам и информации.
📖 Read the full source: r/ClaudeAI
👀 Смотрите также

Разработчик создает MCP-сервер, объединяющий 18 инструментов электронной коммерции с Claude.
Разработчик создал MCP-сервер, который интегрирует 18 платформ и инструментов электронной коммерции с Claude, позволяя выполнять перекрестные запросы по нескольким источникам данных. Проект был в основном построен с использованием Claude Code (Opus) за дни, а не месяцы.

IUM: Индексатор символов MCP сокращает использование токенов AI Agent в 15,9 раза по сравнению с grep
IUM индексирует кодовые базы в матрицу SQLite событий символов, предоставляя точные координаты файл:строка, трассировку графа вызовов и семантический поиск через MCP. Протестирован на DataFusion (1 538 файлов), показав в 15,9 раз меньше токенов, чем grep для эквивалентных запросов.

Скальпель v2.0: Сканер кодовой базы и оркестратор ИИ-агентов
Scalpel v2.0 — это инструмент с открытым исходным кодом, который сканирует кодовую базу по 12 измерениям и формирует команды пользовательских ИИ-агентов. Он включает в себя сканер на чистом bash, который работает без использования токенов ИИ и совместим с Claude Code, Codex, Gemini, Cursor, Windsurf, Aider и OpenCode.

嵌入Shell中的AI代理:终端缓冲与覆盖扩展
Оболочка с открытым исходным кодом и встроенным ИИ-агентом, который читает вывод терминала и вводит команды через плавающее наложение. Поддерживает локальные и облачные модели.