Агент-Xray: Инструмент с открытым исходным кодом для отладки сбоев ИИ-агентов на основе журналов трассировки

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source
Агент-Xray: Инструмент с открытым исходным кодом для отладки сбоев ИИ-агентов на основе журналов трассировки
Ad

Agent-Xray — это инструмент с открытым кодом для отладки ИИ-агентов путём анализа их журналов трассировки. Он был создан для решения проблемы, когда агенты не справляются с задачами без явных ошибок — ситуаций, в которых код выполняется корректно, но агент принимает неверные решения, например, многократно вызывает неправильный инструмент, несмотря на сообщения об ошибках, указывающие на правильный.

Ключевые возможности

Инструмент читает журналы трассировки и предоставляет структурную оценку и классификацию первопричин сбоев агентов. Он воссоздаёт, что видел агент на каждом шаге, чтобы помочь понять, почему были приняты ошибочные решения.

Категории сбоев

  • spin
  • tool_bug
  • early_abort

Режим enforcement

По словам создателя, наиболее значимой функцией является режим enforcement. После исправления ошибки агента этот режим запускает сложные задачи для проверки ваших исправлений на устойчивость. Он проверяет:

  • Жёстко заданные возвращаемые значения
  • Ослабленные утверждения

Это решает проблему, когда исправления могут работать на конкретных тестовых задачах, но на самом деле являются хрупкими, или когда агенты учатся обходить тесты.

Ad

Интеграция в рабочий процесс

Инструмент работает как инструменты MCP, позволяя Claude Code использовать его напрямую. Типичный рабочий процесс, описанный в источнике:

  1. Попросите Claude Code проанализировать трассировки агентов
  2. Он находит самый серьёзный сбой
  3. Воспроизводит, что видел агент
  4. Предлагает исправление
  5. Режим enforcement проверяет, что исправление действительно работает

Создатель описывает это как «агенты отлаживают агентов».

Технические детали

  • Установка: pip install agent-xray
  • Быстрый старт: agent-xray quickstart (включает примеры трассировок для тестирования без ваших данных)
  • Лицензия: MIT
  • Нет зависимостей
  • Работает офлайн
  • Совместим с трассировками OpenAI, Anthropic, LangChain, CrewAI, OpenTelemetry
  • Возраст проекта: около 9 дней на момент публикации

Сценарий использования

Этот инструмент предназначен для разработчиков, работающих с ИИ-агентами, которым необходимо отлаживать сбои, не приводящие к традиционным ошибкам или трассировкам стека — ситуации, когда агенты принимают неверные решения, несмотря на доступ к правильным инструментам и информации.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Разработчик создает MCP-сервер, объединяющий 18 инструментов электронной коммерции с Claude.
Инструменты

Разработчик создает MCP-сервер, объединяющий 18 инструментов электронной коммерции с Claude.

Разработчик создал MCP-сервер, который интегрирует 18 платформ и инструментов электронной коммерции с Claude, позволяя выполнять перекрестные запросы по нескольким источникам данных. Проект был в основном построен с использованием Claude Code (Opus) за дни, а не месяцы.

OpenClawRadar
IUM: Индексатор символов MCP сокращает использование токенов AI Agent в 15,9 раза по сравнению с grep
Инструменты

IUM: Индексатор символов MCP сокращает использование токенов AI Agent в 15,9 раза по сравнению с grep

IUM индексирует кодовые базы в матрицу SQLite событий символов, предоставляя точные координаты файл:строка, трассировку графа вызовов и семантический поиск через MCP. Протестирован на DataFusion (1 538 файлов), показав в 15,9 раз меньше токенов, чем grep для эквивалентных запросов.

OpenClawRadar
Скальпель v2.0: Сканер кодовой базы и оркестратор ИИ-агентов
Инструменты

Скальпель v2.0: Сканер кодовой базы и оркестратор ИИ-агентов

Scalpel v2.0 — это инструмент с открытым исходным кодом, который сканирует кодовую базу по 12 измерениям и формирует команды пользовательских ИИ-агентов. Он включает в себя сканер на чистом bash, который работает без использования токенов ИИ и совместим с Claude Code, Codex, Gemini, Cursor, Windsurf, Aider и OpenCode.

OpenClawRadar
嵌入Shell中的AI代理:终端缓冲与覆盖扩展
Инструменты

嵌入Shell中的AI代理:终端缓冲与覆盖扩展

Оболочка с открытым исходным кодом и встроенным ИИ-агентом, который читает вывод терминала и вводит команды через плавающее наложение. Поддерживает локальные и облачные модели.

OpenClawRadar