Агент-Xray: Инструмент с открытым исходным кодом для отладки сбоев ИИ-агентов на основе журналов трассировки

✍️ OpenClawRadar📅 Опубликовано: 15 апреля 2026 г.🔗 Source
Агент-Xray: Инструмент с открытым исходным кодом для отладки сбоев ИИ-агентов на основе журналов трассировки
Ad

Agent-Xray — это инструмент с открытым кодом для отладки ИИ-агентов путём анализа их журналов трассировки. Он был создан для решения проблемы, когда агенты не справляются с задачами без явных ошибок — ситуаций, в которых код выполняется корректно, но агент принимает неверные решения, например, многократно вызывает неправильный инструмент, несмотря на сообщения об ошибках, указывающие на правильный.

Ключевые возможности

Инструмент читает журналы трассировки и предоставляет структурную оценку и классификацию первопричин сбоев агентов. Он воссоздаёт, что видел агент на каждом шаге, чтобы помочь понять, почему были приняты ошибочные решения.

Категории сбоев

  • spin
  • tool_bug
  • early_abort

Режим enforcement

По словам создателя, наиболее значимой функцией является режим enforcement. После исправления ошибки агента этот режим запускает сложные задачи для проверки ваших исправлений на устойчивость. Он проверяет:

  • Жёстко заданные возвращаемые значения
  • Ослабленные утверждения

Это решает проблему, когда исправления могут работать на конкретных тестовых задачах, но на самом деле являются хрупкими, или когда агенты учатся обходить тесты.

Ad

Интеграция в рабочий процесс

Инструмент работает как инструменты MCP, позволяя Claude Code использовать его напрямую. Типичный рабочий процесс, описанный в источнике:

  1. Попросите Claude Code проанализировать трассировки агентов
  2. Он находит самый серьёзный сбой
  3. Воспроизводит, что видел агент
  4. Предлагает исправление
  5. Режим enforcement проверяет, что исправление действительно работает

Создатель описывает это как «агенты отлаживают агентов».

Технические детали

  • Установка: pip install agent-xray
  • Быстрый старт: agent-xray quickstart (включает примеры трассировок для тестирования без ваших данных)
  • Лицензия: MIT
  • Нет зависимостей
  • Работает офлайн
  • Совместим с трассировками OpenAI, Anthropic, LangChain, CrewAI, OpenTelemetry
  • Возраст проекта: около 9 дней на момент публикации

Сценарий использования

Этот инструмент предназначен для разработчиков, работающих с ИИ-агентами, которым необходимо отлаживать сбои, не приводящие к традиционным ошибкам или трассировкам стека — ситуации, когда агенты принимают неверные решения, несмотря на доступ к правильным инструментам и информации.

📖 Read the full source: r/ClaudeAI

Ad

👀 Смотрите также

Использование сервера MCP для оптимизации приложений React Native с помощью Claude Code
Инструменты

Использование сервера MCP для оптимизации приложений React Native с помощью Claude Code

Сервер MCP передает данные в реальном времени из приложения React Native в Claude Code, выявляя проблемы производительности, такие как ненужные перерисовки и избыточные рендеры.

OpenClawRadar
agent-recall: Локальный SQLite MCP для постоянной памяти кода Claude
Инструменты

agent-recall: Локальный SQLite MCP для постоянной памяти кода Claude

agent-recall — это MCP-сервер, который предоставляет Claude Code постоянную память между сессиями с использованием локального файла SQLite. Он предлагает 9 инструментов MCP для сохранения сущностей, связей и наблюдений, а также предоставляет сводки, сгенерированные ИИ, в начале сессии вместо выгрузки сырых данных.

OpenClawRadar
OpenMind добавляет визуальный интерфейс ментальных карт к установкам OpenClaw.
Инструменты

OpenMind добавляет визуальный интерфейс ментальных карт к установкам OpenClaw.

OpenMind — это инструмент с открытым исходным кодом, который преобразует установки OpenClaw в интерактивные, редактируемые в реальном времени ментальные карты с визуализацией памяти, горячей заменой логики и полнотекстовым поиском по всем узлам.

OpenClawRadar
Формат WCY сокращает нагрузку на токены LLM на 50–71% и добавляет структурные маркеры «Я не знаю».
Инструменты

Формат WCY сокращает нагрузку на токены LLM на 50–71% и добавляет структурные маркеры «Я не знаю».

WCY (Watch-Compute-Yield) — это построчный формат, который сокращает накладные расходы на токены JSON на 50-71% и вводит структурные маркеры '?' для обозначения неопределённости в рассуждениях ИИ. Формат не требует тонкой настройки — достаточно всего трёх примеров.

OpenClawRadar