MCP как интерфейс наблюдаемости: подключение ИИ-агентов к точкам трассировки ядра

✍️ OpenClawRadar📅 Опубликовано: 17 апреля 2026 г.🔗 Source
MCP как интерфейс наблюдаемости: подключение ИИ-агентов к точкам трассировки ядра
Ad

Протокол контекста модели (MCP) становится интерфейсом между ИИ-агентами и данными инфраструктуры. В марте 2026 года три значимых события подчеркнули эту тенденцию: Datadog выпустил MCP-сервер, подключающий данные мониторинга в реальном времени к ИИ-агентам для автоматического обнаружения и устранения проблем, Qualys опубликовал анализ безопасности, назвав MCP-серверы «новой теневой ИТ для ИИ», а Microsoft Retina продемонстрировала мониторинг сети Kubernetes на основе eBPF.

Два подхода к мониторингу через MCP

Существует два способа подключения данных мониторинга к ИИ-агентам через MCP:

  • Подход 1: Обёртывание существующих платформ — стратегия Datadog берёт уже собранные и агрегированные метрики, логи и трассировки и предоставляет к ним доступ через инструменты MCP. ИИ-агент запрашивает API дашборда, получает предварительно обработанные данные и действует на их основе. Это подходит командам со зрелыми стеками мониторинга, желающим добавить автоматизацию на основе ИИ поверх существующей системы.
  • Подход 2: Создание нативной для MCP системы мониторинга — вместо обёртывания существующей платформы создать агент eBPF, который отслеживает системные вызовы через uprobes, сохраняет результаты в SQLite и предоставляет доступ ко всему через инструменты MCP. Интерфейс MCP становится основным интерфейсом, а не адаптерным слоем.
Ad

Нативный мониторинг MCP на практике

В статье подробно рассматривается конкретный пример трассировки регрессии TTFT в vLLM, где время получения первого токена было в 14,5 раз больше базового. База данных трассировок зафиксировала каждый вызов API CUDA, переключение контекста ядра и выделение памяти. Когда Claude подключается к MCP-серверу и загружает эту базу данных, он может использовать четыре конкретных инструмента:

  • get_trace_stats — Просмотр полной сводки трассировки: 12 847 событий CUDA, 4 причинно-следственные цепочки, общее время GPU
  • get_causal_chains — Чтение причинно-следственных цепочек, объясняющих, почему произошёл скачок задержки, на простом английском языке
  • run_sql — Выполнение пользовательских запросов к необработанным данным событий (например, «покажи мне все вызовы cudaMemcpyAsync длительностью более 100 мс»)
  • get_stacks — Исследование стеков вызовов для любого отмеченного события

Claude определил первопричину менее чем за 30 секунд: вычисление logprobs блокировало цикл декодирования, создавая замедление в 256 раз на критическом пути. Эта первопричина не была видна в агрегированных метриках, только в необработанных причинно-следственных цепочках между конкретными вызовами API CUDA.

Вопросы безопасности

Qualys обнаружил, что более 53% MCP-серверов полагаются на статические секреты для аутентификации, и рекомендовал добавить мониторинг для MCP-серверов: логирование событий обнаружения возможностей, отслеживание паттернов вызовов и оповещение об аномалиях. Для MCP-серверов, имеющих доступ к инфраструктуре GPU, поверхность атаки включает информацию о времени, структуры памяти и детали архитектуры модели.

В реализации Ingero каждый вызов инструмента MCP отслеживается с использованием той же инфраструктуры eBPF, которая фиксирует события GPU, создавая единый конвейер мониторинга, а не отдельный слой логирования.

📖 Прочитать полный источник: HN AI Agents

Ad

👀 Смотрите также

Tycono: Открытая платформа для ИИ-агентов с организационной структурой и автономными циклами улучшений
Инструменты

Tycono: Открытая платформа для ИИ-агентов с организационной структурой и автономными циклами улучшений

Tycono — это открытая платформа, где вы определяете роли ИИ-агентов в формате YAML (CTO, инженер, QA и т.д.), и они работают вместе, следуя организационной структуре с автономными циклами улучшений. Система выполнила 17 раундов за ночь на задаче создания пиксельной беговой игры, сгенерировав 6 796 строк кода в 43 коммитах.

OpenClawRadar
cldctrl: Терминальная панель управления для управления сессиями кода Claude
Инструменты

cldctrl: Терминальная панель управления для управления сессиями кода Claude

cldctrl — это npm-пакет, предоставляющий терминальную панель управления для запуска и управления сессиями Claude Code в различных проектах. Он читает существующие данные ~/.claude, автоматически обнаруживает проекты и показывает использование токенов с индикаторами лимитов.

OpenClawRadar
Сравнение 14 вариантов ИИ-агента Claw по 10 категориям
Инструменты

Сравнение 14 вариантов ИИ-агента Claw по 10 категориям

Подробное сравнение 14 популярных вариантов агентов Claw AI, включая OpenClaw, NanoClaw, NemoClaw, ZeroClaw, PicoClaw, Moltis, IronClaw и NullClaw, с оценкой по 53 подпараметрам, составными рейтингами и идеальными вариантами использования для каждого.

OpenClawRadar
Memex: Плагин с открытым исходным кодом для расширения памяти в Claude Cowork
Инструменты

Memex: Плагин с открытым исходным кодом для расширения памяти в Claude Cowork

Memex — это плагин с открытым исходным кодом, который предоставляет Claude Cowork постоянную память между сессиями с помощью многоуровневой системы загрузки контекста. После однократного запуска команды /memex:init, Claude самостоятельно знакомится с проектом примерно за 20 секунд в каждой сессии и продолжает с того места, где вы остановились.

OpenClawRadar