MCP как интерфейс наблюдаемости: подключение ИИ-агентов к точкам трассировки ядра

Протокол контекста модели (MCP) становится интерфейсом между ИИ-агентами и данными инфраструктуры. В марте 2026 года три значимых события подчеркнули эту тенденцию: Datadog выпустил MCP-сервер, подключающий данные мониторинга в реальном времени к ИИ-агентам для автоматического обнаружения и устранения проблем, Qualys опубликовал анализ безопасности, назвав MCP-серверы «новой теневой ИТ для ИИ», а Microsoft Retina продемонстрировала мониторинг сети Kubernetes на основе eBPF.
Два подхода к мониторингу через MCP
Существует два способа подключения данных мониторинга к ИИ-агентам через MCP:
- Подход 1: Обёртывание существующих платформ — стратегия Datadog берёт уже собранные и агрегированные метрики, логи и трассировки и предоставляет к ним доступ через инструменты MCP. ИИ-агент запрашивает API дашборда, получает предварительно обработанные данные и действует на их основе. Это подходит командам со зрелыми стеками мониторинга, желающим добавить автоматизацию на основе ИИ поверх существующей системы.
- Подход 2: Создание нативной для MCP системы мониторинга — вместо обёртывания существующей платформы создать агент eBPF, который отслеживает системные вызовы через uprobes, сохраняет результаты в SQLite и предоставляет доступ ко всему через инструменты MCP. Интерфейс MCP становится основным интерфейсом, а не адаптерным слоем.
Нативный мониторинг MCP на практике
В статье подробно рассматривается конкретный пример трассировки регрессии TTFT в vLLM, где время получения первого токена было в 14,5 раз больше базового. База данных трассировок зафиксировала каждый вызов API CUDA, переключение контекста ядра и выделение памяти. Когда Claude подключается к MCP-серверу и загружает эту базу данных, он может использовать четыре конкретных инструмента:
get_trace_stats— Просмотр полной сводки трассировки: 12 847 событий CUDA, 4 причинно-следственные цепочки, общее время GPUget_causal_chains— Чтение причинно-следственных цепочек, объясняющих, почему произошёл скачок задержки, на простом английском языкеrun_sql— Выполнение пользовательских запросов к необработанным данным событий (например, «покажи мне все вызовы cudaMemcpyAsync длительностью более 100 мс»)get_stacks— Исследование стеков вызовов для любого отмеченного события
Claude определил первопричину менее чем за 30 секунд: вычисление logprobs блокировало цикл декодирования, создавая замедление в 256 раз на критическом пути. Эта первопричина не была видна в агрегированных метриках, только в необработанных причинно-следственных цепочках между конкретными вызовами API CUDA.
Вопросы безопасности
Qualys обнаружил, что более 53% MCP-серверов полагаются на статические секреты для аутентификации, и рекомендовал добавить мониторинг для MCP-серверов: логирование событий обнаружения возможностей, отслеживание паттернов вызовов и оповещение об аномалиях. Для MCP-серверов, имеющих доступ к инфраструктуре GPU, поверхность атаки включает информацию о времени, структуры памяти и детали архитектуры модели.
В реализации Ingero каждый вызов инструмента MCP отслеживается с использованием той же инфраструктуры eBPF, которая фиксирует события GPU, создавая единый конвейер мониторинга, а не отдельный слой логирования.
📖 Прочитать полный источник: HN AI Agents
👀 Смотрите также

Tycono: Открытая платформа для ИИ-агентов с организационной структурой и автономными циклами улучшений
Tycono — это открытая платформа, где вы определяете роли ИИ-агентов в формате YAML (CTO, инженер, QA и т.д.), и они работают вместе, следуя организационной структуре с автономными циклами улучшений. Система выполнила 17 раундов за ночь на задаче создания пиксельной беговой игры, сгенерировав 6 796 строк кода в 43 коммитах.

cldctrl: Терминальная панель управления для управления сессиями кода Claude
cldctrl — это npm-пакет, предоставляющий терминальную панель управления для запуска и управления сессиями Claude Code в различных проектах. Он читает существующие данные ~/.claude, автоматически обнаруживает проекты и показывает использование токенов с индикаторами лимитов.

Сравнение 14 вариантов ИИ-агента Claw по 10 категориям
Подробное сравнение 14 популярных вариантов агентов Claw AI, включая OpenClaw, NanoClaw, NemoClaw, ZeroClaw, PicoClaw, Moltis, IronClaw и NullClaw, с оценкой по 53 подпараметрам, составными рейтингами и идеальными вариантами использования для каждого.

Memex: Плагин с открытым исходным кодом для расширения памяти в Claude Cowork
Memex — это плагин с открытым исходным кодом, который предоставляет Claude Cowork постоянную память между сессиями с помощью многоуровневой системы загрузки контекста. После однократного запуска команды /memex:init, Claude самостоятельно знакомится с проектом примерно за 20 секунд в каждой сессии и продолжает с того места, где вы остановились.