MCPをオブザーバビリティインターフェースとして:AIエージェントとカーネルトレースポイントの接続

✍️ OpenClawRadar📅 公開日: April 17, 2026🔗 Source
MCPをオブザーバビリティインターフェースとして:AIエージェントとカーネルトレースポイントの接続
Ad

モデルコンテキストプロトコル(MCP)は、AIエージェントとインフラストラクチャデータ間のインターフェースとなりつつあります。2026年3月、このトレンドを象徴する3つの重要な進展がありました:DatadogがリアルタイムのオブザーバビリティデータをAIエージェントに接続して自動検出と修復を可能にするMCPサーバーを提供したこと、QualysがMCPサーバーを「AIの新しいシャドウIT」と呼ぶセキュリティ分析を公開したこと、そしてMicrosoft RetinaがeBPFベースのKubernetesネットワークオブザーバビリティを実証したことです。

MCPオブザーバビリティへの2つのアプローチ

MCPを介してオブザーバビリティデータをAIエージェントに接続する方法は2つあります:

  • アプローチ1: 既存プラットフォームをラップする - Datadogの戦略は、既に収集・集計されているメトリクス、ログ、トレースを取得し、MCPツールを通じて公開するものです。AIエージェントはダッシュボードAPIにクエリを実行し、事前処理されたデータを取得して、それに基づいて行動します。これは、成熟したオブザーバビリティスタックを持ち、その上にAI駆動の自動化を望むチームに有効です。
  • アプローチ2: MCPネイティブなオブザーバビリティを構築する - 既存プラットフォームをラップする代わりに、uprobesを介してシステムコールをトレースし、結果をSQLiteに保存し、すべてをMCPツールを通じて公開するeBPFエージェントを構築します。MCPインターフェースはアダプタ層ではなく、主要なインターフェースになります。
Ad

実践におけるMCPネイティブオブザーバビリティ

本記事では、最初のトークンがベースラインよりも14.5倍長くかかったvLLM TTFT回帰をトレースする具体的な例を詳述しています。トレースデータベースは、すべてのCUDA APIコール、カーネルコンテキストスイッチ、メモリ割り当てを記録しました。ClaudeがMCPサーバーに接続してこのデータベースを読み込むと、4つの特定のツールを使用できます:

  • get_trace_stats - 完全なトレースサマリーを確認:12,847のCUDAイベント、4つの因果連鎖、総GPU時間
  • get_causal_chains - レイテンシーが急増した理由を説明する因果連鎖を平易な英語で読む
  • run_sql - 生のイベントデータに対してカスタムクエリを実行(例:「100msを超えるすべてのcudaMemcpyAsyncコールを表示」)
  • get_stacks - フラグが立てられた任意のイベントのコールスタックを検査

Claudeは30秒以内に根本原因を特定しました:logprobsの計算がデコードループをブロックし、クリティカルパス上で256倍の速度低下を引き起こしていました。この根本原因は集計メトリクスでは見えず、特定のCUDA APIコール間の生の因果連鎖でのみ確認できました。

セキュリティ上の考慮事項

Qualysは、MCPサーバーの53%以上が認証に静的シークレットに依存していることを発見し、MCPサーバーにオブザーバビリティを追加することを推奨しました:機能発見イベントのロギング、呼び出しパターンの監視、異常のアラートなどです。GPUインフラストラクチャにアクセスするMCPサーバーでは、攻撃対象領域にはタイミング情報、メモリレイアウト、モデルアーキテクチャの詳細が含まれます。

Ingeroの実装では、すべてのMCPツール呼び出しは、GPUイベントをキャプチャするのと同じeBPFインフラストラクチャを使用してトレースされ、別個のロギング層ではなく、統一されたオブザーバビリティパイプラインを形成しています。

📖 Read the full source: HN AI Agents

Ad

👀 See Also

素晴らしいオープンクロー・スキルリポジトリは、5,400以上の厳選されたスキルを提供しています。
Tools

素晴らしいオープンクロー・スキルリポジトリは、5,400以上の厳選されたスキルを提供しています。

awesome-openclaw-skillsというGitHubリポジトリは、公式OpenClaw Skills Registryからフィルタリングされた1,715以上の本番環境対応スキルを提供しており、AIエージェントが1つのCLIコマンドでインストールできます。

OpenClawRadar
Claude Code Sessionsの改善にclaude-self-improveを活用する
Tools

Claude Code Sessionsの改善にclaude-self-improveを活用する

Claude-self-improveは、セッションデータを分析し、メモリファイルを自動的に更新することで、Claude CodeのAIパフォーマンスを向上させるCLIツールです。

OpenClawRadar
逆解析されたClaude Code SDKが4言語でリリースされました
Tools

逆解析されたClaude Code SDKが4言語でリリースされました

ある開発者がClaude Codeをリバースエンジニアリングし、Node.js、Python、Go、Rust向けの依存関係ゼロの単一ファイルSDKを作成しました。これらのツールは、既存のClaude Pro/Maxサブスクリプションを使用しながら、ストリーミングとツール使用を備えた完全なエージェントループを提供します。

OpenClawRadar
エージェントチャット:AIエージェントのためのソーシャルネットワークと決済システム
Tools

エージェントチャット:AIエージェントのためのソーシャルネットワークと決済システム

新しいプラットフォームにより、AIエージェントは互いを見つけ、自律的に仕事を交渉し、完了したタスクに対して報酬を受け取ることができます。

OpenClaw Radar