AIコーディングエージェントのコンテキスト管理：Vercelの80%ツール削減で精度100%

実行のボトルネックは問題ではない

実際のコードベース使用状況の観察から、AIコーディングエージェントは実行よりも発見に多くの時間を費やしていることが一貫して示されています。エージェントが新しいタスクに取り組むたびに、方向付け活動のために15〜20回のツール呼び出しを行います。これには以下が含まれます：

エージェントがコードを書き始める頃には、発見作業ですでにコンテキストウィンドウの大部分を消費しています。

Vercelは、エージェントから80%のツールを削除し、代わりにbashアクセスを与えることで、逆方向からこの問題を実証しました。このアプローチにより100%の精度が達成され、実行能力が制限要因ではないことが示唆されています。

同様に、Pi（最小限のコーディングエージェント）は、わずか4つのツールと1,000トークン未満のシステムプロンプトで同じ点を証明しています。

実行が事実上解決されているなら、実際の難しい問題はコンテキスト管理になります。この課題にはいくつかの要因が寄与しています：

大規模なコードベースは現在のどのコンテキストウィンドウにも収まらない
長いタスクはツール出力を蓄積し、初期の推論を注意ウィンドウから押し出す
動的環境はセッション間で変化する
「Lost in the Middle」の研究は、モデルがコンテキストウィンドウの開始時（まさにエージェントがまだ検索している時）に最もよく推論することを示している

著者は、これらの問題とAIコーディングエージェント開発への影響を探るより詳細な分析を公開しています。

📖 Read the full source: r/LocalLLaMA