AIエージェントワークフローの3つのボトルネック：取り込み・コンテキスト・ルーティング

ほとんどのAIエージェントのデバッグループは、プロンプトの調整、モデルの交換、温度設定の微調整に終始しますが、実際のボトルネックは別のところにあります。Redditの投稿（ソース）では、プロダクションエージェントの成否を分ける、しばしば見落とされる3つのレイヤーが強調されています。

1. クリーンな入力取り込み

生のPDFや非構造化ドキュメントをそのままエージェントに渡すと、レイアウトの解釈と推論を同時に行わなければならず、一貫性のない出力につながります。修正方法は、解釈を入力取り込みレイヤー（例：LlamaParse）に分離することです。KarpathyがコンテキストウィンドウをRAMに例えているように、ハードドライブをそのままRAMにダンプしてはいけません。ノイズの多いバイトは推論対象ではなく管理対象にすべきです。

2. ステップ間のコンテキストウィンドウ管理

コンテキストドリフトは文書化された障害モードです。40ステップ目になると、エージェントは元のタスクの希釈版で動作しています。修正方法：

現在のステップに必要なものだけを渡す
完了したステップは生の出力を引き継ぐのではなく要約する
エージェントステップ間に型付きスキーマを適用し、予測可能な入力を保証する

Fast.ioの2026年エージェントコスト分析によると、不適切なコンテキスト管理がエージェント総コストの60～70%を占めています。50ページの新しいPDFを推論ループに5回通すと、1ドキュメントあたり0.60ドル以上のコストがかかりますが、適切なチャンキングで数セントに抑えられます。

3. タスクに応じたモデルルーティング

ICLR 2026の論文「The Reasoning Trap」は、モデルの推論能力を強化するトレーニングを行うと、タスクの向上と比例してツール幻覚率が上昇することを発見しました。賢いモデル＝信頼性が高いとは限りません。モデルをタスクに合わせましょう：

DeepSeek：構造化抽出や固定スキーマのタスク（温度0）
Kimi K2.6：コンテキストの一貫性が必要な長いワークフローチェーン
Claude Opus 4.6：長時間のセッションで指示への忠実性がコストを正当化する重要度の高いオーケストレーション

すべてに最先端モデルを使うと予算が破綻します。

一貫したワークフローの青写真

クリーンな入力 → 構造化されたステップ出力 → エージェント間の型付きスキーマ → タスク複雑度に適したモデル → 一貫性が重要な場合はバッチサイズ1

信頼性の高いプロダクションエージェントを持つチームは、入力取り込みとコンテキスト管理を二の次ではなく、第一級のエンジニアリング問題として扱っています。モデルの選択も重要ですが、すべてではありません。

📖 全文をお読みください： r/LocalLLaMA

AIエージェントワークフローで見落とされがちな3つのボトルネック：取り込み、コンテキスト管理、モデルルーティング

1. クリーンな入力取り込み

2. ステップ間のコンテキストウィンドウ管理

3. タスクに応じたモデルルーティング

一貫したワークフローの青写真

👀 See Also

iCloudデスクトップ/ドキュメント同期がMacのClaudeでファイル消失問題を引き起こす

AIコーディングエージェント向けプライマリチャット言語としてHTMLを使用し、SVG図を可能にする

CLAUDE.mdを使ってClaude AIセッション間でプロジェクト規約を維持する

Claudeコンパクションの回避策：Handoff.MDファイルの使用