コーディングエージェント6つの構成要素：ツール、メモリ、コンテキストでLLM拡張

セバスチャン・ラシュカは、コーディングタスクのパフォーマンス向上のためにLLMをアプリケーション層でラップするシステムであるコーディングエージェントのアーキテクチャを概説しています。彼はLLM、推論モデル、エージェントを区別し、LLMシステムにおける実用的な進歩の多くは、単により優れたモデルではなく、それを取り巻くシステムコンポーネントからもたらされると説明しています。

コーディングエージェントの主要構成要素

この記事では、コーディングエージェントを効果的にする6つの主要な基本構成要素を特定しています：

リポジトリコンテキスト: コードリポジトリ情報のナビゲーションと管理
ツール設計: 外部ツールや機能の統合
プロンプトキャッシュの安定性: セッション間での一貫したプロンプト管理
メモリ: 状態の保持とセッションの継続性
長期間セッションの継続性: 長いインタラクションにわたるコンテキストの維持
モデル選択: 適切なLLMまたは推論モデルの選択

アーキテクチャのレイヤー

ラシュカは、エージェントエコシステムにおけるいくつかの重要な概念を定義しています：

LLM: コアとなる次トークンモデル
推論モデル: 中間推論、検証、または候補回答の探索により多くの推論時間計算を費やすように訓練またはプロンプトされたLLM
エージェント: 次に何を検査するか、どのツールを呼び出すか、状態をどのように更新するか、いつ停止するかを決定する、モデルを囲む制御ループ
エージェントハーネス: コンテキスト、ツール使用、プロンプト、状態、制御フローを管理する、エージェントを囲むソフトウェアの骨組み
コーディングハーネス: コードコンテキスト、ツール、実行、反復的フィードバックを管理する、エージェントハーネスの特別なケース（ソフトウェアエンジニアリング向け）

彼は、Claude CodeとCodex CLIはコーディングハーネスと見なすことができると指摘しています。この関係は次のように説明されています：LLMはエンジンであり、推論モデルは強化されたエンジンであり、エージェントハーネスはモデルを効果的に使用するのに役立ちます。

コーディング作業には、単なる次トークン生成以上のものが含まれます—リポジトリナビゲーション、検索、関数ルックアップ、差分の適用、テスト実行、エラー検査、コンテキスト管理が必要です。コーディングハーネスは、モデルファミリー、エージェントループ、ランタイムサポートの3つのレイヤーを組み合わせています。

📖 Read the full source: HN AI Agents