コーディングエージェントの構成要素:ツール、メモリ、コンテキストがLLMを拡張する方法

セバスチャン・ラシュカは、コーディングタスクのパフォーマンス向上のためにLLMをアプリケーション層でラップするシステムであるコーディングエージェントのアーキテクチャを概説しています。彼はLLM、推論モデル、エージェントを区別し、LLMシステムにおける実用的な進歩の多くは、単により優れたモデルではなく、それを取り巻くシステムコンポーネントからもたらされると説明しています。
コーディングエージェントの主要構成要素
この記事では、コーディングエージェントを効果的にする6つの主要な基本構成要素を特定しています:
- リポジトリコンテキスト: コードリポジトリ情報のナビゲーションと管理
- ツール設計: 外部ツールや機能の統合
- プロンプトキャッシュの安定性: セッション間での一貫したプロンプト管理
- メモリ: 状態の保持とセッションの継続性
- 長期間セッションの継続性: 長いインタラクションにわたるコンテキストの維持
- モデル選択: 適切なLLMまたは推論モデルの選択
アーキテクチャのレイヤー
ラシュカは、エージェントエコシステムにおけるいくつかの重要な概念を定義しています:
- LLM: コアとなる次トークンモデル
- 推論モデル: 中間推論、検証、または候補回答の探索により多くの推論時間計算を費やすように訓練またはプロンプトされたLLM
- エージェント: 次に何を検査するか、どのツールを呼び出すか、状態をどのように更新するか、いつ停止するかを決定する、モデルを囲む制御ループ
- エージェントハーネス: コンテキスト、ツール使用、プロンプト、状態、制御フローを管理する、エージェントを囲むソフトウェアの骨組み
- コーディングハーネス: コードコンテキスト、ツール、実行、反復的フィードバックを管理する、エージェントハーネスの特別なケース(ソフトウェアエンジニアリング向け)
彼は、Claude CodeとCodex CLIはコーディングハーネスと見なすことができると指摘しています。この関係は次のように説明されています:LLMはエンジンであり、推論モデルは強化されたエンジンであり、エージェントハーネスはモデルを効果的に使用するのに役立ちます。
コーディング作業には、単なる次トークン生成以上のものが含まれます—リポジトリナビゲーション、検索、関数ルックアップ、差分の適用、テスト実行、エラー検査、コンテキスト管理が必要です。コーディングハーネスは、モデルファミリー、エージェントループ、ランタイムサポートの3つのレイヤーを組み合わせています。
📖 Read the full source: HN AI Agents
👀 See Also

構造化されたAIワークフロー:段階ベースのコマンドによる手戻りの削減
ある開発者が、AIコーディングにおける一般的な問題(コンテキストの喪失、標準の破綻、計画と実行の混同)に対処するために、/pwf-brainstormや/pwf-work-planなどの特定のコマンドを使用したプログラム可能なワークフローを共有しています。このアプローチには、必須のドキュメント更新とマルチルートプロジェクト構造が含まれています。

マルチエージェントアーキテクチャ:AIシステムにおけるシングルエージェントの落とし穴を回避する
Redditの投稿では、複数のタスクに単一のエージェントを使用するという一般的なアーキテクチャ上の誤りが指摘されており、これが絶え間ない監視を必要とする脆弱なシステムにつながっています。提案されている解決策は、各エージェントが狭く特定の役割を持つオーケストレーターとスペシャリストのモデルです。

Claude Code向けのスキル作成原則(159のオープンソーススキルから)
開発者が、159のスキルを持つオープンソースのスキルレジストリを構築・維持する中で得た、Claude Code向けの効果的なスキル作成のための10の原則を公開しました。これらの原則は、実際のエージェントの使用状況から観察された実用的な実装パターンに焦点を当てています。

Claude Code設定のための.claude/フォルダ構造の理解
.claude/フォルダには2つのディレクトリがあります:チーム設定用のプロジェクトレベルと、個人設定用のグローバル~/.claude/です。CLAUDE.mdファイルは、Claudeがセッション全体で従う指示を提供し、CLAUDE.local.mdは個人用の上書き設定に使用されます。