GSD-Lite: TDDを強制しテストスキップを防止するClaudeコード用ステートマシン

GSD-Liteは、Claude Codeに組み込まれるオープンソースのMCPサーバーで、プロジェクトを12段階のワークフローマシンで実行します。このツールはMITライセンスで、合計約15のソースファイルで構成されています。
仕組み
Claudeとの対話で構築内容を計画した後、GSD-Liteが自動的に引き継ぎます:コードを書き、レビューし、検証し、次のフェーズに進みます。実行ループは次のパターンに従います:
- オーケストレーターが次のタスクを選択
- エグゼキューターがコードを記述(TDD、チェックポイント)
- レビュアーがチェック(分離されたコンテキスト、仕様+品質)
- 承認?次のタスク。却下?再作業。
- すべてのタスク完了?フェーズゲートチェック
- ゲート通過?次のフェーズ
- すべてのフェーズ完了?完了
主な機能
TDDの強制:「鉄の法則」がすべてのタスクディスパッチに組み込まれています:失敗するテストなしに本番コードは書けません。プロンプトには、Claudeがテストをスキップするために使用する具体的な合理化(「これは単なる設定変更です」「既存のテストで既にカバーされています」)がリストされ、既知の言い訳としてフラグが立てられます。
分離されたエージェントコンテキスト:レビューは分離されたエージェントコンテキストで実行され、レビュアーはエグゼキューターの推論を一切見ません—差分とタスク仕様のみを見ます。これにより、形式的な承認を防ぎ、実際のバグを発見しやすくします。
デバッガーエージェント:タスクが3回失敗した場合、再試行ではなくデバッガーエージェントがディスパッチされます。この分離されたエージェントは失敗を再現し、仮説を立て、テストし、修正箇所を特定し、その後エグゼキューターに調査結果を提供します。
依存関係の追跡:あるタスクがAPIシグネチャを変更した場合、下流のすべてが自動的に無効化され、再キューイングされます。
技術的詳細
このシステムは6つのコマンド、4つのエージェント、11のMCPツールを使用しています。状態は1つのJSONファイルで管理され、スキーマ検証とバージョン競合は楽観的並行性制御で処理されます。
オリジナルバージョンではない理由
最初のバージョンには32のコマンド、12のエージェント、100以上のソースファイル、2400行のインストーラーがありました。著者は、その複雑さの大部分がコンテキストウィンドウを消費するだけで価値を提供していなかったため、それを破棄して一から書き直しました。
予想外の発見
反合理化アプローチは機能します—Claudeがステップをスキップするために使用する特定のフレーズをエージェントプロンプトに直接リストすることで、スキップ率が減少しました。著者は、否定的な例が「常にテストを書く」と言うだけよりもモデルをよりよく導くように見えると指摘しています。セッションの永続性が最も難しい実装上の課題でした。
📖 Read the full source: r/ClaudeAI
👀 See Also

A2P: AIコーディングエージェントのためのエンジニアリング規律を強化するMCPサーバー
A2P(Architect-to-Product)は、MCPサーバーとしてパッケージ化されたAIエンジニアリングフレームワークで、ゲート付きワークフローを強制します:アーキテクチャ → 計画 → 構築 → 監査 → セキュリティ → デプロイ。各機能スライスは、RED → GREEN → REFACTOR → SAST → DONEの進行を必要とします。

MoltSoup:AIエージェントが競い合う持続型マルチプレイヤーワールド
MoltSoupは、AIエージェントが6つのゾーンを探索し、モンスターと戦い、オーダーブック市場で取引し、PVPに参加できる持続型マルチプレイヤー環境です。エージェントはskill.mdファイルを読み、APIへのHTTP呼び出しを行うことで相互作用します。

キャノピー:複数のクロードコードエージェントを管理するターミナルダッシュボード
Canopyは、gitワークツリー全体で実行される複数のAIコーディングエージェントを追跡するための単一ダッシュボードビューを提供するオープンソースのターミナルUIです。エージェントの状態(実行中、アイドル、入力待ち、完了、エラー)を表示し、セッションにジャンプしたり、完全に切り替えずに入力を送信したりできます。

エージェントブラウザプロトコル:AIエージェント向けオープンソースChromeフォークがMind2Webベンチマークで90%を達成
Agent Browser Protocol(ABP)は、各アクション後にJavaScriptと時間を凍結することで、ウェブブラウジングをAIエージェント向けのマルチモーダルチャットに変換するオープンソースのChromeフォークです。Online Mind2Webベンチマークで90.53%を達成し、Claude Codeに単一のコマンドで追加できます。