Kiro CLIでAnthropic Generator-Evaluatorを再現：12回のイテレーションでサイト構築

ある開発者が、GANに着想を得たAnthropicの長期間稼働アプリ向けGenerator-Evaluatorハーネスデザインを再現しました。アーキテクチャは、Planner（1回実行）の後、Generator ↔ Evaluatorループを12回繰り返します。各エージェントは独立したCLIプロセスで、共有コンテキストはゼロ、ファイル（spec.md、eval-report.md）を介してのみ通信します。EvaluatorはPlaywrightを使用してライブサイトを閲覧します（コードを読むだけではありません）。

主要なアーキテクチャ詳細

呼び出しごとにクリーンスレート: 各エージェントは新たに起動し、自分の入力ファイルのみを読み取ります。コンテキストの不安を防ぎます。
テスト用のPlaywright MCP: ナビゲート、クリック、ビューポートのリサイズを行います。コードレビューでは決して見つからないビジュアルバグをキャッチします。
Anthropicのフロントエンドデザインスキル: 一般的なAIパターン（Interフォント、紫のグラデーション、カードレイアウトなど）を明示的にペナルティします。創造的なリスクテイクを強制します。
継続的なイテレーション、失敗時の再試行ではない: 全12ラウンドが関係なく実行されます。各ラウンドで改善されます。