エージェント実行をレビューパケットとして扱う:Claude CodeとCodexのための実用的パターン

✍️ OpenClawRadar📅 公開日: May 19, 2026🔗 Source
エージェント実行をレビューパケットとして扱う:Claude CodeとCodexのための実用的パターン
Ad

Codex/Claudeスタイルのエージェントワークフローを試しているRedditユーザーが、結果を改善したパターンを共有しています。チャットのトランスクリプトとして扱う代わりに、人間や他のエージェントが検査できる、複数のアーティファクトを含む永続的なフォルダを生成する方法です。

実行ごとの主要なアーティファクト

  • research.md — エージェントが使用したソースと前提条件
  • drafts.md — 候補となる出力(却下されたものも含む)
  • evals.md — 選択されたオプションのスコアリングルーブリックと理由
  • approval-packet.md — 不可逆的なステップの前のチェックポイント
  • metrics.json — 実行の数値結果
  • memory.md — 再利用可能なワークフローの教訓のみ

2つの大きな教訓

メモリは「作業の方法」に関するものであるべきで、未レビューの事実データベースであってはならない。 重要な主張は、ソース付きのレビュー済みアーティファクトに含めるべきです。

「完全自律」よりも「不可逆的なステップまで自律」の方が有用である。 コードではコミット/デプロイを指し、コンテンツでは公開を指します。ローカルワークフローでは、認証情報やサードパーティのアカウントに触れるものすべてを指します。

なぜこれが役立つのか

失敗が特定の段階で可視化されます:リサーチが間違っていたのか?ドラフトが悪かったのか?評価ルーブリックが曖昧すぎたのか?承認パケットがリスクを見逃したのか?メモリが次回に実際に役立つ教訓を保存したのか?これにより、チャットのトランスクリプトに頼るよりも、イテレーションがより速く、的を絞ったものになります。

この投稿は議論のきっかけです — 著者は、他の人がClaude Code/Codexワークフローで永続的なアーティファクトを使用しているのか、それともチャットのトランスクリプトを信頼しているのかを知りたがっています。

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

同一リファクタリングにおいて、ルーティングエージェントのサブタスクを安価なモデルに振り分けることでコストが18ドルから4ドルに削減
Tips

同一リファクタリングにおいて、ルーティングエージェントのサブタスクを安価なモデルに振り分けることでコストが18ドルから4ドルに削減

開発者は、ルーティン的なサブタスク(lint、リネーム、設定編集など)をDeepSeek V4 ProやTencent Hunyuan Hy3といった安価なモデルに振り分け、複雑な推論にはOpus 4.7を予約することで、エージェントの実行コストを18ドルから4ドルに削減しました。

OpenClawRadar
$200最大プランにおけるClaudeのレート制限を回避する実践的戦略
Tips

$200最大プランにおけるClaudeのレート制限を回避する実践的戦略

開発者が、SQLiteデータベースクエリ、コンテキストハンドオフシステム、戦略的なハードウェア展開など、Claudeの200ドル最大プランで1か月以上スロットリングを防いだ具体的な手法を共有しています。

OpenClawRadar
全てのプロンプトで全てのMCPサーバーを読み込むと静かにトークン予算を浪費する
Tips

全てのプロンプトで全てのMCPサーバーを読み込むと静かにトークン予算を浪費する

5~6個のMCPサーバーを使用しているユーザーが、各プロンプトで全てのサーバーが読み込まれ、大量のトークンが無駄になっていることを発見しました。ルーティング層を実装してプロンプトに関連するサーバーのみを読み込むようにしたところ、トークン使用量が大幅に削減され、応答時間が改善されました。

OpenClawRadar
エージェントフレームワークのトークン肥大化:500:1の入出力比率が正常
Tips

エージェントフレームワークのトークン肥大化:500:1の入出力比率が正常

セルフホストのエージェントフレームワークユーザーから、メッセージあたり約21kの入力トークンと、ツール定義・システムプロンプト・メモリにより入力対出力比が500:1になるとの報告。コミュニティは、ツールを使用するエージェントでは15~25kのベースラインコンテキストが一般的であると確認。

OpenClawRadar