Claude Codeの目標:対抗的レビューによる持続的タスク

Claude Codeの/goalコマンドを使うと、永続的な長いタスクを設定し、Claudeが多くのターンにわたって停止せずに作業を続け、最後に結果を再チェックできます。デフォルトでは、独立した別のClaudeセッションが結果をレビューするため、Claudeが単に完了したと主張することはできません。
ユースケース
- 仕様から何かを構築する: 要件を貼り付け、離れて、すべての項目が実際に実装されたら戻ってくる。
- 「テストが通るまで続ける」: レビューアがリポジトリを元の目標と比較するため、Claudeはテストを削除してごまかせない。
- 長期のリサーチやプロトタイプセッション: 1つのゴールでClaudeを何時間も動かし続け、ターンごとに停止しない。
設定
オプションでソフトトークン予算を設定できます。例: --tokens 250K で、その予算が尽きたらClaudeに終了するよう指示します。
監査の厳格さは設定可能:
- adversarial(デフォルト)— 別のClaudeセッションが作業をレビュー
- self — Claude自身がレビュー(高速かつ無料)
- off — レビューなし
切り替え方法: /goal config set audit.mode <値>
インストール
プラグインマーケットプレイスから:
./plugin marketplace add balakumardev/claude /plugin install claude-code-goal
📖 ソース全文: r/ClaudeAI
👀 See Also

PhAILベンチマークは、実際の倉庫ロボットタスクでVLAモデルをテストします
PhAILは、Franka FR3ロボットを使用したビン間のオーダーピッキングにおいて、4つの視覚言語行動モデルをテストする実ロボットベンチマークです。最高のモデルは1時間あたり64ユニットを達成しましたが、人間による遠隔操作では330UPH、人間による手作業では1,300+ UPHでした。

Claude Code Handoffのための自動セッション状態管理
GitHubプロジェクトは、Claudeとの会話全体を通じてライブセッション状態ファイル(.claude/session-state.md)を維持する自動化フックを提供し、自動圧縮によるコンテキスト消失や会話中のコンテキスト劣化に対処します。このシステムは、重要なイベントやファイル編集を追跡するためにjqを使用した4つのbashスクリプトを利用しています。

Qwen3.5-9B-Claude-4.6-Opus-Uncensored-v2モデルがLM Studio設定付きでリリースされました
Qwen3.5-9BアーキテクチャとClaude 4.6 Opusの学習データを統合した無検閲モデルが利用可能になりました。最適なパフォーマンスを得るためのLM Studio 0.4.7の設定(温度0.7、トップKサンプリング20など)が提供されています。

iOSシミュレータの操作とデバッグのためのPepper MCPサーバー
Pepperは、DYLD_INSERT_LIBRARIESを介してiOSシミュレータアプリにdylibを注入するMCPサーバーであり、WebSocketブリッジを通じてリアルタイムなインタラクション、画面読み取り、ボタンタップ、変数検査、ネットワークトラフィック監視を可能にします。