Slashエージェントのスタートアップトークンを60%削減:ボットのワークスペースを整理しよう
r/openclawの開発者が、LLMベースのコーディングエージェントにおける起動トークン消費を劇的に削減する実用的な方法を共有しました。そのアプローチとは、ワークスペースルート内のすべてのマークダウンファイルに対してLLMを実行し、ブロートや重複を特定・排除するというものです。
主なアクション
- ワークスペースルートのすべてのマークダウンファイルをレビューし、冗長または過剰なコンテンツ(例:変更ログ、重複した記憶、ユーザー情報)を特定。
- 残ったファイルを、一貫性を持たせるためにメモリシステムと同様の構造に整理。
- プロセスを客観的に保つため、エージェントを介さずCLIツール(
codex)を使用。 - クイックノート用の
TOOLSファイルと、エージェントが必要に応じて取得できるツールごとの詳細を含む別のtools/フォルダを作成。 - 異なるモデル間で一貫したトーンを維持するために、
voiceなどの新しいファイルを追加。
結果
起動トークンは80kから31kに削減され、61%の削減となりました。ワークスペースはよりスリムになり、エージェントは必須コンテキストを失うことなく、より応答性が向上しました。
これが重要な理由
起動トークンが多いと、応答時間が遅くなりコストが増加します。エージェントループの外でLLMを使ってワークスペースファイルを定期的に監査することで、ブロートの蓄積を防ぎ、トークン予算を管理できます。
対象者
長期稼働するAIコーディングエージェントを運用しており、コンテキスト品質を犠牲にすることなくトークンの無駄を削減し、エージェントのパフォーマンスを向上させたいと考えている開発者。
📖 Read the full source: r/openclaw
👀 See Also

思考構造の可視化のためのClaudeプロンプト:意図、現実、ギャップ
Redditユーザーが、会話中の思考構造にAIに気づかせ、反映させるための100語のプロンプトを共有しました。このプロンプトでは、内容ではなく構造パターン(意図(WANT)、現実(IS)、ギャップ(UNRESOLVED))に注目するようClaudeに指示しています。

クラウドユーザーが、直接的な技術的フィードバックのための「私の感情を管理しないで」プロンプトを共有
Claudeユーザーは、検証の前置きを減らしてより直接的な技術的フィードバックを得るために、ユーザー設定で特定のプロンプトを設定することを推奨しています。このプロンプトは、Claudeに外交的な言い回しを飛ばして、技術的・創造的な作業について率直な批評を提供するよう指示します。

VSCode/Cursor統合ターミナルでClaude Codeを実行してワークフローを改善
VSCodeやCursorの統合ターミナルでClaude Codeを実行すると、外部ターミナルではなく、ウィンドウを切り替えることなくgit diffパネルやデバッガーにすぐにアクセスでき、設定も不要です。

コーディングエージェントによるllama.cppの大規模プロンプト再処理:KVキャッシュとコンテキストスワップのデバッグ
あるユーザーが、opencode + pi.dev を使用中に llama.cpp が類似プロンプトに対して 40k 以上のトークンを再処理する問題を報告。LCP 類似度が高いにもかかわらず発生している。設定の詳細と推定原因が共有されている。