Slashエージェントのスタートアップトークンを60%削減:ボットのワークスペースを整理しよう

✍️ OpenClawRadar📅 公開日: May 13, 2026🔗 Source
Ad

r/openclawの開発者が、LLMベースのコーディングエージェントにおける起動トークン消費を劇的に削減する実用的な方法を共有しました。そのアプローチとは、ワークスペースルート内のすべてのマークダウンファイルに対してLLMを実行し、ブロートや重複を特定・排除するというものです。

主なアクション

  • ワークスペースルートのすべてのマークダウンファイルをレビューし、冗長または過剰なコンテンツ(例:変更ログ、重複した記憶、ユーザー情報)を特定。
  • 残ったファイルを、一貫性を持たせるためにメモリシステムと同様の構造に整理。
  • プロセスを客観的に保つため、エージェントを介さずCLIツール(codex)を使用。
  • クイックノート用のTOOLSファイルと、エージェントが必要に応じて取得できるツールごとの詳細を含む別のtools/フォルダを作成。
  • 異なるモデル間で一貫したトーンを維持するために、voiceなどの新しいファイルを追加。

結果

起動トークンは80kから31kに削減され、61%の削減となりました。ワークスペースはよりスリムになり、エージェントは必須コンテキストを失うことなく、より応答性が向上しました。

これが重要な理由

起動トークンが多いと、応答時間が遅くなりコストが増加します。エージェントループの外でLLMを使ってワークスペースファイルを定期的に監査することで、ブロートの蓄積を防ぎ、トークン予算を管理できます。

対象者

長期稼働するAIコーディングエージェントを運用しており、コンテキスト品質を犠牲にすることなくトークンの無駄を削減し、エージェントのパフォーマンスを向上させたいと考えている開発者。

📖 Read the full source: r/openclaw

Ad

👀 See Also

思考構造の可視化のためのClaudeプロンプト:意図、現実、ギャップ
Tips

思考構造の可視化のためのClaudeプロンプト:意図、現実、ギャップ

Redditユーザーが、会話中の思考構造にAIに気づかせ、反映させるための100語のプロンプトを共有しました。このプロンプトでは、内容ではなく構造パターン(意図(WANT)、現実(IS)、ギャップ(UNRESOLVED))に注目するようClaudeに指示しています。

OpenClawRadar
クラウドユーザーが、直接的な技術的フィードバックのための「私の感情を管理しないで」プロンプトを共有
Tips

クラウドユーザーが、直接的な技術的フィードバックのための「私の感情を管理しないで」プロンプトを共有

Claudeユーザーは、検証の前置きを減らしてより直接的な技術的フィードバックを得るために、ユーザー設定で特定のプロンプトを設定することを推奨しています。このプロンプトは、Claudeに外交的な言い回しを飛ばして、技術的・創造的な作業について率直な批評を提供するよう指示します。

OpenClawRadar
VSCode/Cursor統合ターミナルでClaude Codeを実行してワークフローを改善
Tips

VSCode/Cursor統合ターミナルでClaude Codeを実行してワークフローを改善

VSCodeやCursorの統合ターミナルでClaude Codeを実行すると、外部ターミナルではなく、ウィンドウを切り替えることなくgit diffパネルやデバッガーにすぐにアクセスでき、設定も不要です。

OpenClawRadar
コーディングエージェントによるllama.cppの大規模プロンプト再処理:KVキャッシュとコンテキストスワップのデバッグ
Tips

コーディングエージェントによるllama.cppの大規模プロンプト再処理:KVキャッシュとコンテキストスワップのデバッグ

あるユーザーが、opencode + pi.dev を使用中に llama.cpp が類似プロンプトに対して 40k 以上のトークンを再処理する問題を報告。LCP 類似度が高いにもかかわらず発生している。設定の詳細と推定原因が共有されている。

OpenClawRadar