Prefex: プロンプトキャッシュとセッションメモリを自動化するClaude Code用ローカルプロキシ

✍️ OpenClawRadar📅 公開日: April 15, 2026🔗 Source
Prefex: プロンプトキャッシュとセッションメモリを自動化するClaude Code用ローカルプロキシ
Ad

Prefexは、Claude Codeの使用時にAPIコストを削減するために設計されたローカルプロキシツールです。2つの具体的なコスト非効率性に対処します:Anthropicのベータ版プロンプトキャッシュ機能には手動でのヘッダー注入が必要であり、Claude Codeはすべてのリクエストで完全な会話履歴を送信します。

仕組み

Prefexは、Claude CodeとAnthropicのAPIの間のプロキシとして、完全にローカルマシン上で動作します。Anthropicのプロンプトキャッシュ機能を有効にするために必要な特定のヘッダーを自動的に注入し、繰り返し入力トークンのコストを90%削減します。このヘッダーがない場合、CLAUDE.mdやプロジェクトコンテキストを含むすべてのリクエストが全額課金されます。

このツールはまた、セッションメモリを実装しており、Claude Codeが各ターンで完全な会話履歴を再送信するのを防ぎます。さらに、よりシンプルなクエリを安価なモデルにルーティングできるモデルルーターも含まれていますが、この機能は初期テスト期間中は有効ではありませんでした。

パフォーマンスとインストール

通常使用での4日間のテストでは:

  • 1,338件のリクエストを処理
  • Prefex使用時の実際のコスト:$49.60
  • Prefexなしの推定コスト:$348
  • 86%の節約を達成(キャッシュのみ、モデルルーティングなし)

開発者は、karpathy/nanoGPTでコールドスタートとウォームスタートの5つの質問を実行するベンチマークを提供しており、約$0.03のコストがかかります。コスト計算にはAnthropicの実際の課金フィールドを使用しています。

インストールには1つのcurlコマンドとsettings.jsonへの1行の追加が必要です。パッケージにはアンインストールスクリプトが含まれています。このツールは外部サーバーなしでローカルで動作し、テレメトリーはなく、APIキーは直接Anthropicに送信されます。

📖 Read the full source: r/ClaudeAI

Ad

👀 See Also

Lightning MLX: Apple Silicon向け高速ローカルAIエンジン、Qwen 35B-A3Bで220 tok/sを実現
Tools

Lightning MLX: Apple Silicon向け高速ローカルAIエンジン、Qwen 35B-A3Bで220 tok/sを実現

Lightning MLXは、Apple Silicon上で最速のローカルAI推論を実現し、コーディングエージェントやツール呼び出しに最適化されていると主張しています。ベンチマークでは、MacBook Max M5(128GB)でQwen3.6-27Bが40.67 tok/s、Qwen3.6-35B-A3Bが220.86 tok/sを記録しました。

OpenClawRadar
🦀
Tools

6つの役割、記憶、ADHD対応設計を備えたOpenClaw AIエージェント:日常業務の内訳

ADHDを持つ個人開発者が、6つの役割(アクションプランナー、デブリーファー、ライター、法務、調査、CRM)を持つオープンソースAIエージェントを構築。メモリを共有し、トランスクリプトからフォローアップやドラフトを自動生成する。

OpenClawRadar
OpenClaw拡張機能は、リクエストをAPIではなくClaude Code CLIを経由してルーティングします。
Tools

OpenClaw拡張機能は、リクエストをAPIではなくClaude Code CLIを経由してルーティングします。

OpenClaw拡張機能は、Claude CLIバイナリをサブプロセスとして起動し、Anthropic APIではなくClaude Code CLIを介してリクエストをルーティングします。これにより、最大プランの定額料金で完全なClaude Codeエクスペリエンスを提供します。

OpenClawRadar
yburn: 不要なAIエージェントのcronジョブを監査および置き換えるツール
Tools

yburn: 不要なAIエージェントのcronジョブを監査および置き換えるツール

yburnは、AIエージェントのcronジョブを監査し、LLMを必要としないものをスタンドアロンのPythonスクリプトに置き換えるPythonツールです。作成者は、98のcronジョブのうち58%が、システムヘルスチェックやGitバックアップのような純粋に機械的なタスクであることを発見しました。

OpenClawRadar