AgentCache: マルチエージェントLLM向けPythonライブラリ

agentcacheは、接頭辞キャッシュを中核機能として実装することで、マルチエージェントLLMシステムを最適化するために設計されたPythonライブラリです。このライブラリは、CrewAI、AutoGen、open-multi-agentなどのフレームワークが各ワーカーに対して新しいセッションを作成し、キャッシュヒットがゼロでプロンプトコストが重複するという一般的な問題に対処します。

仕組み

このライブラリは、別々のセッションを作成する代わりに、フォークベースのアプローチで動作します：

共有システムプロンプトで1つのセッションを開始
最初の呼び出しを行う - プロバイダーが接頭辞を計算してキャッシュ
N個のワーカーが必要な場合、N個の新しいセッションを作成する代わりにフォーク
親セッション：[システム、メッセージ1、メッセージ2、...]
フォークされたセッション：[システム、メッセージ1、メッセージ2、...、ワーカータスク]
完全に同じ接頭辞 = キャッシュヒット

主な機能

キャッシュセーフなフォーク：ワーカーセッション間で同一の接頭辞を維持
キャッシュブレーク検出：スナップショットを差分比較し、キャッシュヒット率が低下したときに正確に何が変更されたかを報告
キャッシュセーフな圧縮：長時間実行されるセッションでは、各呼び出し前に古いツール出力をスキャンし、大きな結果を決定論的なプレースホルダーに置き換えて、より小さなコンテキストを維持しながらキャッシュ可能な接頭辞を保存
パラメータ凍結：フォーク前にキャッシュ関連パラメータを凍結（システムプロンプト、モデル、ツール、メッセージ、推論設定）
タスクDAGスケジューリング：1つのキャッシュされたセッションから並列ワーカーを可能にする

パフォーマンス結果

GPT-4o-miniでの直接比較テスト（コーディネーター + 3ワーカー、同じタスク）：

テキストインジェクション / 別々のセッション：0%キャッシュヒット、85.7秒
接頭辞フォーク：75.8%キャッシュヒット、37.4秒
ワーカーごとのキャッシュヒット率は通常80-99%の範囲

インストールと使用方法

pipでインストール：

pip install "git+https://github.com/masteragentcoder/agentcache.git@main"

このライブラリはGitHubのgithub.com/masteragentcoder/agentcacheで利用可能です。

📖 Read the full source: r/LocalLLaMA

agentcache: マルチエージェントLLMプレフィックスキャッシュのためのPythonライブラリ

仕組み

主な機能

パフォーマンス結果

インストールと使用方法

👀 See Also

ClawControl v1.7.1は、OpenClawクライアントにおける日常的な使用上の問題を修正します。

ClawControl 1.7.1は、OpenClawのメッセージ信頼性とメディアサポートを向上させます。

InsForge：AIコーディングエージェント向けMCP統合セルフホストPostgresバックエンド

SeeFlow: ライブアプリに接続されたアーキテクチャ図