agentcache: Python-Bibliothek für Multi-Agent-LLM-Präfix-Caching

✍️ OpenClawRadar📅 Veröffentlicht: 13. April 2026🔗 Source
agentcache: Python-Bibliothek für Multi-Agent-LLM-Präfix-Caching
Ad

agentcache ist eine Python-Bibliothek, die darauf ausgelegt ist, Multi-Agenten-LLM-Systeme durch die Implementierung von Präfix-Caching als Kernfunktion zu optimieren. Die Bibliothek behebt das häufige Problem, bei dem Frameworks wie CrewAI, AutoGen und open-multi-agent für jeden Worker neue Sitzungen erstellen, was zu null Cache-Treffern und doppelten Prompt-Kosten führt.

So funktioniert es

Die Bibliothek arbeitet mit einem Fork-basierten Ansatz anstelle der Erstellung separater Sitzungen:

  • Starte eine Sitzung mit einem gemeinsamen System-Prompt
  • Mache den ersten Aufruf – der Anbieter berechnet und speichert das Präfix zwischen
  • Wenn du N Worker benötigst, forke stattdessen, anstatt N neue Sitzungen zu erstellen
  • Eltern-Sitzung: [System, Nachricht1, Nachricht2, ...]
  • Geforkte Sitzung: [System, Nachricht1, Nachricht2, ..., WORKER_AUFGABE]
  • Exakt dasselbe Präfix = Cache-Treffer
Ad

Hauptmerkmale

  • Cache-sichere Forks: Behält identische Präfixe über Worker-Sitzungen hinweg bei
  • Cache-Bruch-Erkennung: Vergleicht Snapshots und meldet genau, was sich geändert hat, wenn die Cache-Trefferquote sinkt
  • Cache-sichere Komprimierung: Für lang laufende Sitzungen werden vor jedem Aufruf alte Tool-Ausgaben gescannt und große Ergebnisse durch deterministische Platzhalter ersetzt, um einen kleineren Kontext bei gleichbleibenden cachefähigen Präfixen zu erhalten
  • Parameter-Einfrieren: Friert cache-relevante Parameter vor dem Forken ein (System-Prompt, Modell, Tools, Nachrichten, Reasoning-Konfiguration)
  • Task-DAG-Planung: Ermöglicht parallele Worker aus einer zwischengespeicherten Sitzung

Leistungsergebnisse

In einem direkten Vergleichstest mit GPT-4o-mini (Koordinator + 3 Worker, gleiche Aufgabe):

  • Text-Injektion / separate Sitzungen: 0 % Cache-Treffer, 85,7 Sekunden
  • Präfix-Forks: 75,8 % Cache-Treffer, 37,4 Sekunden
  • Die Cache-Trefferquoten pro Worker liegen typischerweise zwischen 80–99 %

Installation und Verwendung

Installation über pip:

pip install "git+https://github.com/masteragentcoder/agentcache.git@main"

Die Bibliothek ist auf GitHub unter github.com/masteragentcoder/agentcache verfügbar.

📖 Read the full source: r/LocalLLaMA

Ad

👀 Siehe auch

DeepClaude ersetzt das Anthropic-Backend von Claude Code durch DeepSeek V4 Pro zu 17-fach niedrigeren Kosten
Werkzeuge

DeepClaude ersetzt das Anthropic-Backend von Claude Code durch DeepSeek V4 Pro zu 17-fach niedrigeren Kosten

Ein Skript, das die Umgebungsvariablen von Claude Code umschreibt, sodass alle Agentenloop-Aufrufe über DeepSeek V4 Pro, OpenRouter oder Fireworks AI laufen – gleiche UX, 0,87 $/M Output-Tokens statt 15 $/M.

OpenClawRadar
Reseed CLI: Extrahiere Designsysteme aus beliebigen Websites für Claude Code und Cursor
Werkzeuge

Reseed CLI: Extrahiere Designsysteme aus beliebigen Websites für Claude Code und Cursor

Reseed ist ein CLI-Tool, das Design-Tokens (Farben, Abstände, Schriftgrößen, Radien) aus jeder Website extrahiert und eine tailwind.config.ts, design-system.md sowie eine Referenz-HTML für Claude Code und Cursor generiert.

OpenClawRadar
OpenClaw-Fähigkeit reduziert Agentenübergaben durch Ermöglichung der Selbstausführung
Werkzeuge

OpenClaw-Fähigkeit reduziert Agentenübergaben durch Ermöglichung der Selbstausführung

Eine neue Fähigkeit für OpenClaw-Agenten adressiert das häufige Problem, bei dem Agenten den nächsten Schritt identifizieren, aber bei 'Hier ist, was als Nächstes zu tun ist' stoppen und eine menschliche Übergabe erfordern. Die Fähigkeit ermöglicht es Agenten, bestimmte Aktionen selbst auszuführen, wie Registrieren, Posten, Antworten und Unterschreiben.

OpenClawRadar
Spore Agent Arena: Wettbewerbsplattform für KI-Agenten-Tests sucht Testteilnehmer
Werkzeuge

Spore Agent Arena: Wettbewerbsplattform für KI-Agenten-Tests sucht Testteilnehmer

Die Arena-Funktion von Spore Agent ermöglicht es KI-Agenten, in 36 verschiedenen Spieltypen anzutreten, darunter Code-Debugging, Mathe-Rätsel und Systemdesign-Herausforderungen. Die Plattform hat derzeit 42 laufende Herausforderungen, 15 registrierte Agenten und bietet Cog-Tokens als Belohnungen an.

OpenClawRadar