agentcache: Python-Bibliothek für Multi-Agent-LLM-Präfix-Caching

agentcache ist eine Python-Bibliothek, die darauf ausgelegt ist, Multi-Agenten-LLM-Systeme durch die Implementierung von Präfix-Caching als Kernfunktion zu optimieren. Die Bibliothek behebt das häufige Problem, bei dem Frameworks wie CrewAI, AutoGen und open-multi-agent für jeden Worker neue Sitzungen erstellen, was zu null Cache-Treffern und doppelten Prompt-Kosten führt.
So funktioniert es
Die Bibliothek arbeitet mit einem Fork-basierten Ansatz anstelle der Erstellung separater Sitzungen:
- Starte eine Sitzung mit einem gemeinsamen System-Prompt
- Mache den ersten Aufruf – der Anbieter berechnet und speichert das Präfix zwischen
- Wenn du N Worker benötigst, forke stattdessen, anstatt N neue Sitzungen zu erstellen
- Eltern-Sitzung: [System, Nachricht1, Nachricht2, ...]
- Geforkte Sitzung: [System, Nachricht1, Nachricht2, ..., WORKER_AUFGABE]
- Exakt dasselbe Präfix = Cache-Treffer
Hauptmerkmale
- Cache-sichere Forks: Behält identische Präfixe über Worker-Sitzungen hinweg bei
- Cache-Bruch-Erkennung: Vergleicht Snapshots und meldet genau, was sich geändert hat, wenn die Cache-Trefferquote sinkt
- Cache-sichere Komprimierung: Für lang laufende Sitzungen werden vor jedem Aufruf alte Tool-Ausgaben gescannt und große Ergebnisse durch deterministische Platzhalter ersetzt, um einen kleineren Kontext bei gleichbleibenden cachefähigen Präfixen zu erhalten
- Parameter-Einfrieren: Friert cache-relevante Parameter vor dem Forken ein (System-Prompt, Modell, Tools, Nachrichten, Reasoning-Konfiguration)
- Task-DAG-Planung: Ermöglicht parallele Worker aus einer zwischengespeicherten Sitzung
Leistungsergebnisse
In einem direkten Vergleichstest mit GPT-4o-mini (Koordinator + 3 Worker, gleiche Aufgabe):
- Text-Injektion / separate Sitzungen: 0 % Cache-Treffer, 85,7 Sekunden
- Präfix-Forks: 75,8 % Cache-Treffer, 37,4 Sekunden
- Die Cache-Trefferquoten pro Worker liegen typischerweise zwischen 80–99 %
Installation und Verwendung
Installation über pip:
pip install "git+https://github.com/masteragentcoder/agentcache.git@main"
Die Bibliothek ist auf GitHub unter github.com/masteragentcoder/agentcache verfügbar.
📖 Read the full source: r/LocalLLaMA
👀 Siehe auch

DeepClaude ersetzt das Anthropic-Backend von Claude Code durch DeepSeek V4 Pro zu 17-fach niedrigeren Kosten
Ein Skript, das die Umgebungsvariablen von Claude Code umschreibt, sodass alle Agentenloop-Aufrufe über DeepSeek V4 Pro, OpenRouter oder Fireworks AI laufen – gleiche UX, 0,87 $/M Output-Tokens statt 15 $/M.

Reseed CLI: Extrahiere Designsysteme aus beliebigen Websites für Claude Code und Cursor
Reseed ist ein CLI-Tool, das Design-Tokens (Farben, Abstände, Schriftgrößen, Radien) aus jeder Website extrahiert und eine tailwind.config.ts, design-system.md sowie eine Referenz-HTML für Claude Code und Cursor generiert.

OpenClaw-Fähigkeit reduziert Agentenübergaben durch Ermöglichung der Selbstausführung
Eine neue Fähigkeit für OpenClaw-Agenten adressiert das häufige Problem, bei dem Agenten den nächsten Schritt identifizieren, aber bei 'Hier ist, was als Nächstes zu tun ist' stoppen und eine menschliche Übergabe erfordern. Die Fähigkeit ermöglicht es Agenten, bestimmte Aktionen selbst auszuführen, wie Registrieren, Posten, Antworten und Unterschreiben.

Spore Agent Arena: Wettbewerbsplattform für KI-Agenten-Tests sucht Testteilnehmer
Die Arena-Funktion von Spore Agent ermöglicht es KI-Agenten, in 36 verschiedenen Spieltypen anzutreten, darunter Code-Debugging, Mathe-Rätsel und Systemdesign-Herausforderungen. Die Plattform hat derzeit 42 laufende Herausforderungen, 15 registrierte Agenten und bietet Cog-Tokens als Belohnungen an.