Skillware fügt prompt_rewriter für deterministische Token-Kompression in Claude API-Agenten-Schleifen hinzu

Skillware hat eine prompt_rewriter-Funktion hinzugefügt, die Claude-API-Kosten in agentenbasierten Schleifen reduziert, indem Prompts vor dem Senden an das LLM komprimiert werden. Die Middleware verwendet heuristische Komprimierung, um die Token-Nutzung um 50-80% zu senken, während deterministisches Verhalten über Iterationen hinweg beibehalten wird.
Wie es funktioniert
Das Tool fungiert als Middleware, die zwischen Ihrem Agenten und der Claude-API sitzt. Es wendet eine aggressive Komprimierung auf Prompts an, bevor sie an das LLM gesendet werden, und stellt sicher, dass Sie nur für das Signal und nicht für das Rauschen bezahlen. Da die Komprimierung deterministisch ist, bleibt das Agentenverhalten über Schleifen hinweg stabil.
Komprimierungsstufen
- Niedrig: Normalisiert Leerzeichen
- Mittel: Entfernt Gesprächsfüller (bitte, stellen Sie sicher, usw.)
- Hoch: Entfernt aggressiv Stoppwörter und nicht wesentliche Satzzeichen
Das Tool adressiert das Problem explodierender Kosten in iterativen Agentenschleifen, bei denen massive Kontextfenster zu massiven Rechnungen führen. Es ist Open-Source und auf GitHub verfügbar, wobei der Entwickler nach weiteren Funktionen, Feedback, Ideen und Beiträgen sucht.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Claude Code im großen Maßstab: Wie agentische Suche RAG-Fehlermodi in großen Codebasen vermeidet
Claude Code nutzt agentisches Dateisystem-Traversal anstelle von embeddingsbasiertem RAG und vermeidet so Probleme mit veralteten Indizes. Der Artikel beschreibt fünf Erweiterungspunkte (CLAUDE.md, Hooks, Skills, Plugins, MCP) und die Harness-as-Model-Philosophie für Repos mit mehreren Millionen Zeilen.

AutoAgents Rust-Framework fügt Python-Bindings für Prototyping hinzu
AutoAgents, ein auf Rust basierendes Multi-Agenten-Framework, verfügt nun über Python-Bindings, die es Entwicklern ermöglichen, in Python zu prototypisieren, während die gleiche Rust-Kernlaufzeit, Provider-Schnittstellen, Pipeline-Modell und Agenten-Semantik beibehalten werden. Die Bindings ermöglichen Experimente mit lokalen KI-Modellen ohne externe Systeme.

OpenClaw PARA-Fähigkeit organisiert Dateien automatisch nach Tiago Fortes Methode
Ein Entwickler hat eine OpenClaw-Fähigkeit erstellt, die die PARA-Methode (Projekte, Bereiche, Ressourcen, Archive) für die automatische Dateiorganisation durchsetzt und Dateien aus einem unordentlichen Stammverzeichnis in strukturierte Ordner verschiebt.

mcp-india-stack: Open-Source-MCP-Server für indische Finanz-APIs
mcp-india-stack ist ein Open-Source-MCP-Server, der Claude direkten Zugriff auf sieben indische Finanz- und Regierungs-API-Tools bietet, einschließlich GSTIN-Validierung, IFSC-Abfrage und PAN-Validierung. Er benötigt keine Authentifizierung, arbeitet offline-first und ist über pip install verfügbar.