Token Master: Architekturkonzept zur Einsparung von 30-70% bei KI-Agenten-Kosten

Ein Community-Mitglied hat Token Master vorgeschlagen — ein detailliertes Architekturkonzept fuer intelligentes Multi-Modell-Routing, das die Kosten fuer KI-Agenten um 30-70% reduzieren koennte.
Die Kernerkenntnis
Kernprinzip: Modelle als austauschbare zustandslose Worker behandeln, nicht als persistente Gespraechspartner.
Architekturkomponenten
- Gemeinsame Zustandsschicht — Code-Repo, Aufgabengraph, Vektorspeicher, strukturierte Zusammenfassungen
- Policy Engine — Verfolgt Ausgaben, Ratenlimits, Latenz; waehlt Modell pro Aufgabe
- Modell-Pool — High-End (GPT/Claude), Mittelklasse (Mixtral/Qwen), guenstige Masse (kleine Open-Source-Modelle)
- Validierungsstufe — Tests, Metriken, optionales Kritikmodell
Warum es funktioniert
Typisches Muster: 60-80% der Aufgaben sind von Mittelklasse-Modellen loesbar, 10-20% brauchen Premium-Modelle, 5-10% erfordern Wiederholungen. Bei angemessenem Routing sinken die Kosten erheblich.
📖 Vollständige Quelle lesen: r/openclaw
👀 Siehe auch

Workaround für das Mikrofon-Feedback-Loop-Problem in der Claude Mobile App
Ein Reddit-Benutzer teilt eine funktionierende Lösung für den Mikrofon-Feedback-Fehler in der Claude-Mobil-App: die Installation der Web-Version als eigenständige Progressive Web App über Google Chrome, die das Problem umgeht und Zugriff auf verschiedene Claude-Modelle bietet.

Workaround für Control UI-Assets-Fehler nach OpenClaw 2026.3.22-Upgrade
Ein Benutzer hat eine Lösung für den 'Control UI assets not found'-Fehler gepostet, der nach dem Upgrade auf OpenClaw 2026.3.22 auftritt. Dabei wird der control-ui-Ordner von einer Beta-Installation in die stabile Version kopiert.

5 Muster für bessere Ergebnisse mit Claude (für nicht-technische Nutzer)
Praktische Gerüste, beispielbasiertes Prompting, negative Anweisungen, persistenter Kontext und Quellenverankerung – fünf Muster, die die Ausgabequalität von Claude konsequent verbessern, gestützt auf sechs Monate Felderfahrung.

7 MCP Gateway Bugs: Session-Leaks, totes SSE und OAuth im Gateway-Modus
Ein Reddit-Beitrag beschreibt sieben reale MCP-Gateway-Bugs – Sitzungszustand, der zwischen Clients ausläuft, stille SSE-Trennungen, OAuth-Fehler im Gateway-Modus und mehr – mit Lösungen basierend auf langweiliger Infrastruktur, nicht auf besseren Prompts.