Der TOON MCP-Server reduziert Tool-Ergebnis-Tokens um 30–60 % in OpenClaw.

Ein MCP-Server wurde veröffentlicht, der strukturierte JSON-Tool-Ergebnisse automatisch in das TOON-Format komprimiert, eine token-effiziente Darstellung, die den Token-Verbrauch für tabellarische Daten in OpenClaw-Sitzungen um 30-60% reduzieren soll.
Wie es funktioniert
TOON ist ein Format für die token-effiziente Darstellung von LLM-Daten, das Feldnamen nur einmal deklariert, Einrückungen anstelle von Klammern verwendet und auf redundante Anführungszeichen verzichtet. Der MCP-Server vergleicht die Token-Anzahl zwischen TOON und kompaktem JSON und gibt das kleinere zurück.
Einrichtung
Fügen Sie den MCP-Server Ihrer OpenClaw-Konfiguration hinzu (~/.openclaw/openclaw.json):
{
"mcpServers": {
"toon": {
"command": "npx",
"args": ["@fiialkod/toon-mcp-server"]
}
}
}
Fügen Sie eine Regel zu Ihrer AGENTS.md hinzu: Wenn ein Tool strukturierte JSON-Daten zurückgibt (Arrays von Objekten, API-Antworten, Datenbankergebnisse, Protokolle), die größer als ~20 Felder sind, leiten Sie das Ergebnis vor der Verarbeitung durch das Tool toon_format_response.
Leistung
Für tabellarische Daten (Arrays einheitlicher Objekte, E-Mails, Kalenderereignisse, Suchergebnisse, Protokolle, DB-Zeilen) ist TOON typischerweise um 30-60% effizienter. Für kleine Nutzdaten oder tief verschachtelte Konfigurationen greift es auf kompaktes JSON zurück.
Benchmark mit 15 Finanztransaktionen und 15 Fragen:
- JSON: 14/15 korrekt (93,3%), ~749 Token verwendet
- TOON: 14/15 korrekt (93,3%), ~398 Token verwendet
Gleiche Genauigkeit mit 47% weniger Token. Die Fehler betrafen verschiedene Fragen und wurden nicht durch das Format verursacht. TOON war in Tests verlustfrei – decode(encode(data)) === data.
Anwendungsfälle
Am besten geeignet für: Gmail/Kalender-MCP-Ergebnisse, Datenbankabfragen, API-Antworten, Dateilisten, Protokolle – alles, was ein Array von Objekten mit wiederholten Schlüsseln ist.
Nicht erforderlich für: Kleine Nutzdaten (<5 Einträge), tief verschachtelte Konfigurationen, Daten, die als rohes JSON zurückgegeben werden müssen.
Problem, das es löst
Systemprompts und Tool-Schemata haben hohe Fixkosten in OpenClaw, Arbeitsbereichsdateien sind halb-fest, aber Tool-Ergebnisse häufen sich schnell an. Wenn Agenten Dateien lesen, APIs abfragen oder browsen, führt dies dazu, dass Sitzungen in die Komprimierung geraten, bei der Kontext verloren geht. TOON wirkt vorgelagert, indem es Tool-Ergebnisse verkleinert, bevor sie in das Transkript gelangen, die Komprimierung verzögert und mehr Sitzungsverlauf intakt hält.
📖 Read the full source: r/openclaw
👀 Siehe auch

Multi-Modell-Rat-Workflow für KI-Codierungsagenten
Ein Entwickler hat ein webbasiertes Tool erstellt, das Codieraufgaben durch drei KI-Modelle laufen lässt – GPT-4o als Architekt, Claude als Skeptiker und Gemini als Synthetisierer – bevor sie an Coding-Agenten weitergegeben werden. Das Tool generiert eine PLAN.md mit expliziten Einschränkungen und erfordert, dass Nutzer ihre eigenen API-Schlüssel mitbringen.

WeAreHere Browser-Erweiterung und MCP-Tools scannen Website-Datenschutzpraktiken
Zwei Open-Source-Tools – barebrowse und wearehere – durchsuchen Websites nach Trackern, Fingerprinting und Verbindungen zu Datenbrokern. Die wearehere-Browsererweiterung zeigt in Echtzeit Datenschutzwerte (0-100) während des Surfens an, während MCP-Server es KI-Assistenten ermöglichen, jede Website auf Befehl zu bewerten.

Phantom: Ein beständiger KI-Agent, erstellt mit Claude's Agent SDK
Phantom ist ein Open-Source-Bun/TypeScript-Prozess, der Claude's Agent SDK (Opus 4.6) mit persistenter Vektorspeicherung, einer Selbstentwicklungs-Engine und einer MCP-Server-Schnittstelle umhüllt. Es läuft kontinuierlich auf seiner eigenen VM oder Docker Compose und kommuniziert über Slack.

Steelman R5: Feinabgestimmtes 14B-Modell übertrifft Claude Opus bei der Ada-Codegenerierung
Ein Entwickler hat Qwen2.5-Coder-14B-Instruct mithilfe von QLoRA auf einem kompilierverifizierten Datensatz von 3.430 Ada/SPARK-Instruktionspaaren feinabgestimmt und erreichte eine Kompilierungsrate von 68,6 % in einem benutzerdefinierten Benchmark im Vergleich zu Claude Opus 4.6 mit 42,1 %. Das Modell ist über Ollama verfügbar und benötigt 12 GB VRAM.