Snip: Open-Source-Tool reduziert Claude-Code-Tokenverbrauch mit YAML-Filtern

Snip ist ein Open-Source-Tool, geschrieben in Go, das die Claude-Code-Token-Nutzung um 60-90% reduziert, indem es Shell-Befehlsausgaben filtert, bevor sie das Kontextfenster erreichen. Inspiriert von rtk (Rust Token Killer), verfolgt es einen anderen Ansatz: Filter sind Daten (YAML-Dateien) und nicht kompilierter Code.
So funktioniert es
KI-Codierungsagenten verschwenden oft Token auf ausführliche Shell-Ausgaben. Zum Beispiel kann ein erfolgreicher go test Hunderte von Zeilen produzieren, die das LLM nicht benötigt, und git log gibt vollständige Metadaten aus, wo eine einzeilige Zusammenfassung ausreichen würde. Snip sitzt zwischen Claude Code und der Shell und filtert Ausgaben durch deklarative YAML-Pipelines.
Benchmark-Beispiel aus der Quelle:
- Vorher:
go test ./...→ 689 Token - Nachher: "10 bestanden, 0 fehlgeschlagen" → 16 Token (97,7% Reduktion)
Einrichtung und Verwendung
Die Einrichtung erfordert einen Befehl:
brew install edouard-claude/tap/snip
snip initDanach wird jeder Shell-Befehl, den Claude ausführt, durch snip geleitet.
Wichtige Unterschiede zu rtk
- Filter sind YAML-Dateien, die Sie in einen Ordner legen, nicht in den Binärcode kompilierter Rust-Code
- 16 kombinierbare Pipeline-Aktionen, darunter: Zeilen behalten/entfernen, Regex, JSON-Extraktion, Zustandsmaschine, group_by, dedup
- Benutzer können ihren eigenen Filter in 5 Minuten schreiben, ohne Go zu berühren
- Die Engine und die Filter entwickeln sich unabhängig voneinander
Kompatibilität
Snip funktioniert auch mit Cursor, Copilot, Gemini CLI, Aider, Windsurf und Cline.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Hypura: Speicher-Ebenen-bewusster LLM-Inferenz-Planer für Apple Silicon
Hypura ist ein auf Rust basierender Inferenz-Scheduler, der Modelltensoren über GPU-, RAM- und NVMe-Ebenen verteilt, um Modelle auszuführen, die den physischen Speicher auf Apple Silicon Macs übersteigen. Es ermöglicht die Ausführung eines 31 GB großen Mixtral 8x7B auf einem 32 GB Mac Mini mit 2,2 Tok/s und eines 40 GB großen Llama 70B mit 0,3 Tok/s, wo die Standardversion von llama.cpp abstürzt.

Ich habe OpenClaws Standard-Markdown-Speicher entfernt und stattdessen eine Node.js/Postgres-API-Schicht erstellt
Ein Entwickler deaktivierte das Memory-Core-Plugin von OpenClaw und erstellte ein typisiertes Node.js/Express + PostgreSQL-Backend. Die Kontextdrift sank auf null.

Claude Code Production Grade Plugin v3.0 veröffentlicht: Autonome Softwareentwicklungs-Pipeline
Production Grade Plugin v3.0 für Claude Code ist jetzt als freie Open-Source-Software unter MIT-Lizenz verfügbar. Das Plugin erstellt eine vollständige Entwicklungspipeline von den Anforderungen bis zur Bereitstellung mit 13 KI-Fähigkeiten, die als Ingenieurteam fungieren.

Claude-Design vs. Huashu-Design: Ein direkter Vergleich von HTML-Layouts und Ratenbegrenzungen
Claude Design erstellt HTML-Prototypen schnell, stößt aber schnell an die Ratenbegrenzung. Huashu-Design, ein Open-Source-Claude-Code-Skill, läuft mit dem normalen Abonnement ohne separate Ratenbegrenzung – braucht aber 20 Minuten statt 5.