Snip: Open-Source-Tool reduziert Claude-Code-Tokenverbrauch mit YAML-Filtern

✍️ OpenClawRadar📅 Veröffentlicht: 15. April 2026🔗 Source
Snip: Open-Source-Tool reduziert Claude-Code-Tokenverbrauch mit YAML-Filtern
Ad

Snip ist ein Open-Source-Tool, geschrieben in Go, das die Claude-Code-Token-Nutzung um 60-90% reduziert, indem es Shell-Befehlsausgaben filtert, bevor sie das Kontextfenster erreichen. Inspiriert von rtk (Rust Token Killer), verfolgt es einen anderen Ansatz: Filter sind Daten (YAML-Dateien) und nicht kompilierter Code.

So funktioniert es

KI-Codierungsagenten verschwenden oft Token auf ausführliche Shell-Ausgaben. Zum Beispiel kann ein erfolgreicher go test Hunderte von Zeilen produzieren, die das LLM nicht benötigt, und git log gibt vollständige Metadaten aus, wo eine einzeilige Zusammenfassung ausreichen würde. Snip sitzt zwischen Claude Code und der Shell und filtert Ausgaben durch deklarative YAML-Pipelines.

Benchmark-Beispiel aus der Quelle:

  • Vorher: go test ./... → 689 Token
  • Nachher: "10 bestanden, 0 fehlgeschlagen" → 16 Token (97,7% Reduktion)
Ad

Einrichtung und Verwendung

Die Einrichtung erfordert einen Befehl:

brew install edouard-claude/tap/snip
snip init

Danach wird jeder Shell-Befehl, den Claude ausführt, durch snip geleitet.

Wichtige Unterschiede zu rtk

  • Filter sind YAML-Dateien, die Sie in einen Ordner legen, nicht in den Binärcode kompilierter Rust-Code
  • 16 kombinierbare Pipeline-Aktionen, darunter: Zeilen behalten/entfernen, Regex, JSON-Extraktion, Zustandsmaschine, group_by, dedup
  • Benutzer können ihren eigenen Filter in 5 Minuten schreiben, ohne Go zu berühren
  • Die Engine und die Filter entwickeln sich unabhängig voneinander

Kompatibilität

Snip funktioniert auch mit Cursor, Copilot, Gemini CLI, Aider, Windsurf und Cline.

📖 Read the full source: r/ClaudeAI

Ad

👀 Siehe auch

Hypura: Speicher-Ebenen-bewusster LLM-Inferenz-Planer für Apple Silicon
Werkzeuge

Hypura: Speicher-Ebenen-bewusster LLM-Inferenz-Planer für Apple Silicon

Hypura ist ein auf Rust basierender Inferenz-Scheduler, der Modelltensoren über GPU-, RAM- und NVMe-Ebenen verteilt, um Modelle auszuführen, die den physischen Speicher auf Apple Silicon Macs übersteigen. Es ermöglicht die Ausführung eines 31 GB großen Mixtral 8x7B auf einem 32 GB Mac Mini mit 2,2 Tok/s und eines 40 GB großen Llama 70B mit 0,3 Tok/s, wo die Standardversion von llama.cpp abstürzt.

OpenClawRadar
Ich habe OpenClaws Standard-Markdown-Speicher entfernt und stattdessen eine Node.js/Postgres-API-Schicht erstellt
Werkzeuge

Ich habe OpenClaws Standard-Markdown-Speicher entfernt und stattdessen eine Node.js/Postgres-API-Schicht erstellt

Ein Entwickler deaktivierte das Memory-Core-Plugin von OpenClaw und erstellte ein typisiertes Node.js/Express + PostgreSQL-Backend. Die Kontextdrift sank auf null.

OpenClawRadar
Claude Code Production Grade Plugin v3.0 veröffentlicht: Autonome Softwareentwicklungs-Pipeline
Werkzeuge

Claude Code Production Grade Plugin v3.0 veröffentlicht: Autonome Softwareentwicklungs-Pipeline

Production Grade Plugin v3.0 für Claude Code ist jetzt als freie Open-Source-Software unter MIT-Lizenz verfügbar. Das Plugin erstellt eine vollständige Entwicklungspipeline von den Anforderungen bis zur Bereitstellung mit 13 KI-Fähigkeiten, die als Ingenieurteam fungieren.

OpenClawRadar
Claude-Design vs. Huashu-Design: Ein direkter Vergleich von HTML-Layouts und Ratenbegrenzungen
Werkzeuge

Claude-Design vs. Huashu-Design: Ein direkter Vergleich von HTML-Layouts und Ratenbegrenzungen

Claude Design erstellt HTML-Prototypen schnell, stößt aber schnell an die Ratenbegrenzung. Huashu-Design, ein Open-Source-Claude-Code-Skill, läuft mit dem normalen Abonnement ohne separate Ratenbegrenzung – braucht aber 20 Minuten statt 5.

OpenClawRadar