Project Headroom: Open-Source-Tool senkt KI-Token-Kosten um 90%

Netflix-Senioringenieur Tejas Chopra hat Project Headroom als Open Source veröffentlicht, einen lokalen Proxy, der die Kontextfenster-Eingabe komprimiert, bevor sie das LLM erreicht. Ersten Schätzungen zufolge sind bis zu 90% der Token redundant — und seit Januar 2026 hat das Tool den Nutzern insgesamt 700.000 US-Dollar bei 200 Milliarden Token gespart.

So funktioniert es

Headroom läuft als Proxy auf Port 8787 auf dem Entwicklerrechner. Sie umschließen Ihr LLM-CLI mit dem Befehl headroom wrap, z.B.:

headroom wrap codex

Es analysiert alle Eingaben – Gesprächsverlauf, Logs, Toolausgaben, Dateien, RAG-Chunks – und wendet eine verlustfreie, reversible Komprimierung an. Am besten reduziert es:

Server-Logs: 90% werden verworfen
MCP-Toolausgaben: 70% redundantes JSON
Datenbankausgaben: sich wiederholende Schemata
Dateibäume: wiederholte Metadaten

Headroom ist in Python und Node entwickelt, die aktuelle Version ist v0.22 mit 2.000 GitHub-Sternen und 120 Forks.

Warum es wichtig ist

Chopra wurde von einer 287-Dollar-Claude-Sonnet-Rechnung für routinemäßiges Debugging und Refactoring inspiriert. Er fand heraus, dass der Übeltäter nicht seine Anweisungen waren – es waren Boilerplate, JSON-Schemata und Maschinenmetadaten. „Das ist keine Prosa. Das ist kein kreatives Schreiben. Das sind komprimierbare Daten, die sich als Text tarnen“, schrieb er.

Standardmäßig beträgt die TTL des Claude-Präfix-Cache nur fünf Minuten; bei Inaktivität wird der gesamte Kontext aktualisiert. Sie können eine längere TTL einstellen, zahlen dann aber das Doppelte für Schreibvorgänge, um 90% bei Lesevorgängen zu sparen. Headroom umgeht diese Kompromisse.

Alternativen

Es gibt andere Tools: RTK (Rust Token Killer) kürzt ausführliche Befehlsausgaben, und LeanCTX ist eine Variante. Kommerzielle Optionen wie Token Company (von Y Combinator finanziert) bieten Compression-as-a-Service. Aber Headrooms Hauptmerkmal ist die reversible Komprimierung und der Verbleib im Workflow des Entwicklers.

📖 Vollständige Quelle lesen: HN AI Agents

Project Headroom: Open-Source-Tool eines Netflix-Ingenieurs senkt KI-Token-Kosten um 90%

So funktioniert es

Warum es wichtig ist

Alternativen

👀 Siehe auch

3D-gedrucktes Clawd-Maskottchen mit ESP32-betriebenem Mochi-Bot

Agent MCP Studio: Bauen Sie Multi-Agent-MCP-Systeme vollständig in einem Browser über WASM

Allgemeine Bots: Open-Source-KI-Agenten-Plattform für selbst gehostete Unternehmensautomatisierung

Swarm Orchestra v2-Plugin fügt Inter-Agenten-Nachrichtenübertragung hinzu, um das Chaos im Claude-Code-Agenten-Team zu beheben