Claude Code Limiter: Selbst gehosteter Ratenbegrenzer für geteilte Claude Code-Abonnements

Was es löst
Wenn mehrere Entwickler ein Claude Code Max Abonnement ohne Nutzungskontrollen teilen, kann ein einzelner Benutzer die Ratenbegrenzungen von Anthropic erschöpfen, indem er zu viele Anfragen sendet (z.B. 50 Anfragen pro Stunde), was alle anderen für den Tag aussperrt. Es gibt keine eingebaute Möglichkeit, dies zu verhindern.
Funktionen
- Pro-Modell-Quoten — z.B. opus: 5/Tag, sonnet: 25/Tag, haiku: 50/Tag pro Benutzer
- Kreditbudgets — Einzelnes tägliches Budget über alle Modelle hinweg (opus = 10 Credits, sonnet = 3, haiku = 1). Benutzer entscheiden, wie sie es ausgeben.
- Gleitende 24-Stunden-Fenster — Kein Ausnutzen von Mitternacht-Resets
- Tageszeitregeln — Teure Modelle auf Arbeitszeiten beschränken
- Echtzeit-Dashboard — Live-Nutzungsfeed, pro-Benutzer-Aufschlüsselungen, Nutzungsdiagramme
- Notausschalter — Sofortiger Zugriffsentzug und erzwungene Abmeldung eines Benutzers, remote
- Manipulationssicher — 6 Sicherheitsebenen inklusive managed-settings.json-Erzwingung, Dateiberechtigungen, Integritätsprüfungs-Watchdog und serverseitiger Verfolgung
Wie es funktioniert
Einrichtung:
- Server selbst hosten — Einzelner Docker-Befehl auf jedem VPS, Cloud oder Ihrem Netzwerk
- Benutzer im Dashboard hinzufügen — Namen, Limits, Kreditbudget festlegen → Installationscode erhalten
- Auf jedem Rechner installieren —
sudo npx @howincodes/claude-code-limiter setup --code CLM-xxx --server https://your-server - Fertig — Der Hook prüft Limits bei jeder Anfrage über Claude Codes managed-settings.json (höchste Prioritätskonfiguration, kann nicht von Benutzern überschrieben werden)
Benutzererfahrung: Wenn ein Benutzer sein Limit überschreitet, sieht er: "Tägliches Opus-Limit erreicht. Heute 5/5 Anfragen verwendet. Gesamtnutzung heute: opus: 5/5 (0 übrig) sonnet: 12/25 (13 übrig) haiku: 3/50 (47 übrig) Kreditguthaben: 15/100 Wechseln Sie zu einem anderen Modell oder versuchen Sie es später erneut."
Technische Details
- Client-Hook: Keine npm-Abhängigkeiten, nur Node.js-Built-ins. Installiert in managed-settings.json mit
allowManagedHooksOnly: true, sodass Benutzer keine Umgehungshooks hinzufügen können. - Server: Express + SQLite + Vanilla JS Dashboard. Einzelner Docker-Container, einzelner Volume-Mount.
- Offline-fähig: Hook speichert Limits lokal zwischen, funktioniert bei nicht erreichbarem Server, synchronisiert bei wiederhergestellter Verbindung.
- Fail-closed: Wenn jemand die Konfigurationsdateien löscht, werden alle Anfragen blockiert (nicht erlaubt).
Links
- GitHub: github.com/howincodes/claude-code-limiter
- npm (client): @howincodes/claude-code-limiter
- npm (server): @howincodes/claude-code-limiter-server
- Docker: ghcr.io/howincodes/claude-code-limiter:latest
Open Source. Selbst hostbar. MIT-Lizenz.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Stanford-Forscher veröffentlichen OpenJarvis: Ein lokales Framework für KI-Agenten auf dem Gerät
Stanford-Forscher haben OpenJarvis veröffentlicht, ein lokal-first Framework zum Erstellen von On-Device persönlichen KI-Agenten mit Werkzeugen, Gedächtnis und Lernfähigkeiten. Das Projekt umfasst GitHub-Repository- und Website-Links für Entwickler zur Erkundung.

CAL: Open-Source Kontextoptimierungsschicht für LLM-Agenten
CAL (Context Assembly Layer) ist eine Python-Bibliothek, die die Claude-API-Token-Nutzung durch intelligente Kontextauswahl und -komprimierung um 83% reduziert. Sie ist über pip install verfügbar und unter MIT-Lizenz lizenziert.

Selbstgehostete Speicherschicht für Claude läuft kostenlos auf Cloudflare
Ein Cloudflare Worker MCP Server ermöglicht Claude, Notizen zu merken und per semantischer Suche abzurufen, basierend auf Workers AI und Vectorize – alles in der kostenlosen Stufe.

Claude Code-Benutzer entwickelt NVM-Plugin zur Erfassung von Problemlösungskontext
Ein Entwickler hat ein Claude-Plugin namens nvm (non-volatile memory) erstellt, das den Claude-Sitzungsverlauf in Markdown-Karten umwandelt, die Problemlösungsentscheidungen und wiederverwendbare Erkenntnisse dokumentieren. Das Tool behebt das Problem, den Überblick darüber zu verlieren, wie Probleme gelöst wurden, wenn man KI-Codierungsassistenten nutzt.