ClawProxy: Selbst gehosteter KI-Routing-Proxy zum Rotieren von Free-Tier-API-Schlüsseln

ClawProxy ist ein selbst gehosteter KI-Routing-Proxy, der Entwicklern helfen soll, professionelle KI-Setups mit einer monatlichen Rechnung von 0 US-Dollar zu betreiben, indem er Free-Tier-Kontingente durch Multithreading nutzt. Er fungiert als Vermittler zwischen Tools wie OpenClaw, Cursor und OpenCode und KI-Anbietern und übernimmt im Hintergrund Schlüsselrotation und Load Balancing.
Hauptfunktionen
Der Proxy umfasst mehrere spezifische Funktionen zur Bewältigung der Einschränkungen im Free-Tier:
- In-Flight-Schlüsselrotation & Load Balancing: ClawProxy wartet nicht einfach auf 429-Fehler. Wenn ein Anbieter überlastet ist, Zeitüberschreitungen auftreten oder Fehler vorliegen, tauscht der Proxy den Schlüssel während des laufenden Betriebs aus. Er verwendet gewichtetes Load Balancing, bei dem Sie Ihren Schlüsseln „Gewichte“ zuweisen, um die Last auf verfügbare Kontingente zu verteilen, und gewichtetes Round-Robin, um sicherzustellen, dass kein einzelner Schlüssel übermäßig belastet wird.
- Robuste Anbieter-Fallback-Lösung: Wenn Free-Anbieter ausgelastet sind, verlagert ClawProxy die Last automatisch. Er übersetzt Modellnamen innerhalb desselben Formats – wenn Ihr bevorzugter Gemini-3.1-Flash-Endpunkt ausfällt, kann er auf einen anderen funktionierenden Anbieter mit demselben Modell oder kompatiblen Alternativen wie GLM 5 oder Kimi K2.5 umschalten. Er unterstützt auch benutzerdefinierte Endpunkte für Perplexity, um KI-Websuche-Traffic zu zentralisieren.
- Dashboard mit tiefgeparsten Logs: Das Dashboard verfügt über eine moderne Bubble-UI, die Systemanweisungen, Benutzer- und Assistentennachrichten übersichtlich formatiert anzeigt. Es umfasst Tool-Analysen zur Überprüfung von Tool Calls und deren Argumenten sowie Echtzeit-Metriken über WebSockets mit präzisen Token-Zählungen und Latenzmetriken.
- Premium-Selbsthosting-Erfahrung: Die Installation erfolgt mit einer einzigen Zeile und nativen Diensten für Linux (systemd), macOS (launchd) und Windows, die beim Start automatisch ausgeführt werden. Das Tool ist datenschutzfreundlich – 100 % lokal, wobei API-Schlüssel Ihren Rechner nie verlassen, außer um offizielle Anbieter zu erreichen.
Unterstützte Modelle und Anbieter
ClawProxy funktioniert mit High-End-Modellen wie Gemini 3 Flash, GLM 5 und MiniMax M2.5. Er verwaltet Free-Tier-Schlüssel von Anbietern wie Google AI Studio, Nvidia NIM und Groq. Der Ersteller bietet frühen Nutzern Zugang zu zwei sekundären Anbietern, die Zugriff auf hochmoderne Modelle wie GLM 5, MiniMax M2.5, Kimi K2.5 und GLM 4.7 bieten – diese sind vorkonfiguriert und erfordern keine Einrichtung.
Dieses Tool richtet sich an Entwickler, die mehrere KI-Modelle nutzen möchten, ohne Ratenlimits zu erreichen oder API-Kosten zu verursachen, insbesondere an diejenigen, die mit KI-Coding-Agenten arbeiten.
📖 Read the full source: r/openclaw
👀 Siehe auch

Tacit: Eine LLM-erste Programmiersprache, entwickelt mit Claude Code und Opus 4.7
Tacit ist eine experimentelle, LLM-zentrierte Programmiersprache, die mit Claude Code und Opus 4.7 entwickelt und implementiert wurde. Sie entfernt menschliche Annehmlichkeiten, um die Token-Nutzung zu minimieren, und enthält eine Einführung, die mittleren und höheren LLMs (Sonnet und aufwärts) beibringt, Tacit-Code zu schreiben.

Benchmark-Ergebnisse für kleine lokale und OpenRouter-Modelle bei agentischer Text-to-SQL-Aufgabe
Ein Entwickler testete mehrere kleine lokale und OpenRouter-Modelle mithilfe eines benutzerdefinierten agentenbasierten Text-zu-SQL-Benchmarks, der englische Abfragen in SQL mit Debugging-Runden umwandelt. Der Benchmark umfasst 25 Fragen, läuft in unter 5 Minuten und zeigt Top-Performer wie kimi-k2.5 und Qwen 3.5-Varianten.

AutoAgents Rust-Framework fügt Python-Bindings für Prototyping hinzu
AutoAgents, ein auf Rust basierendes Multi-Agenten-Framework, verfügt nun über Python-Bindings, die es Entwicklern ermöglichen, in Python zu prototypisieren, während die gleiche Rust-Kernlaufzeit, Provider-Schnittstellen, Pipeline-Modell und Agenten-Semantik beibehalten werden. Die Bindings ermöglichen Experimente mit lokalen KI-Modellen ohne externe Systeme.

Conduid.com indiziert über 23.000 MCP-Server in einem durchsuchbaren Verzeichnis.
Conduid.com aggregiert MCP-Server aus 11 Quellen, entfernt Duplikate und bietet Suchfunktionen, Kategorien sowie Vertrauensbewertungen basierend auf GitHub-Aktivität, Dokumentationsqualität und Wartungssignalen.