free-claude-code fügt GLM-5-Unterstützung über NVIDIA NIM hinzu und erweitert auf OpenRouter und Discord

free-claude-code, ein leichtgewichtiger Proxy, der Claude Codes Anthropic-API-Anfragen in andere Provider-Formate umwandelt, wurde mit GLM-5-Unterstützung über NVIDIA NIM und mehreren neuen Funktionen aktualisiert. Das Tool ermöglicht Entwicklern, Claude Codes agentische Codierungsoberfläche ohne ein Anthropic-Abonnement zu nutzen, indem Anfragen an alternative Backends weitergeleitet werden.
Wichtige Aktualisierungen
NVIDIA hat Tool-Calling-Korrekturen für z-ai/glm5 zu ihrem NIM-Inventar hinzugefügt, und free-claude-code unterstützt es jetzt vollständig. Die kostenlose Stufe von NVIDIA NIM bietet 40 Anfragen pro Minute ohne Kreditkarte.
- OpenRouter-Unterstützung: Nutzen Sie jedes Modell auf der OpenRouter-Plattform als Ihr Backend, einschließlich ihrer kostenlosen Modelle
- Discord-Bot-Integration: Steuern Sie Claude Code zusätzlich zur bestehenden Telegram-Bot-Unterstützung remote über Discord
- LMStudio-Local-Provider-Unterstützung: Führen Sie Modelle vollständig lokal aus
- Claude Code VSCode-Erweiterungsunterstützung
Technische Vorteile
- Kostenlose Optionen: Die kostenlose Stufe von NVIDIA NIM (40 Anfragen/Min.) und kostenlose OpenRouter-Modelle erfordern keine Zahlung
- Erhaltung verschachtelten Denkens: Native verschachtelte Denk-Tokens werden über mehrere Runden hinweg beibehalten, sodass Modelle wie GLM-5 und Kimi-K2.5 auf vorherige Überlegungen zurückgreifen können
- 5 integrierte Optimierungen: Schnelle Präfix-Erkennung, Titelgenerierungs-Überspringung, Vorschlagsmodus-Überspringung und andere Optimierungen reduzieren unnötige LLM-Aufrufe
- Fernsteuerung: Telegram- und Discord-Bots ermöglichen das Senden von Codierungsaufgaben von Mobilgeräten mit Session-Forking und Persistenz
- Konfigurierbarer Ratenbegrenzer: Gleitfenster-Ratenbegrenzung für gleichzeitige Sitzungen
- Einfache Modellunterstützung: Neue Modelle, die auf NVIDIA NIM starten, können ohne Codeänderungen genutzt werden
- Erweiterbarkeit: Modulare Codestruktur macht es einfach, benutzerdefinierte Provider oder Messaging-Plattformen hinzuzufügen
Unterstützte Modelle
Beliebte Modelle umfassen z-ai/glm5, moonshotai/kimi-k2.5, minimaxai/minimax-m2.5, qwen/qwen3.5-397b-a17b und stepfun-ai/step-3.5-flash. Die vollständige Liste ist in nvidia_nim_models.json verfügbar. Mit OpenRouter und LMStudio kann praktisch jedes Modell als Backend verwendet werden.
Der Entwickler arbeitet derzeit an automatischer Modellauswahl basierend auf Verfügbarkeit und Qualität. Das Projekt ist Open Source, und Issues und PRs sind willkommen.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

OpenClaw Agent behält den Speicher beim Wechsel vom Claude-Abonnement zur API
Ein Entwickler berichtet, dass er sein OpenClaw-Setup erfolgreich von einem Claude-Abonnement auf einen API-Schlüssel migriert hat, ohne den Agentenspeicher zu verlieren, indem er die mengram-memory-Fähigkeit verwendet, die in einer externen Schicht speichert. Der Agent behielt ~100+ gelernte Fakten, weiterentwickelte Prozeduren und episodische Erinnerungen.

ProofShot CLI verleiht KI-Codierungsagenten Browser-Verifizierungsfunktionen
ProofShot ist ein Open-Source-CLI-Tool, das KI-Coding-Agents ermöglicht, UI-Funktionen zu überprüfen, indem es Browser-Sitzungen aufzeichnet, Screenshots erfasst und Konsolenfehler sammelt. Es funktioniert mit jedem Agenten, der Shell-Befehle ausführen kann, und erstellt eigenständige HTML-Berichte zur menschlichen Überprüfung.

Entwickler erreicht Sub-Sekunden-Latenz bei STT/TTS mit lokalen Whisper- und Coqui-TTS-Servern
Ein Entwickler hat Open-Source-Server-Implementierungen für Whisper STT und Coqui TTS veröffentlicht, die eine Latenz von etwa 0,2 Sekunden für Spracherkennung und etwa 250 ms für Sprachsynthese erreichen, wodurch konversationelle KI-Agenten ohne Cloud-Abhängigkeiten ermöglicht werden.

Entwickler baut lokalen KI-Forschungsagenten, der Podcasts aus Themen oder YouTube-Links erstellt
Ein Entwickler hat einen vollständig lokalen KI-Agenten erstellt, der Themen oder YouTube-Links entgegennimmt und tiefgehende Berichte, Gesprächspodcast-Skripte und Audio generiert. Das System recherchiert dynamisch, extrahiert Erkenntnisse, verfeinert Zusammenfassungen und erzeugt natürliche Hin-und-Her-Gespräche.