free-claude-code añade soporte para GLM-5 a través de NVIDIA NIM y se expande a OpenRouter y Discord.

free-claude-code, un proxy ligero que convierte las solicitudes de API de Anthropic de Claude Code a formatos de otros proveedores, se ha actualizado con soporte para GLM-5 a través de NVIDIA NIM y varias características nuevas. La herramienta permite a los desarrolladores utilizar la interfaz de codificación agentica de Claude Code sin una suscripción a Anthropic al enrutar las solicitudes a backends alternativos.
Actualizaciones clave
NVIDIA agregó correcciones de llamadas de herramientas para z-ai/glm5 a su inventario NIM, y free-claude-code ahora lo admite completamente. El nivel gratuito de NVIDIA NIM proporciona 40 solicitudes por minuto sin necesidad de tarjeta de crédito.
- Soporte para OpenRouter: Utiliza cualquier modelo en la plataforma de OpenRouter como tu backend, incluyendo sus modelos gratuitos
- Integración de bot de Discord: Controla Claude Code remotamente a través de Discord además del soporte existente para bot de Telegram
- Soporte para proveedor local LMStudio: Ejecuta modelos completamente de forma local
- Soporte para extensión VSCode de Claude Code
Ventajas técnicas
- Opciones de costo cero: El nivel gratuito de NVIDIA NIM (40 solicitudes/min) y los modelos gratuitos de Open Router no requieren pago
- Preservación de pensamiento intercalado: Los tokens nativos de pensamiento intercalado se conservan entre turnos, permitiendo que modelos como GLM-5 y Kimi-K2.5 aprovechen el razonamiento de turnos anteriores
- 5 optimizaciones incorporadas: Detección rápida de prefijos, omisión de generación de títulos, omisión de modo de sugerencia y otras optimizaciones reducen llamadas innecesarias a LLM
- Control remoto: Los bots de Telegram y Discord permiten enviar tareas de codificación desde dispositivos móviles con bifurcación y persistencia de sesión
- Limitador de tasa configurable: Limitación de tasa de ventana deslizante para sesiones concurrentes
- Soporte fácil de modelos: Los nuevos modelos que se lancen en NVIDIA NIM pueden usarse sin cambios de código
- Extensibilidad: La estructura de código modular facilita agregar proveedores personalizados o plataformas de mensajería
Modelos admitidos
Los modelos populares incluyen z-ai/glm5, moonshotai/kimi-k2.5, minimaxai/minimax-m2.5, qwen/qwen3.5-397b-a17b y stepfun-ai/step-3.5-flash. La lista completa está disponible en nvidia_nim_models.json. Con OpenRouter y LMStudio, prácticamente cualquier modelo puede usarse como backend.
El desarrollador está trabajando actualmente en la selección automática de modelos basada en disponibilidad y calidad. El proyecto es de código abierto y se aceptan issues y PRs.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Análisis de acciones en tiempo real añadido a Claude Desktop mediante servidor MCP
Un desarrollador ha creado un servidor MCP llamado agent-toolbelt que agrega capacidades de análisis de acciones en tiempo real a Claude Desktop y Claude Code, proporcionando datos en vivo para análisis de inversión en lugar de las conjeturas basadas en datos de entrenamiento de Claude.

ARP: Retransmisión WebSocket sin estado para la comunicación de agentes autónomos
ARP (Protocolo de Retransmisión de Agentes) es un retransmisor WebSocket sin estado para la comunicación entre agentes autónomos que incluye identidad Ed25519, cifrado HPKE según RFC 9180, estructura binaria TLV y 33 bytes de sobrecarga por mensaje. No requiere cuentas ni registro—solo genera un par de claves y conéctate.

Cómo los asistentes de IA obtienen páginas web: Análisis de registros de Nginx de ChatGPT, Claude, Gemini y otros
Un desarrollador probó cinco asistentes de IA principales al proporcionarles URLs únicas y monitorear los registros de Nginx, revelando patrones de recuperación distintos: ChatGPT, Claude y Perplexity utilizan agentes de usuario dedicados, mientras que Gemini respondió desde su índice sin realizar ninguna recuperación.

Por qué Codex sigue superando a Claude Code para monolitos complejos de Python
Un desarrollador senior compara Codex vs Claude Code en un monolito Python de producción con capas arquitectónicas mixtas. Codex gana para trabajo backend debido a una mejor planificación, reutilización de código y adherencia a la ingeniería de harness.