Claude Code Limiter: Limitador de Tasa Autohospedado para Suscripciones Compartidas de Claude Code

Qué Resuelve
Cuando varios desarrolladores comparten una suscripción a Claude Code Max sin controles de uso, un solo usuario puede agotar los límites de tasa de Anthropic enviando demasiadas solicitudes (como 50 solicitudes en una hora), bloqueando a todos los demás durante el día. No hay una forma integrada de prevenir esto.
Características
- Cuotas por modelo — ej., opus: 5/día, sonnet: 25/día, haiku: 50/día por usuario
- Presupuestos de crédito — un solo presupuesto diario para todos los modelos (opus = 10 créditos, sonnet = 3, haiku = 1). Los usuarios deciden cómo gastarlo.
- Ventanas deslizantes de 24h — sin reinicios a medianoche para manipular
- Reglas por hora del día — restringir modelos costosos a horas laborales
- Panel de control en tiempo real — flujo de uso en vivo, desgloses por usuario, gráficos de uso
- Interruptor de emergencia — revocar instantáneamente el acceso de un usuario y forzar cierre de sesión, de forma remota
- A prueba de manipulaciones — 6 capas de seguridad incluyendo aplicación de managed-settings.json, permisos de archivos, watchdog de verificación de integridad y seguimiento del lado del servidor
Cómo Funciona
Configuración:
- Autoalojar el servidor — un solo comando Docker en cualquier VPS, nube o tu red
- Agregar usuarios en el panel — establecer su nombre, límites, presupuesto de crédito → obtener un código de instalación
- Instalar en cada máquina —
sudo npx @howincodes/claude-code-limiter setup --code CLM-xxx --server https://your-server - Listo — el hook verifica los límites en cada solicitud a través de managed-settings.json de Claude Code (configuración de mayor prioridad, no puede ser anulada por usuarios)
Experiencia del usuario: Cuando un usuario excede su límite, ve: "Límite diario de opus alcanzado. Usadas 5/5 solicitudes hoy. Todo el uso hoy: opus: 5/5 (0 restantes) sonnet: 12/25 (13 restantes) haiku: 3/50 (47 restantes) Saldo de créditos: 15/100 Cambia a otro modelo o intenta más tarde."
Detalles Técnicos
- Hook del cliente: cero dependencias de npm, solo módulos integrados de Node.js. Se instala en managed-settings.json con
allowManagedHooksOnly: truepara que los usuarios no puedan agregar hooks de bypass. - Servidor: Express + SQLite + panel de control vanilla JS. Contenedor Docker único, montaje de volumen único.
- Capacidad sin conexión: el hook almacena en caché los límites localmente, funciona cuando el servidor es inaccesible, sincroniza cuando vuelve en línea.
- Fallar cerrado: si alguien elimina los archivos de configuración, todas las solicitudes se bloquean (no se permiten).
Enlaces
- GitHub: github.com/howincodes/claude-code-limiter
- npm (cliente): @howincodes/claude-code-limiter
- npm (servidor): @howincodes/claude-code-limiter-server
- Docker: ghcr.io/howincodes/claude-code-limiter:latest
Código abierto. Autoalojable. Licencia MIT.
📖 Read the full source: r/ClaudeAI
👀 Ver también

Motor de Inferencia Bodega: Optimizando la Inferencia de LLM para la Memoria Unificada de Apple Silicon
Bodega es un motor de inferencia construido específicamente para la arquitectura de memoria unificada de Apple Silicon, que aborda las limitaciones de rendimiento rediseñando el procesamiento por lotes continuo y la gestión de caché KV para MLX. El desarrollador informa haber trabajado en él durante 2.5 años con optimizaciones cercanas a la capa Metal.

Asesor de IA persistente con memoria multiplataforma: realiza un seguimiento del historial de decisiones durante 3 meses
Un usuario de Reddit creó un asesor de IA persistente que recuerda cada decisión de producto en Claude Code, Cursor y una interfaz web, detectando contradicciones y mejorando con el paso de los meses.

Heren Godot MCP: Daemon WebSocket Persistente Reduce la Latencia de Interacción AI–Godot a ~20ms
Heren es un nuevo servidor MCP para Godot que mantiene un demonio WebSocket ligero activo, logrando operaciones de ~20ms en lugar de esperar arranques completos del motor. Proporciona 15 herramientas para gestión de escenas, depuración, capturas de pantalla aceleradas por GPU y apagado automático tras 3 minutos de inactividad.

/compres-arquitectura: Una habilidad de agente para podar el sobrediseño
Una nueva habilidad de agente llamada /compress-architecture audita bases de código en busca de capas especulativas, módulos de paso directo y conceptos duplicados, mientras protege los límites reales del dominio y las APIs públicas.