Claude Code Limiter: Limitador de Tasa Autohospedado para Suscripciones Compartidas de Claude Code

✍️ OpenClawRadar📅 Publicado: 29 de marzo de 2026🔗 Source
Claude Code Limiter: Limitador de Tasa Autohospedado para Suscripciones Compartidas de Claude Code
Ad

Qué Resuelve

Cuando varios desarrolladores comparten una suscripción a Claude Code Max sin controles de uso, un solo usuario puede agotar los límites de tasa de Anthropic enviando demasiadas solicitudes (como 50 solicitudes en una hora), bloqueando a todos los demás durante el día. No hay una forma integrada de prevenir esto.

Características

  • Cuotas por modelo — ej., opus: 5/día, sonnet: 25/día, haiku: 50/día por usuario
  • Presupuestos de crédito — un solo presupuesto diario para todos los modelos (opus = 10 créditos, sonnet = 3, haiku = 1). Los usuarios deciden cómo gastarlo.
  • Ventanas deslizantes de 24h — sin reinicios a medianoche para manipular
  • Reglas por hora del día — restringir modelos costosos a horas laborales
  • Panel de control en tiempo real — flujo de uso en vivo, desgloses por usuario, gráficos de uso
  • Interruptor de emergencia — revocar instantáneamente el acceso de un usuario y forzar cierre de sesión, de forma remota
  • A prueba de manipulaciones — 6 capas de seguridad incluyendo aplicación de managed-settings.json, permisos de archivos, watchdog de verificación de integridad y seguimiento del lado del servidor

Cómo Funciona

Configuración:

  1. Autoalojar el servidor — un solo comando Docker en cualquier VPS, nube o tu red
  2. Agregar usuarios en el panel — establecer su nombre, límites, presupuesto de crédito → obtener un código de instalación
  3. Instalar en cada máquinasudo npx @howincodes/claude-code-limiter setup --code CLM-xxx --server https://your-server
  4. Listo — el hook verifica los límites en cada solicitud a través de managed-settings.json de Claude Code (configuración de mayor prioridad, no puede ser anulada por usuarios)

Experiencia del usuario: Cuando un usuario excede su límite, ve: "Límite diario de opus alcanzado. Usadas 5/5 solicitudes hoy. Todo el uso hoy: opus: 5/5 (0 restantes) sonnet: 12/25 (13 restantes) haiku: 3/50 (47 restantes) Saldo de créditos: 15/100 Cambia a otro modelo o intenta más tarde."

Ad

Detalles Técnicos

  • Hook del cliente: cero dependencias de npm, solo módulos integrados de Node.js. Se instala en managed-settings.json con allowManagedHooksOnly: true para que los usuarios no puedan agregar hooks de bypass.
  • Servidor: Express + SQLite + panel de control vanilla JS. Contenedor Docker único, montaje de volumen único.
  • Capacidad sin conexión: el hook almacena en caché los límites localmente, funciona cuando el servidor es inaccesible, sincroniza cuando vuelve en línea.
  • Fallar cerrado: si alguien elimina los archivos de configuración, todas las solicitudes se bloquean (no se permiten).

Enlaces

Código abierto. Autoalojable. Licencia MIT.

📖 Read the full source: r/ClaudeAI

Ad

👀 Ver también

Motor de Inferencia Bodega: Optimizando la Inferencia de LLM para la Memoria Unificada de Apple Silicon
Herramientas

Motor de Inferencia Bodega: Optimizando la Inferencia de LLM para la Memoria Unificada de Apple Silicon

Bodega es un motor de inferencia construido específicamente para la arquitectura de memoria unificada de Apple Silicon, que aborda las limitaciones de rendimiento rediseñando el procesamiento por lotes continuo y la gestión de caché KV para MLX. El desarrollador informa haber trabajado en él durante 2.5 años con optimizaciones cercanas a la capa Metal.

OpenClawRadar
Asesor de IA persistente con memoria multiplataforma: realiza un seguimiento del historial de decisiones durante 3 meses
Herramientas

Asesor de IA persistente con memoria multiplataforma: realiza un seguimiento del historial de decisiones durante 3 meses

Un usuario de Reddit creó un asesor de IA persistente que recuerda cada decisión de producto en Claude Code, Cursor y una interfaz web, detectando contradicciones y mejorando con el paso de los meses.

OpenClawRadar
Heren Godot MCP: Daemon WebSocket Persistente Reduce la Latencia de Interacción AI–Godot a ~20ms
Herramientas

Heren Godot MCP: Daemon WebSocket Persistente Reduce la Latencia de Interacción AI–Godot a ~20ms

Heren es un nuevo servidor MCP para Godot que mantiene un demonio WebSocket ligero activo, logrando operaciones de ~20ms en lugar de esperar arranques completos del motor. Proporciona 15 herramientas para gestión de escenas, depuración, capturas de pantalla aceleradas por GPU y apagado automático tras 3 minutos de inactividad.

OpenClawRadar
/compres-arquitectura: Una habilidad de agente para podar el sobrediseño
Herramientas

/compres-arquitectura: Una habilidad de agente para podar el sobrediseño

Una nueva habilidad de agente llamada /compress-architecture audita bases de código en busca de capas especulativas, módulos de paso directo y conceptos duplicados, mientras protege los límites reales del dominio y las APIs públicas.

OpenClawRadar