Los marcos de agentes desperdician más de 350,000 tokens por sesión al reenviar archivos estáticos.

✍️ OpenClawRadar📅 Publicado: 13 de abril de 2026🔗 Source

Resultados de la prueba de referencia sobre desperdicio de tokens

Las mediciones en una configuración local de Qwen 3.5 122B revelaron que los marcos de agentes desperdician más de 350,000 tokens por sesión al reenviar repetidamente archivos estáticos. La fuente describe estos números como "irreales".

Enfoque de optimización

Se descubrió un enfoque en tiempo de compilación que reduce el contexto de consulta de 1,373 tokens a solo 73 tokens. Esto representa una reducción del 95% en el uso de tokens para este contexto específico.

La prueba de referencia también encontró que la conversión ingenua de JSON empeora el problema en un 30%, aumentando el desperdicio de tokens más allá de las mediciones de referencia.

Contexto técnico

Los marcos de agentes generalmente incluyen indicaciones del sistema, definiciones de herramientas y otros datos de configuración que permanecen estáticos en múltiples interacciones dentro de una sesión. Cuando estos datos se reenvían con cada consulta, consumen tokens sin proporcionar nueva información al modelo. Esto es particularmente costoso con modelos grandes como Qwen 3.5 122B, donde el procesamiento de tokens afecta directamente tanto el rendimiento como el costo.

El enfoque en tiempo de compilación probablemente implica preprocesar elementos estáticos para que se hagan referencia en lugar de reenviarse, similar a cómo las aplicaciones web modernas almacenan en caché activos estáticos. Para los desarrolladores que trabajan con agentes de codificación de IA, reducir esta sobrecarga puede mejorar significativamente los tiempos de respuesta y reducir los costos operativos.

📖 Read the full source: r/LocalLLaMA

👀 Ver también

Herramientas

Código de Claude de código abierto, ingeniería inversa realizada usando Claude

Un desarrollador utilizó Claude para reescribir los 26 prompts del código fuente de Claude Code después de estudiar la base de código TypeScript durante una breve ventana de disponibilidad pública. La colección con licencia MIT incluye prompts de sistema, herramientas, agentes, memoria, coordinador y utilidades.

2 abr 2026, 04:45 UTC

OpenClawRadar

Herramientas

Puntos de Referencia de Rendimiento de LLM Local en Mac Mini con OpenClaw y LM Studio

Un usuario de Reddit publicó cifras de rendimiento para ejecutar el modelo Unsloth gpt-oss-20b-Q4_K_S.gguf localmente en un Mac Mini con 32 GB de RAM, logrando 34 tokens/segundo con un tiempo de 0.7 segundos para el primer token usando OpenClaw 2026.3.8 y LM Studio 0.4.6+1.

18 abr 2026, 15:45 UTC

OpenClawRadar

Herramientas

ClawControl cliente iOS lanzado para servidores autoalojados de OpenClaw

ClawControl v1.50 ya está disponible en iOS como un cliente móvil centrado en la privacidad para servidores OpenClaw/Claw autoalojados. La aplicación de código abierto permite chat en tiempo real con respuestas en streaming, gestión de agentes y control de sesiones desde dispositivos móviles.

11 mar 2026, 05:45 UTC

OpenClawRadar

Herramientas

Agente de IA Cowork Causa Problemas de Entrada de Teclado en Portátiles Windows

Un usuario reportó que el agente Cowork AI causó problemas persistentes de entrada del teclado en un Dell Latitude 9430, donde solo se registraban las primeras pulsaciones de teclas. La solución implicó un procedimiento específico de reinicio del controlador embebido para los modelos Latitude.

18 abr 2026, 03:45 UTC

OpenClawRadar