El compilador SMELT reduce el uso de tokens del espacio de trabajo OpenClaw hasta en un 95%.

✍️ OpenClawRadar📅 Publicado: 6 de abril de 2026🔗 Source
El compilador SMELT reduce el uso de tokens del espacio de trabajo OpenClaw hasta en un 95%.
Ad

Herramienta de optimización de tokens para espacios de trabajo OpenClaw

SMELT es un compilador en Python que procesa archivos markdown del espacio de trabajo de OpenClaw para reducir el uso de tokens al enviar contenido a modelos de IA como Claude o GPT. La herramienta aborda una ineficiencia específica: OpenClaw reenvía USER.md, SOUL.md, MEMORY.md y AGENTS.md en cada mensaje, no solo al inicio.

Puntos de referencia de rendimiento

Las pruebas en un modelo Qwen 3.5 122B en hardware M3-Ultra revelaron:

  • Paquete de inicio: 7.268 tokens reprocesados en cada llamada de inferencia
  • Sesión de 50 mensajes: Más de 350.000 tokens de archivos estáticos del espacio de trabajo reprocesados
  • Reducciones de tokens específicas por consulta:
    • "¿Quién es Sally?": 1.373 tokens originales → 73 tokens SMELT (94,7% de ahorro)
    • "¿Cuándo nació John?": 1.374 tokens originales → 62 tokens SMELT (95,5% de ahorro)
    • Consulta amplia "Háblame de Alex": 1.373 tokens originales → 328 tokens SMELT (76,1% de ahorro)
  • TTFT de inicio: 14.121ms original → 13.273ms SMELT (6% más rápido)

Implementación técnica

SMELT utiliza una arquitectura de cuatro capas:

  1. Archivo: Los archivos originales nunca se modifican
  2. Compilación: Compresión estructural consciente del esquema
  3. Compresión: Reemplazo de diccionario
  4. Selección: Recuperación condicionada por consulta que solo envía registros relevantes con contexto padre

La cuarta capa (Selección) es donde ocurre la reducción del 95% de tokens. El compilador es consciente del esquema y está construido específicamente para las convenciones de archivos del espacio de trabajo OpenClaw.

Ad

Hallazgos clave del desarrollo

  • La conversión ingenua a JSON (un intento común de optimización) es un 30% peor que el markdown original
  • La eliminación de encabezados proporciona un beneficio mínimo (7-8% de mejora)
  • La compresión de bytes y la compresión de tokens son diferentes: las mediciones deben usar el tokenizador real
  • 11 de 13 archivos de prueba lograron una fidelidad del 100%, con dos archivos de archivo denso que tuvieron fallos documentados

Limitaciones actuales y disponibilidad

El esquema está construido manualmente para las convenciones del espacio de trabajo OpenClaw. El soporte para markdown arbitrario requiere aprendizaje de esquemas (planeado). La herramienta es gratuita para uso personal, con código disponible en GitHub bajo TooCas/SMELT e investigación publicada en Zenodo con DOI.

El proyecto fue construido con GPT, Claude y Codex como colaboradores.

📖 Read the full source: r/openclaw

Ad

👀 Ver también

Actualizaciones de CodeLedger y Vibecop para el Seguimiento de Costos y Calidad en Codificación con IA Multi-Agente
Herramientas

Actualizaciones de CodeLedger y Vibecop para el Seguimiento de Costos y Calidad en Codificación con IA Multi-Agente

CodeLedger ahora rastrea el gasto en Claude Code, Codex CLI, Cline y Gemini CLI leyendo archivos de sesión locales, mientras que Vibecop agrega verificaciones de calidad automatizadas con nuevos detectores específicos para LLM y una configuración de un solo comando para múltiples herramientas de codificación con IA.

OpenClawRadar
Desarrollador Construye Servidor MCP para Integración de Claude WhatsApp, Comparte Desafíos
Herramientas

Desarrollador Construye Servidor MCP para Integración de Claude WhatsApp, Comparte Desafíos

Un desarrollador construyó un servidor MCP para darle a Claude acceso a conversaciones reales de WhatsApp, descubriendo que la gestión del contexto de las conversaciones era más complicada de lo esperado y requería una base de datos para rastrear las conversaciones.

OpenClawRadar
El Router de Manifesto Agrega Soporte de Suscripción ZAI para la Gestión de Modelos OpenClaw
Herramientas

El Router de Manifesto Agrega Soporte de Suscripción ZAI para la Gestión de Modelos OpenClaw

El enrutador Manifest ahora admite suscripciones ZAI, permitiendo que todos los modelos ZAI aparezcan en los niveles de enrutamiento con selección automática de modelo por solicitud. La herramienta está en versión beta, es gratuita, de código abierto e incluye un panel para rastrear costos por agente, mensaje y modelo.

OpenClawRadar
Steerling-8B: Un modelo de lenguaje interpretable con atribución a nivel de token
Herramientas

Steerling-8B: Un modelo de lenguaje interpretable con atribución a nivel de token

Guide Labs lanzó Steerling-8B, un modelo de lenguaje de 8 mil millones de parámetros entrenado en 1.35 billones de tokens que puede rastrear cualquier token generado hasta el contexto de entrada, conceptos comprensibles para humanos y fuentes de datos de entrenamiento. El modelo logra un rendimiento competitivo con modelos entrenados con 2-7× más datos.

OpenClawRadar