WCY: Reduce sobrecarga tokens LLM 50-71% con marcadores '?'

WCY (Observar → Computar → Producir) es un formato orientado a líneas diseñado para reducir la sobrecarga de tokens en LLM y proporcionar marcadores estructurales para la incertidumbre en el razonamiento. Reemplaza los corchetes, comillas y comas del JSON con una sintaxis de un marcador por línea.

Puntos de referencia de reducción de tokens

De pruebas en 10-500 filas y tipos de intercambio MCP:

Datos estructurados vs JSON: reducción de tokens del -50 al -54%
Esquemas de llamadas a herramientas: reducción del -65 al -71%
Intercambio completo del protocolo MCP: reducción del -61%
Tokens de salida multiagente: reducción del -40%

No se necesita ajuste fino—tres ejemplos de pocas muestras son suficientes para que los modelos cambien de formato. La métrica parse_r pasa de 0.29 a 1.00 en tareas complejas con este enfoque.

El marcador ? para incertidumbre

WCY introduce una forma estructural para que los LLM marquen lo que no saben durante el razonamiento. El espacio ? (void-B) permite a los modelos indicar incertidumbre en línea:

: ?diagnosis hint=labs+imaging conf_range=0.4..0.8
    order CT_scan reason=from=3 . CT_result mass_in_RUL size=2.3cm : diagnosis=adenocarcinoma conf=0.82 from=3,5

Las pruebas mostraron:

Cero muestras: los modelos usan marcadores ? el 0% del tiempo, incluso con la especificación en el prompt
Con 3 ejemplos: 5.4 marcadores por traza, 67-97% resueltos
48 trazas de pipeline en 8 dominios: 95% de resolución, 100% de aprobación de puerta de calidad

El espacio from= rastrea qué observaciones respaldan qué conclusiones en línea, lo que ayuda a detectar cadenas de alucinación.

Recursos disponibles

wcy_parser.py — Python puro, sin dependencias externas
wcy_eval.py — puntuación de 3 ejes (Estructural / Significado / Procedencia)
60 trazas de razonamiento con ciclos void-B (licencia CC BY 4.0, para experimentos de ajuste fino)
Script de pipeline para generar más trazas

Hasta ahora solo probado en Claude Sonnet. El autor tiene curiosidad por saber si el resultado de 0% → 5.4 marcadores se mantiene en Qwen, Llama y Mistral con los mismos ejemplos de pocas muestras.

📖 Read the full source: r/LocalLLaMA

El formato WCY reduce la sobrecarga de tokens en LLM entre un 50 y 71% e incorpora marcadores estructurales de "no lo sé".

Puntos de referencia de reducción de tokens

El marcador ? para incertidumbre

Recursos disponibles

👀 Ver también

yoyo: Servidor MCP local para lecturas fundamentadas de bases de código y escrituras controladas con Claude Code

Configuración de OpenClaw sin Interfaz Gráfica con Discord mediante Scripts Docker

Aprovechando Claude Code para la Consultoría de Bots: Un Análisis Profundo

El Panel de Control de SwarmClaw Agrega Capa de Orquestación a OpenClaw