El formato WCY reduce la sobrecarga de tokens en LLM entre un 50 y 71% e incorpora marcadores estructurales de "no lo sé".

WCY (Observar → Computar → Producir) es un formato orientado a líneas diseñado para reducir la sobrecarga de tokens en LLM y proporcionar marcadores estructurales para la incertidumbre en el razonamiento. Reemplaza los corchetes, comillas y comas del JSON con una sintaxis de un marcador por línea.
Puntos de referencia de reducción de tokens
De pruebas en 10-500 filas y tipos de intercambio MCP:
- Datos estructurados vs JSON: reducción de tokens del -50 al -54%
- Esquemas de llamadas a herramientas: reducción del -65 al -71%
- Intercambio completo del protocolo MCP: reducción del -61%
- Tokens de salida multiagente: reducción del -40%
No se necesita ajuste fino—tres ejemplos de pocas muestras son suficientes para que los modelos cambien de formato. La métrica parse_r pasa de 0.29 a 1.00 en tareas complejas con este enfoque.
El marcador ? para incertidumbre
WCY introduce una forma estructural para que los LLM marquen lo que no saben durante el razonamiento. El espacio ? (void-B) permite a los modelos indicar incertidumbre en línea:
: ?diagnosis hint=labs+imaging conf_range=0.4..0.8
order CT_scan reason=from=3 . CT_result mass_in_RUL size=2.3cm : diagnosis=adenocarcinoma conf=0.82 from=3,5Las pruebas mostraron:
- Cero muestras: los modelos usan marcadores ? el 0% del tiempo, incluso con la especificación en el prompt
- Con 3 ejemplos: 5.4 marcadores por traza, 67-97% resueltos
- 48 trazas de pipeline en 8 dominios: 95% de resolución, 100% de aprobación de puerta de calidad
El espacio from= rastrea qué observaciones respaldan qué conclusiones en línea, lo que ayuda a detectar cadenas de alucinación.
Recursos disponibles
- wcy_parser.py — Python puro, sin dependencias externas
- wcy_eval.py — puntuación de 3 ejes (Estructural / Significado / Procedencia)
- 60 trazas de razonamiento con ciclos void-B (licencia CC BY 4.0, para experimentos de ajuste fino)
- Script de pipeline para generar más trazas
Hasta ahora solo probado en Claude Sonnet. El autor tiene curiosidad por saber si el resultado de 0% → 5.4 marcadores se mantiene en Qwen, Llama y Mistral con los mismos ejemplos de pocas muestras.
📖 Read the full source: r/LocalLLaMA
👀 Ver también

Anchormd: Una Herramienta para Gestionar Contexto en Sesiones de Claude AI
Anchormd es una herramienta de código abierto que aborda la pérdida de contexto en las sesiones de Claude AI indexando planes de markdown curados en un grafo de conocimiento consultable. Permite a los agentes cargar resúmenes de proyectos al inicio de cada sesión y consultar detalles específicos según sea necesario.

OpenClaw .NET: Port a NativeAOT con Puente JSON-RPC para Complementos Existentes
OpenClaw .NET es un port de C# de OpenClaw que se compila en un binario NativeAOT de ~23 MB, eliminando el calentamiento del JIT y la sobrecarga del runtime de Node, manteniendo la compatibilidad con los complementos existentes de TypeScript/JavaScript a través de un puente JSON-RPC integrado.

Ops Dashboard OpenClaw: Panel Local-Primero para Desarrolladores Solitarios con Múltiples Repos
Un desarrollador solitario creó ops-dashboard, una aplicación local-first que indexa bóvedas de Obsidian, repositorios y registros en un único panel consultable. BYOK, licencia MIT, sin necesidad de la nube.

angular-grab: Herramienta para Extraer el Contexto de Componentes Angular para Agentes de IA
angular-grab es una herramienta solo para desarrollo que te permite apuntar a cualquier elemento de la interfaz de usuario en un servidor de desarrollo de Angular, presionar Cmd+C y copiar el rastro completo de la pila de componentes con rutas de archivos y HTML a tu portapapeles para pegarlo en agentes de IA.