Format WCY : 50-71% Moins de Tokens LLM

WCY (Watch → Compute → Yield) est un format orienté lignes conçu pour réduire la surcharge de tokens des LLM et fournir des marqueurs structurels pour l'incertitude dans le raisonnement. Il remplace les crochets, guillemets et virgules du JSON par une syntaxe d'un marqueur par ligne.

Références de réduction de tokens

D'après les tests sur 10 à 500 lignes et types d'échange MCP :

Données structurées vs JSON : réduction de tokens de -50 à -54 %
Schémas d'appel d'outils : réduction de -65 à -71 %
Échange complet du protocole MCP : réduction de -61 %
Tokens de sortie multi-agents : réduction de -40 %

Aucun ajustement fin n'est nécessaire — trois exemples en few-shot suffisent pour que les modèles changent de format. La métrique parse_r passe de 0,29 à 1,00 sur les tâches complexes avec cette approche.

Le marqueur ? pour l'incertitude

WCY introduit une manière structurelle pour que les LLM marquent ce qu'ils ne savent pas pendant le raisonnement. Le créneau ? (void-B) permet aux modèles d'indiquer l'incertitude en ligne :

: ?diagnosis hint=labs+imaging conf_range=0.4..0.8
    order CT_scan reason=from=3 . CT_result mass_in_RUL size=2.3cm : diagnosis=adenocarcinoma conf=0.82 from=3,5

Les tests ont montré :

Zero-shot : les modèles utilisent les marqueurs ? 0 % du temps, même avec la spécification dans l'invite
Avec 3 exemples : 5,4 marqueurs par trace, 67-97 % résolus
48 traces de pipeline sur 8 domaines : 95 % de résolution, 100 % de réussite au contrôle qualité

Le créneau from= suit quelles observations soutiennent quelles conclusions en ligne, ce qui aide à détecter les chaînes d'hallucination.

Ressources disponibles

wcy_parser.py — Python pur, sans dépendances externes
wcy_eval.py — notation à 3 axes (Structure / Signification / Provenance)
60 traces de raisonnement avec cycles void-B (licence CC BY 4.0, pour expériences d'ajustement fin)
Script de pipeline pour générer plus de traces

Jusqu'à présent, testé uniquement sur Claude Sonnet. L'auteur se demande si le résultat de 0 % → 5,4 marqueurs se maintient sur Qwen, Llama et Mistral avec les mêmes exemples en few-shot.

📖 Lire la source complète : r/LocalLLaMA

Le format WCY réduit la surcharge de tokens des LLM de 50 à 71 % et ajoute des marqueurs structurels « Je ne sais pas ».

Références de réduction de tokens

Le marqueur ? pour l'incertitude

Ressources disponibles

👀 See Also

SideX : Un Portage de Visual Studio Code Basé sur Tauri

Skynet : Réseau de Collaboration Multi-Agents pour Agents de Code Claude

AgentPeek : Tableau de bord open source pour surveiller les équipes d'agents Claude Code

Heddle : Application de la confiance et journalisation des audits pour les connexions MCP de Claude Desktop