Le format WCY réduit la surcharge de tokens des LLM de 50 à 71 % et ajoute des marqueurs structurels « Je ne sais pas ».

✍️ OpenClawRadar📅 Publié: March 17, 2026🔗 Source
Le format WCY réduit la surcharge de tokens des LLM de 50 à 71 % et ajoute des marqueurs structurels « Je ne sais pas ».
Ad

WCY (Watch → Compute → Yield) est un format orienté lignes conçu pour réduire la surcharge de tokens des LLM et fournir des marqueurs structurels pour l'incertitude dans le raisonnement. Il remplace les crochets, guillemets et virgules du JSON par une syntaxe d'un marqueur par ligne.

Références de réduction de tokens

D'après les tests sur 10 à 500 lignes et types d'échange MCP :

  • Données structurées vs JSON : réduction de tokens de -50 à -54 %
  • Schémas d'appel d'outils : réduction de -65 à -71 %
  • Échange complet du protocole MCP : réduction de -61 %
  • Tokens de sortie multi-agents : réduction de -40 %

Aucun ajustement fin n'est nécessaire — trois exemples en few-shot suffisent pour que les modèles changent de format. La métrique parse_r passe de 0,29 à 1,00 sur les tâches complexes avec cette approche.

Ad

Le marqueur ? pour l'incertitude

WCY introduit une manière structurelle pour que les LLM marquent ce qu'ils ne savent pas pendant le raisonnement. Le créneau ? (void-B) permet aux modèles d'indiquer l'incertitude en ligne :

: ?diagnosis hint=labs+imaging conf_range=0.4..0.8
    order CT_scan reason=from=3 . CT_result mass_in_RUL size=2.3cm : diagnosis=adenocarcinoma conf=0.82 from=3,5

Les tests ont montré :

  • Zero-shot : les modèles utilisent les marqueurs ? 0 % du temps, même avec la spécification dans l'invite
  • Avec 3 exemples : 5,4 marqueurs par trace, 67-97 % résolus
  • 48 traces de pipeline sur 8 domaines : 95 % de résolution, 100 % de réussite au contrôle qualité

Le créneau from= suit quelles observations soutiennent quelles conclusions en ligne, ce qui aide à détecter les chaînes d'hallucination.

Ressources disponibles

  • wcy_parser.py — Python pur, sans dépendances externes
  • wcy_eval.py — notation à 3 axes (Structure / Signification / Provenance)
  • 60 traces de raisonnement avec cycles void-B (licence CC BY 4.0, pour expériences d'ajustement fin)
  • Script de pipeline pour générer plus de traces

Jusqu'à présent, testé uniquement sur Claude Sonnet. L'auteur se demande si le résultat de 0 % → 5,4 marqueurs se maintient sur Qwen, Llama et Mistral avec les mêmes exemples en few-shot.

📖 Lire la source complète : r/LocalLLaMA

Ad

👀 See Also

Analyse Codeflash : 118 bogues de performance détectés dans deux PR rédigés avec Claude Code
Tools

Analyse Codeflash : 118 bogues de performance détectés dans deux PR rédigés avec Claude Code

Codeflash a mesuré les performances de deux fonctionnalités majeures développées avec Claude Code et a constaté que 118 fonctions fonctionnaient jusqu'à 446 fois plus lentement que nécessaire. L'analyse a révélé des schémas d'algorithmes inefficaces, de calculs redondants, d'absence de mise en cache et de structures de données sous-optimales.

OpenClawRadar
VibeAround : Démon Local Connecte les Agents de Codage à Telegram et Discord
Tools

VibeAround : Démon Local Connecte les Agents de Codage à Telegram et Discord

VibeAround est un démon local qui connecte des agents de codage comme Claude Code, Gemini CLI et Codex à des plateformes de messagerie instantanée telles que Telegram et Discord. L'outil propose une fonction de transfert de session avec des codes de reprise pour continuer les conversations sur différents appareils.

OpenClawRadar
L'Approche de Cursor pour une Recherche Rapide d'Expressions Régulières pour les Agents IA
Tools

L'Approche de Cursor pour une Recherche Rapide d'Expressions Régulières pour les Agents IA

Cursor développe une recherche d'expressions régulières indexée pour résoudre les problèmes de performance dans les monorepos de grande taille où ripgrep peut prendre plus de 15 secondes, en utilisant des index inversés avec des n-grammes basés sur des recherches de 1993 par Zobel, Moffat et Sacks-Davis.

OpenClawRadar
Site Web interactif simule la structure de projet de code Claude
Tools

Site Web interactif simule la structure de projet de code Claude

Un développeur a créé exploreclaudecode.com, une simulation en ligne d'un projet Claude Code avec une arborescence de fichiers fonctionnelle, des fichiers configurables et un panneau terminal. Le site explique comment les répertoires .claude/, les fichiers de configuration, les compétences, les agents, les hooks et les configurations MCP fonctionnent ensemble.

OpenClawRadar