Schema structuré : Qwen Meetup Draft - Le harnais d'appel de fonction améliore la conformité CoT de 9,91 % à 100 %

✍️ OpenClawRadar📅 Publié: May 2, 2026🔗 Source
Schema structuré : Qwen Meetup Draft - Le harnais d'appel de fonction améliore la conformité CoT de 9,91 % à 100 %
Ad

Un exposé au Qwen Meetup Korea (fin mai) présente une deuxième itération du modèle de harnais d'appel de fonctions. Le harnais original a fait passer qwen3-coder-next de 6,75% à 100% sur la génération de code backend en utilisant la validation de type et les retours du compilateur. Cette mise à jour étend la même idée aux domaines sans compilateur : notes d'investissement, avis juridiques et dossiers cliniques.

Conformité CoT pilotée par schéma

Le mécanisme central est un schéma TypeScript (utilisant les balises typia) qui force le raisonnement du modèle dans une forme requise. Chaque champ doit être rempli, sinon la soumission est rejetée. Exemple de schéma pour une note d'investissement :

import { tags } from "typia";

export interface IInvestmentMemo { recommendation: "BUY" | "HOLD" | "SELL"; thesis: { consensusView: string; differentiatedView: string; }; counterThesis: { bearCase: string; ourResponse: string; }; // bull / base / bear tous requis — empêche de soumettre seulement le scénario de base scenarios: { bull: IScenario; base: IScenario; bear: IScenario; }; // les tableaux vides sont interdits valuationDrivers: IValuationDriver[] & tags.MinItems<1>; killConditions: IKillCondition[] & tags.MinItems<1>; evidenceSources: IEvidenceSource[] & tags.MinItems<1>; }

// Seuils falsifiables uniquement — empêche les formulations libres comme "confiance dans la direction" export type IKillCondition = | { type: "price_drawdown"; percentBelowEntry: number } | { type: "metric_breach"; metric: string; below: number } | { type: "milestone_miss"; expectedBy: string; what: string };

Le schéma est ensuite validé en l'exécutant sur des cas d'investissement historiques — la même idée que le backtesting d'une stratégie de trading sur des données de marché. Le diff montre quels appels passés le schéma aurait réussis et lesquels il a manqués ; vous ajoutez ce qui manque.

Ad

Conformité CoT mesurée

En utilisant la fonctionnalité CoT d'AutoBE (et non l'analyse d'investissement financier elle-même), qwen3.6-27b suit le rythme des modèles frontaliers sur ces schémas de conformité CoT. Le harnais fait passer la conformité de 9,91% à 100%.

À qui cela s'adresse

Développeurs créant des agents IA qui ont besoin d'un raisonnement structuré et vérifiable dans des domaines sans contrôles automatiques de correction (par exemple, finance, droit, médecine).

📖 Lire la source complète : r/LocalLLaMA

Présentation précédente : Partie 1

Ad

👀 See Also

Benchmark de Quantification Qwen 3.6 27B : Q4_K_M Surpasse Q8_0 en Compromis Pratiques
Tools

Benchmark de Quantification Qwen 3.6 27B : Q4_K_M Surpasse Q8_0 en Compromis Pratiques

Évalué Qwen 3.6 27B en BF16, Q4_K_M et Q8_0 quantifications GGUF sur HumanEval, HellaSwag et BFCL. Q4_K_M offre des scores proches de BF16 avec 48% de RAM en moins, 1,45x de vitesse et une taille de fichier réduite de 68,8%.

OpenClawRadar
L'optimisation de l'ANE par des expériences d'IA pilotées par téléphone démontre les avantages de la fusion de noyaux
Tools

L'optimisation de l'ANE par des expériences d'IA pilotées par téléphone démontre les avantages de la fusion de noyaux

Un développeur a mené 55 expériences d'optimisation sur le moteur neuronal d'Apple, pilotant le processus depuis son téléphone en utilisant Claude pour le brainstorming. Les améliorations clés incluent la fusion de 3 noyaux ANE en 1 méga-noyau, réduisant la perte de validation de 3,75 à 2,49 et le temps d'étape de 176 ms à 96 ms.

OpenClawRadar
Gouverneur : Un plugin Claude Code pour réduire le gaspillage de tokens via la compression des sorties, l'allègement du contexte et le filtrage des outils
Tools

Gouverneur : Un plugin Claude Code pour réduire le gaspillage de tokens via la compression des sorties, l'allègement du contexte et le filtrage des outils

Governor est un plugin Claude Code qui réduit le gaspillage de tokens/contexte grâce à une sortie professionnelle compacte, la compression de fichiers mémoire, le filtrage des sorties d'outils et des garde-fous anti-dérive. Les benchmarks montrent une économie de 55,5% de tokens de sortie par rapport au témoin.

OpenClawRadar
Configuration de RouteLLM pour un Routage Économique des Tâches d'IA
Tools

Configuration de RouteLLM pour un Routage Économique des Tâches d'IA

Un utilisateur de Reddit partage une configuration Docker Compose qui combine le modèle local Qwen3.5:4b d'Ollama avec GitHub Copilot via OpenWire, utilisant RouteLLM pour router les tâches complexes vers GPT-4o tout en gérant les tâches plus simples localement.

OpenClawRadar