SkillOpt : Optimisation des fichiers de compétences Markdown en tant que paramètres entraînables pour les agents IA

SkillOpt est un nouveau cadre d'optimisation qui traite les fichiers de compétences markdown comme des paramètres entraînables, en appliquant une véritable mécanique d'optimisation à l'édition ad hoc de compétences que de nombreux développeurs d'agents pratiquent déjà. L'article (arxiv.org/pdf/2605.23904) formalise un processus : un modèle de pointe propose des modifications limitées (ajout/suppression/remplacement) aux fichiers de compétences markdown, et chaque modification est validée par un ensemble de validation réservé. Seules les améliorations strictes sont acceptées ; les égalités sont rejetées, et les modifications rejetées deviennent un signal négatif pour les tours suivants.
Résultats Clés
- Convergence : Les meilleures compétences convergent avec 1 à 4 modifications acceptées parmi de nombreuses propositions. Un budget de 4 à 8 modifications par étape fonctionne le mieux ; supprimer le plafond entraîne un effondrement des performances.
- Taille des compétences : La compétence finale médiane fait environ 920 tokens.
- Transfert de modèle : Une compétence optimisée sur Codex transférée à Claude Code sans modification a gagné +59,7 sur SpreadsheetBench. GPT 4.1 Nano avec une compétence optimisée a approximativement égalé les modèles de pointe sur des benchmarks procéduraux.
Limitations
La validation nécessite un auto-correcteur avec des réponses correctes claires. Cela fonctionne pour le code et les feuilles de calcul, mais échoue pour tout ce qui est ouvert.
À Qui Cela S'Adresse
Développeurs construisant des agents de codage IA qui souhaitent optimiser systématiquement les fichiers de compétences plutôt que de se fier à l'itération manuelle ou à l'ingénierie de prompts ad hoc.
📖 Lire la source complète : r/LocalLLaMA
👀 See Also

BusyDog Desktop : Un agent IA local avec réseau P2P pour Mac
BusyDog Desktop est un agent d'IA local qui exécute Claude directement sur un Mac, peut lire/écrire des fichiers, exécuter des commandes terminal, contrôler des navigateurs et se connecter avec d'autres agents via un réseau P2P utilisant Hyperswarm DHT et un protocole BDP personnalisé.

Arrêtez de réapprendre à Claude Code chaque session : utilisez une configuration persistante
Un utilisateur de Reddit explique comment il a économisé 20 minutes par session en écrivant une config persistante pour Claude Code, éliminant les réorientations répétitives et obtenant des complétions 33 % plus rapides.

Jan Ajoute l'Installation en Un Clic d'OpenClaw avec l'Intégration du Modèle de Base Jan-v3
Jan prend désormais en charge l'installation en un clic d'OpenClaw avec une intégration directe au modèle Jan-v3-base, gardant toutes les opérations locales et privées sur votre ordinateur.

ClawNet : Réseau d'Agents IA Pair-à-Pair Sans Clés API
ClawNet est un réseau pair-à-pair qui permet aux agents d'IA de collaborer directement sans clés API ni frais de plateforme. L'installation se fait via un script curl, et les fonctionnalités incluent un bazar de tâches, une économie de shell et un réseau de connaissances.