Phaselock : 4 mécanismes de contrôle pour agent IA

Ce que fait Phaselock

Phaselock est une compétence d'agent open-source qui applique des techniques parentales pour enfants autistes au contrôle des agents IA. Le développeur l'a créé après avoir remarqué des parallèles entre les échecs vagues des agents IA et la façon dont les enfants autistes traitent les instructions.

Mécanismes de contrôle fondamentaux

Le système met en œuvre quatre modèles de contrôle spécifiques :

Portes explicites avant l'action : Utilise un hook BeforeToolUse qui vérifie la présence d'un fichier de porte approuvé sur le disque. Pas de fichier, pas d'écriture. L'IA ne peut pas continuer sans déclaration architecturale préalable.
Retour immédiat sur les erreurs : Un hook PostToolUse exécute une analyse statique après chaque écriture de fichier (PHPStan, PHPCS, ESLint, ruff ou outils adaptés au langage) et injecte les résultats structurés en JSON dans le contexte. L'IA voit exactement ce qui a cassé et se corrige avant de continuer.
Choix contraints plutôt qu'options ouvertes : Les fonctionnalités complexes sont décomposées en tranches ordonnées par dépendance. L'IA travaille une tranche à la fois, chaque tranche s'arrêtant pour une revue humaine avant que la suivante ne commence.
Règles qui ne peuvent pas être rationalisées : Les hooks shell autorisent ou bloquent les actions mécaniquement. L'opinion de l'IA sur sa propre production n'est pas une preuve.

Implémentation technique

Phaselock fonctionne avec Claude Code, Cursor, Windsurf et tout ce qui prend en charge les hooks et les compétences d'agent. La connaissance du domaine est orientée autour de Magento 2 et PHP, mais l'architecture d'application est indépendante du langage.

Défi d'échelle et solution

Phaselock a un problème d'échelle : il charge toutes les règles dans le contexte à chaque session. À 80 règles, c'est gérable, mais à 500 règles, vous brûlez du contexte avant même que la tâche ne commence, et à 10 000 règles, c'est physiquement impossible.

Le développeur construit Writ comme solution : un système de récupération hybride qui détermine quelles règles sont importantes maintenant et ne renvoie que celles-ci. Il atteint une récupération en moins de 10 ms avec une réduction de contexte de 726x à 10 000 règles. Writ est encore expérimental et en cours de test de résistance.

Question ouverte actuelle

Le développeur est confronté à des défis d'évaluation. Les requêtes de vérité terrain sont synthétiques à 80 règles, et ils ne savent pas encore si la qualité de récupération se maintient sur des requêtes réelles issues de sessions réelles. Ils demandent : "Quelqu'un a-t-il abordé l'évaluation RAG sur de petits corpus où les benchmarks synthétiques pourraient ne pas refléter l'usage réel ? Qu'avez-vous appris ?"

📖 Read the full source: r/LocalLLaMA

Phaselock : Un système de contrôle d'agent IA inspiré des techniques parentales

Ce que fait Phaselock

Mécanismes de contrôle fondamentaux

Implémentation technique

Défi d'échelle et solution

Question ouverte actuelle

👀 See Also

Claude Code : Comment connecter votre frontend construit par IA à un véritable backend

Tripsy lance un serveur MCP pour Claude : gérez vos voyages via une API structurée

Mise à jour de Void-Box : Intégration Sandboxée d'OpenClaw-Telegram via des Micro-VMs KVM

mycrab.space présente SKILL.md et Prompt Autocomposer pour un déploiement d'applications standardisé.