Phaselock : Un système de contrôle d'agent IA inspiré des techniques parentales

Ce que fait Phaselock
Phaselock est une compétence d'agent open-source qui applique des techniques parentales pour enfants autistes au contrôle des agents IA. Le développeur l'a créé après avoir remarqué des parallèles entre les échecs vagues des agents IA et la façon dont les enfants autistes traitent les instructions.
Mécanismes de contrôle fondamentaux
Le système met en œuvre quatre modèles de contrôle spécifiques :
- Portes explicites avant l'action : Utilise un hook BeforeToolUse qui vérifie la présence d'un fichier de porte approuvé sur le disque. Pas de fichier, pas d'écriture. L'IA ne peut pas continuer sans déclaration architecturale préalable.
- Retour immédiat sur les erreurs : Un hook PostToolUse exécute une analyse statique après chaque écriture de fichier (PHPStan, PHPCS, ESLint, ruff ou outils adaptés au langage) et injecte les résultats structurés en JSON dans le contexte. L'IA voit exactement ce qui a cassé et se corrige avant de continuer.
- Choix contraints plutôt qu'options ouvertes : Les fonctionnalités complexes sont décomposées en tranches ordonnées par dépendance. L'IA travaille une tranche à la fois, chaque tranche s'arrêtant pour une revue humaine avant que la suivante ne commence.
- Règles qui ne peuvent pas être rationalisées : Les hooks shell autorisent ou bloquent les actions mécaniquement. L'opinion de l'IA sur sa propre production n'est pas une preuve.
Implémentation technique
Phaselock fonctionne avec Claude Code, Cursor, Windsurf et tout ce qui prend en charge les hooks et les compétences d'agent. La connaissance du domaine est orientée autour de Magento 2 et PHP, mais l'architecture d'application est indépendante du langage.
Défi d'échelle et solution
Phaselock a un problème d'échelle : il charge toutes les règles dans le contexte à chaque session. À 80 règles, c'est gérable, mais à 500 règles, vous brûlez du contexte avant même que la tâche ne commence, et à 10 000 règles, c'est physiquement impossible.
Le développeur construit Writ comme solution : un système de récupération hybride qui détermine quelles règles sont importantes maintenant et ne renvoie que celles-ci. Il atteint une récupération en moins de 10 ms avec une réduction de contexte de 726x à 10 000 règles. Writ est encore expérimental et en cours de test de résistance.
Question ouverte actuelle
Le développeur est confronté à des défis d'évaluation. Les requêtes de vérité terrain sont synthétiques à 80 règles, et ils ne savent pas encore si la qualité de récupération se maintient sur des requêtes réelles issues de sessions réelles. Ils demandent : "Quelqu'un a-t-il abordé l'évaluation RAG sur de petits corpus où les benchmarks synthétiques pourraient ne pas refléter l'usage réel ? Qu'avez-vous appris ?"
📖 Read the full source: r/LocalLLaMA
👀 See Also

Le goulot d'étranglement dans les agents IA parallèles : la file d'attente d'approbation humaine
Un développeur exécutant des agents Claude Code en parallèle décrit le « bottleself » — le point où le parallélisme cesse d'augmenter la production et commence à créer un backlog d'approbations humaines. Sa solution : un planificateur qui décompose les objectifs en sous-tâches, lance des agents, et n'interrompt que pour les décisions non résolues.

audio-analyzer-rs : Un serveur MCP pour l'analyse audio avec Claude
Un développeur a créé audio-analyzer-rs, un serveur MCP en Rust qui donne à Claude un accès direct à l'analyse de fichiers audio, incluant les mesures spectrales, harmoniques, rythmiques, de volume LUFS (EBU R128) et de plage dynamique. L'outil est efficace en tokens, Claude commençant à basse résolution et zoomant sur de petits segments si nécessaire.

Termrender : Visualisation d'interface ASCII 6x plus économe en tokens pour Claude
Termrender est un outil Python open-source qui génère des visualisations d'interface utilisateur en ASCII avec une efficacité de 6x en tokens par rapport à la sortie brute de Claude. Il produit des diagrammes et des panneaux en utilisant un minimum de tokens pour une génération et une édition plus rapides.

DESIGN.md : Un format de spécification pour décrire l'identité visuelle aux agents de codage
DESIGN.md combine des jetons de design YAML avec de la prose Markdown pour donner aux agents IA une compréhension persistante et structurée d'un système de design. Inclut un linter et un outil de diff.