Phaselock: Un Sistema de Control de Agentes de IA Inspirado en Técnicas de Crianza

Qué hace Phaselock
Phaselock es una habilidad de agente de código abierto que aplica técnicas de crianza para niños autistas al control de agentes de IA. El desarrollador lo creó después de notar paralelismos entre los fallos vagos de los agentes de IA y cómo los niños autistas procesan instrucciones.
Mecanismos de control centrales
El sistema implementa cuatro patrones de control específicos:
- Compuertas explícitas antes de la acción: Utiliza un hook BeforeToolUse que verifica la existencia de un archivo de compuerta aprobado en el disco. Sin archivo, no hay escritura. La IA no puede proceder sin una declaración arquitectónica primero.
- Retroalimentación inmediata sobre errores: Un hook PostToolUse ejecuta análisis estático después de cada escritura de archivo (PHPStan, PHPCS, ESLint, ruff o herramientas apropiadas para el lenguaje) e inyecta resultados estructurados en JSON de vuelta al contexto. La IA ve exactamente qué se rompió y se corrige a sí misma antes de continuar.
- Opciones restringidas, no abiertas: Las características complejas se dividen en segmentos ordenados por dependencia. La IA trabaja un segmento a la vez, con cada segmento deteniéndose para revisión humana antes de que comience el siguiente.
- Reglas que no pueden racionalizarse: Los hooks de shell permiten o bloquean acciones mecánicamente. La opinión de la IA sobre su propia salida no es evidencia.
Implementación técnica
Phaselock funciona con Claude Code, Cursor, Windsurf y cualquier cosa que admita hooks y habilidades de agente. El conocimiento del dominio está orientado alrededor de Magento 2 y PHP, pero la arquitectura de aplicación es independiente del lenguaje.
Desafío de escalado y solución
Phaselock tiene un problema de escalado: carga todas las reglas en contexto cada sesión. Con 80 reglas es manejable, pero con 500 reglas estás quemando contexto antes de que comience la tarea, y con 10,000 reglas es físicamente imposible.
El desarrollador está construyendo Writ como solución: un sistema de recuperación híbrido que determina qué reglas importan en este momento y devuelve solo esas. Logra una recuperación de menos de 10ms con una reducción de contexto de 726x en 10,000 reglas. Writ sigue siendo experimental y está siendo sometido a pruebas de estrés.
Pregunta abierta actual
El desarrollador está lidiando con desafíos de evaluación. Las consultas de verdad fundamental son sintéticas con 80 reglas, y aún no saben si la calidad de recuperación se mantiene en consultas reales de sesiones reales. Se preguntan: "¿Alguien ha abordado la evaluación RAG en tamaños de corpus pequeños donde los puntos de referencia sintéticos podrían no reflejar el uso real? ¿Qué aprendieron?"
📖 Read the full source: r/LocalLLaMA
👀 Ver también

GuppyLM: Un LLM de 9M Parámetros Construido desde Cero con Fines Educativos
GuppyLM es un modelo de lenguaje de aproximadamente 9 millones de parámetros entrenado desde cero en 60,000 conversaciones sintéticas, utilizando una arquitectura de transformador básica con 6 capas, 384 dimensiones ocultas y 6 cabezas de atención. Se entrena en aproximadamente 5 minutos en una GPU T4 gratuita de Colab y habla con una personalidad de pez centrada en el agua, la comida y la vida en el acuario.

soul.py agrega memoria persistente a LLMs locales con un enfoque simple basado en archivos.
soul.py es una biblioteca de Python que añade memoria persistente a cualquier LLM utilizando dos archivos markdown para identidad y registro de conversaciones, funcionando con modelos de Ollama, OpenAI y Anthropic sin requerir bases de datos o servidores.

tmux-claude: Monitorea Instancias de Código Claude en Paneles de Tmux
tmux-claude es una herramienta que añade monitorización en vivo para instancias de Claude Code dentro de sesiones de tmux. Proporciona una barra de estado, un panel interactivo, un selector de ventanas mejorado y notificaciones de escritorio leyendo archivos de sesión locales sin necesidad de llamadas a la API.

Feynman: Agente de Investigación de Código Abierto con Herramienta de Auditoría de Base de Código de Artículos
Feynman es un agente de investigación CLI de código abierto que despacha cuatro subagentes en paralelo para responder preguntas de investigación e incluye una herramienta de auditoría única que compara las afirmaciones de los artículos con los repositorios de código reales. Cuenta con instalación de un solo comando, licencia MIT, y se ejecuta en pi para el tiempo de ejecución del agente con alphaxiv para la búsqueda de artículos.