Фазовое удержание: Система управления ИИ-агентами, вдохновлённая методами воспитания детей

Что делает Phaselock
Phaselock — это открытый навык для агентов, который применяет методы воспитания детей с аутизмом для контроля ИИ-агентов. Разработчик создал его, заметив параллели между неопределёнными сбоями ИИ-агентов и тем, как дети с аутизмом обрабатывают инструкции.
Основные механизмы контроля
Система реализует четыре конкретных паттерна контроля:
- Явные шлюзы перед действием: Использует хук BeforeToolUse, который проверяет наличие одобренного файла-шлюза на диске. Нет файла — нет записи. ИИ не может продолжить без предварительного архитектурного объявления.
- Мгновенная обратная связь при ошибках: Хук PostToolUse запускает статический анализ после каждой записи файла (PHPStan, PHPCS, ESLint, ruff или подходящие инструменты для языка) и внедряет структурированные JSON-результаты обратно в контекст. ИИ видит, что именно сломалось, и исправляет себя, прежде чем двигаться дальше.
- Ограниченный выбор вместо открытых опций: Сложные функции разбиваются на срезы, упорядоченные по зависимостям. ИИ работает над одним срезом за раз, причём каждый срез останавливается для проверки человеком перед началом следующего.
- Правила, которые нельзя рационализировать: Хуки оболочки либо разрешают, либо блокируют действия механически. Мнение ИИ о собственном выводе не является доказательством.
Техническая реализация
Phaselock работает с Claude Code, Cursor, Windsurf и любыми системами, поддерживающими хуки и навыки агентов. Предметная область ориентирована на Magento 2 и PHP, но архитектура принуждения не зависит от языка.
Проблема масштабирования и решение
У Phaselock есть проблема масштабирования: он загружает все правила в контекст каждый сеанс. При 80 правилах это управляемо, но при 500 правилах вы сжигаете контекст ещё до начала задачи, а при 10 000 правил это физически невозможно.
Разработчик создаёт Writ как решение: гибридную систему поиска, которая определяет, какие правила важны прямо сейчас, и возвращает только их. Она обеспечивает поиск менее чем за 10 мс с сокращением контекста в 726 раз при 10 000 правил. Writ всё ещё экспериментален и проходит стресс-тестирование.
Текущий открытый вопрос
Разработчик борется с проблемами оценки. Эталонные запросы синтетические при 80 правилах, и они ещё не знают, сохраняется ли качество поиска на реальных запросах из реальных сеансов. Они спрашивают: «Кто-нибудь сталкивался с оценкой RAG на небольших корпусах, где синтетические тесты могут не отражать реальное использование? Что вы узнали?»
📖 Read the full source: r/LocalLLaMA
👀 Смотрите также
Claude Code против Codex: 36 против 28 файлов, $2.50 против $2.04, обнаружен бесконечный цикл — сравнение в реальных условиях
Разработчик запускает одни и те же две задачи на Claude Code и Codex (Cursor): бот для триажа PR и интерфейс ревью кода в реальном времени. Результаты: 36 против 28 файлов, $2.50 против $2.04, Claude допустил меньше ошибок TypeScript, Codex зациклился в React.

LobsterBoard добавляет систему тем и галерею шаблонов
LobsterBoard теперь включает систему тем с пятью визуальными вариантами и галерею шаблонов, которая позволяет пользователям экспортировать и импортировать макеты дашбордов с автоматическим удалением конфиденциальных данных.

Manifest добавляет планы по токенам MiniMax с поддержкой модели M2.7
Manifest, открытый маршрутизирующий слой для OpenClaw, теперь поддерживает тарифные планы MiniMax, начиная с $10/месяц. Новая модель MiniMax M2.7 специально создана для рабочих процессов OpenClaw и достигает 62.7 на MM-ClawBench и 56.2 на SWE-Bench Pro.

Claude IDE Bridge: Инструмент MCP для удаленного доступа к редактору
Claude IDE Bridge — это инструмент с открытым исходным кодом, который предоставляет Claude AI удалённый доступ к управлению редакторами кода через MCP (Model Context Protocol). Он предоставляет доступ к знаниям редактора, таким как информация о типах в реальном времени и состояние отладчика, в виде вызываемых инструментов.