Phaselock: Ein KI-Agenten-Steuerungssystem inspiriert von Erziehungstechniken

Phaselock ist eine Open-Source-Agent-Skill, die Erziehungstechniken für autistische Kinder anwendet, um KI-Codierungsagenten zu kontrollieren. Der Entwickler beobachtete, dass vage Aufgaben sowohl bei autistischen Kindern als auch bei KI-Agenten zu Fehlinterpretationen von Anweisungen führen, was zu unvollständiger oder falscher Ausführung führt.
Kernkontrollmechanismen
Das System implementiert vier spezifische Kontrollmuster:
- Explizite Gates vor Aktionen: Verwendet einen BeforeToolUse-Hook, der nach einer genehmigten Gate-Datei auf der Festplatte sucht. Keine Datei, kein Schreiben. Die KI kann ohne vorherige architektonische Deklaration nicht fortfahren.
- Sofortiges Feedback bei Fehlern: Ein PostToolUse-Hook führt nach jedem Dateischreiben eine statische Analyse durch (PHPStan, PHPCS, ESLint, ruff usw.) und injiziert strukturierte JSON-Ergebnisse zurück in den Kontext. Die KI sieht genau, was kaputtgegangen ist, und korrigiert sich selbst, bevor sie fortfährt.
- Eingeschränkte Auswahlmöglichkeiten statt offener Optionen: Komplexe Funktionen werden in abhängigkeitsgeordnete Scheiben aufgeteilt. Die KI arbeitet eine Scheibe nach der anderen ab, wobei jede Scheibe vor Beginn der nächsten für eine menschliche Überprüfung angehalten wird.
- Regeln, die nicht wegargumentiert werden können: Die Durchsetzung erfolgt mechanisch über Shell-Hooks, die entweder erlauben oder blockieren. Die Meinung der KI über ihre eigene Ausgabe ist kein Beweis.
Technische Details
Phaselock funktioniert mit Claude Code, Cursor, Windsurf und allem, was Hooks und Agent-Skills unterstützt. Das Domänenwissen ist auf Magento 2 und PHP ausgerichtet, aber die Durchsetzungsarchitektur ist sprachunabhängig.
Die aktuelle Implementierung hat eine Skalierungsbeschränkung: Sie lädt bei jeder Sitzung alle Regeln in den Kontext. Bei 80 Regeln ist dies handhabbar, aber bei 500 Regeln verbrennt man Kontext, bevor die Aufgabe beginnt, und bei 10.000 Regeln ist es physisch unmöglich.
Zukünftige Entwicklung: Writ
Der Entwickler baut Writ als Lösung für das Skalierungsproblem. Es handelt sich um ein hybrides Retrieval-System, das herausfindet, welche Regeln gerade relevant sind, und nur diese zurückgibt. Dadurch werden Antwortzeiten von unter 10 ms und eine 726-fache Kontextreduktion bei 10.000 Regeln erreicht. Das System ist noch experimentell und wird Stresstests unterzogen.
Der Entwickler stellt fest, dass die Evaluierung das schwierigste ungelöste Problem bleibt. Ground-Truth-Abfragen sind bei 80 Regeln synthetisch, und es ist unklar, ob die Retrieval-Qualität bei echten Abfragen aus echten Sitzungen erhalten bleibt.
📖 Read the full source: r/ClaudeAI
👀 Siehe auch

Crispy VS Code-Erweiterung fügt Agentenspeicher und Multi-Agent-Funktionen für Claude und Codex hinzu
Crispy ist eine Open-Source-VS-Code-Erweiterung, die die Claude Code- und Codex-CLIs mit einer GUI umhüllt und lokalen Agentenspeicher mit semantischer Suche, Multi-Agenten-Sitzungen, Konversationsverzweigung und dedizierten Werkzeugansichten hinzufügt. Sie läuft unter Linux, macOS und Windows unter MIT-Lizenz.

Hollow Agent OS: Lokale KI-Arbeiter rufen Claude als leitenden Architekten, wenn sie feststecken
Das Hollow Agent OS verwendet lokale Qwen-Modelle, die rund um die Uhr laufen. Wenn sie jedoch auf Logikfehler stoßen oder größere Änderungen benötigen, lösen sie über MCP einen Claude-Aufruf aus. Claude reorganisiert Dateistrukturen, überprüft Code und fungiert als Manager für autonome lokale Arbeiter.

Google Surf MCP: Kostenlose Google-Suche MCP mit PDF-Verarbeitung und abgestufter Extraktion
Google Surf MCP ist ein kostenloser MCP-Server für Google-Suche und URL-Extraktion, der PDFs verarbeitet und einen abgestuften Extraktionsmodus (Abstract/Volltext) bietet, um Tokens zu sparen.
Forscher entwickelt Wahrheitsprüfungs-Funktion für Claude Code, findet Hallucinationen in eigener Dokumentation
Ein Forscher entwickelte eine Claude Code-Fähigkeit namens /veracity-tweaked-555, die Dokumente in atomare Behauptungen zerlegt und jede über Websuche verifiziert, wobei 16 parallele Agenten über 4 Wellen hinweg eingesetzt werden. Bei einer Selbstprüfung erzielte die Fähigkeit 62/100 Punkte aufgrund von erfundenen Statistiken und übertriebenen Behauptungen in ihrer eigenen Dokumentation.