フェーズロック:子育ての手法に着想を得たAIエージェント制御システム

Phaselockの機能
Phaselockは、自閉症児向けの子育て手法をAIエージェント制御に適用するオープンソースのAgent Skillです。開発者は、AIエージェントの曖昧な失敗と自閉症児の指示処理方法の類似性に気づき、これを開発しました。
主要な制御メカニズム
このシステムは4つの具体的な制御パターンを実装しています:
- 行動前の明示的なゲート:BeforeToolUseフックを使用し、ディスク上の承認済みゲートファイルをチェックします。ファイルがなければ書き込み不可。AIはアーキテクチャ宣言なしに進行できません。
- ミスに対する即時フィードバック:PostToolUseフックはすべてのファイル書き込み後に静的解析(PHPStan、PHPCS、ESLint、ruff、または言語適切なツール)を実行し、構造化されたJSON結果をコンテキストに注入します。AIは何が壊れたかを正確に把握し、次に進む前に自己修正します。
- 自由選択ではなく制約された選択肢:複雑な機能は依存関係順にスライス分割されます。AIは一度に1スライスずつ作業し、各スライスは次に進む前に人間のレビューで停止します。
- 合理化できないルール:シェルフックは行動を機械的に許可またはブロックします。AI自身の出力に関する意見は証拠になりません。
技術的実装
PhaselockはClaude Code、Cursor、Windsurf、およびフックとエージェントスキルをサポートするあらゆるツールと連携します。ドメイン知識はMagento 2とPHPを中心に構成されていますが、強制アーキテクチャは言語に依存しません。
スケーリングの課題と解決策
Phaselockにはスケーリング問題があります:すべてのルールを毎セッションコンテキストに読み込みます。80ルールでは管理可能ですが、500ルールではタスク開始前にコンテキストを消費し、10,000ルールでは物理的に不可能です。
開発者は解決策としてWritを構築中です:どのルールが今重要かを判断し、それらのみを返すハイブリッド検索システムです。10,000ルールで726倍のコンテキスト削減と10ミリ秒未満の検索を実現します。Writはまだ実験段階で、負荷テスト中です。
現在の未解決課題
開発者は評価の課題に取り組んでいます。80ルールでのグラウンドトゥルースクエリは合成的であり、実際のセッションからの実クエリで検索品質が維持されるかまだ不明です。彼らは問いかけています:「合成的ベンチマークが実際の使用状況を反映しない小規模コーパスでのRAG評価に取り組んだ人はいますか?何を学びましたか?」
📖 Read the full source: r/LocalLLaMA
👀 See Also

Claude Codeは、LLMを用いて4,000件以上の盲人狼ゲームをシミュレートするために使用されました。
開発者がClaude Codeを使用して、大規模言語モデルが互いにブラインド・ワンナイト人狼をプレイするシミュレーターを構築し、OpenAIとxAIのモデルで約4,600ゲームを実行しました。この実験では、ゲームのシグナルが最小限であるにもかかわらず、名前ベースの投票パターンが一貫して現れることが明らかになりました。

Atlas推論エンジンがオープンソースに:Pure Rust + CUDA、DGX Spark上で100+ tok/s
Atlasがオープンソースに — Rust + CUDA 推論エンジンで、DGX Spark 1台で Qwen3.5-35B (NVFP4) に対し 130 tok/s のピーク性能、Python ランタイム不要、コールドスタート 2分未満。

OpenHelm:Claudeコードタスクを自動化するmacOSアプリ
OpenHelmは、スケジュールに基づいてジョブを実行し、失敗を自動的に再試行し、作業をチャンクに分割してセッション制限を回避することで、反復的なClaudeコーディングタスクを自動化する無料のローカルmacOSアプリケーションです。LLM呼び出しには既存のClaudeサブスクリプションを使用します。

Claude Codeのスラッシュコマンドの再構築は、問題解決に認知科学の手法を適用します
開発者がClaude Code用の/reframeスラッシュコマンドを作成し、認知科学の手法である距離-関与振動を実装しました。このアプローチは3つのオープンウェイトLLMで50の問題をテストし、他の手法を一貫して上回りました。