Pi Coding AgentとQwen 35B Q2:ファイルシステムを外部メモリとして使用し、コンテキストガードを強制する

✍️ OpenClawRadar📅 公開日: May 11, 2026🔗 Source
Pi Coding AgentとQwen 35B Q2:ファイルシステムを外部メモリとして使用し、コンテキストガードを強制する
Ad

あるRedditユーザーが、ローカルLLMを使ったエージェント的コーディング手法を共有しました。PiコーディングエージェントとQwen 35B(LM Studio経由のQ2_K_XL量子化)をベースに構築しています。核となる考え方は、LLMをコンテキストデータベースではなく、論理プロセッサとして扱うことです。この実装では、API境界で厳格なガードを適用しており、モデルがこれを回避することはできません。

システムによって強制される主な制約

  • 書き込み/編集制限:100行を超える出力を拒否。モデルはまず骨組みを書き、その後セクションごとに埋めていきます。完全なファイルを一括で出力しようとすると、作業分割の指示とともに関数呼び出しがブロックされます。
  • 思考ブロック上限:モデルの推論が2000文字を超えると、結論をディスクに書き込んで先に進むよう修正指示が出ます。
  • コンテキスト監視:コンテキスト使用率が65%に達すると、モデルは状態をファイルに書き込むよう指示されます。80%ではすべて停止し、モデルがまだ一貫性を保っているうちに「脳」をディスクに書き出します。
  • 永続的な出力:モデルがファイルを書き込まずに長い回答をした場合、発見内容をステップファイルに保存するよう指示されます。何もコンテキスト内に残りません。

外部脳構造

システムは.think/.plan/ディレクトリをモデルの外部メモリとして使用します。各ステップ、決定、発見はファイルに書き込まれます。コンテキストが圧縮されると、モデルは自身のノートを読み戻します。セッションの目的は_purpose.mdに別途保存され、コンテキスト圧縮後に再注入されて、元の目標が維持されます。

Ad

知識抽出

/distillコマンドはコードベースをクロールし、インポートグラフを構築し、ファイルをトポロジカルソートして、モデルに1ターンにつき1ファイルずつ知識ベースに要約させます。マニフェストは50ファイルごとのページに分割され、コンテキスト全体を消費しないようにしています。ユーザーはsvelte5-gotchas.mdastro-gotchas.mdなどのファイルを知識フォルダにドロップできます。独立したLLM呼び出しで現在のタスクに関連するファイルが選択され、その内容だけがメイン会話に注入されます。

実際の結果

ユーザーはモデルにThree.jsの飛行機ゲームを構築するよう依頼しました。最初の試行では一度に652行を書き出そうとしましたが、ガードに拒否されました。モデルは再計画し、骨組みを書き、その後1編集ずつ機能を埋めていきました。最終結果は、3D飛行機モデル、障害物、HUD、ミニマップ、開始/ゲームオーバー画面を備えた動作するゲームでした。すべてQ2量子化でも実現しました。

完全なセットアップはQ2_K_XL量子化を最低レベルとして動作します。ユーザーはQ4またはQ8であればより良い結果が得られると述べています。コードはGitHubで公開されています:github.com/Kodrack/Pi-forge

📖 原文を読む: r/LocalLLaMA

Ad

👀 See Also

MCPサーバーがClaudeをCellarTrackerワイン在庫に接続
Tools

MCPサーバーがClaudeをCellarTrackerワイン在庫に接続

ある開発者が、ClaudeをCellarTrackerアカウントに直接接続するMCPサーバーを構築しました。これにより、ワインコレクションを問い合わせる際の手動CSVエクスポートが不要になります。

OpenClawRadar
Gemma 4 26B対Qwen 3.5 27B:RTX 4090でのローカル業務ワークフローベンチマーク
Tools

Gemma 4 26B対Qwen 3.5 27B:RTX 4090でのローカル業務ワークフローベンチマーク

ある開発者がRTX 4090ワークステーションでGemma 4 26BとQwen 3.5 27Bを18の実践的なビジネスオペレータータスクでテストしました。Gemmaが13勝5敗で勝利し、日常の実行作業ではより高速で規律正しい結果を示した一方、Qwenはより広範な戦略的思考で優れていました。

OpenClawRadar
チームブレイン:Claude Code用共有メモリプラグイン - Gitにチームナレッジを保存
Tools

チームブレイン:Claude Code用共有メモリプラグイン - Gitにチームナレッジを保存

Team Brainは、リポジトリ内の.team-brain/フォルダにチームの知識を保存するClaude Codeプラグインです。Claudeの指示精度を最適化するために、180行に制限されたBRAIN.mdファイルを自動生成し、.cursorrulesやAGENTS.mdファイルを作成することで様々なツール間で動作します。

OpenClawRadar
並列AIエージェントのボトルネック:人間承認待ち行列
Tools

並列AIエージェントのボトルネック:人間承認待ち行列

並列でClaude Codeエージェントを実行している開発者が、「ボトルセルフ」—並列処理がアウトプットを増やすのをやめ、人間の承認待ちが積み重なり始めるポイント—について語る。彼の解決策:目標をサブタスクに分解し、エージェントを起動し、未解決の決定のみを人間に通知するプランナー。

OpenClawRadar