ClawCut:OpenClawで使える小さなローカルLLMのためのPythonプロキシ

ClawCutの機能
ClawCutは、ローカルLLMサーバー(MLXやOllamaなど)とOpenClawフレームワークの間のプロキシとして機能するPython Flaskアプリケーションです。これは、小規模なローカルモデル(7B/14B)をOpenClawで実用的なアシスタントとして使用するのを困難にする特定の技術的問題を解決するために作成されました。
解決される主な問題
- コンテキスト汚染: 小規模モデルは、チャット履歴で自身の古いツール呼び出しを見ると、ツール使用の追跡を失います
- 無限ループ: モデルはコマンドを実行する代わりにパターンを繰り返し続けてしまいます
- 出力の問題: モデルはbashコードをチャット内のプレーンテキストとして出力したり、複数のコマンド後に自身の履歴で詰まったりします
- Cronジョブの失敗: スケジュールされたバックグラウンドジョブは、アクティブなチャットウィンドウが開いていないため、応答が消えてしまいます
- LLMのアーティファクト: 空のマークダウンブロック、内部XMLタグ、未完了のバッククォートが出力を乱雑にします
- メディアアップロードの拒否: モデルは生成されたファイルのアップロードを拒否することがあります
仕組み
ツール呼び出しのための動的記憶喪失: 通常のチャット中は履歴が保持されます。プロキシがモデルがシステムツールを使用しようとしていることを検出すると、一時的に古いチャット履歴を遮断し、モデルに「トンネルビジョン」を与えて、ループや幻覚なしにシェルコマンドをクリーンに実行できるようにします。
Cronジョブのためのユニバーサル自動配信: プロキシはモデルのストリームを監視し、思考プロセスの終わりにクリーンなテキスト応答をインターセプトします。その後、WhatsApp、Telegram、またはSignalへの自動ツール呼び出しを介して配信を強制し、cronジョブが積極的にあなたの電話に報告するようにします。
アーティファクトフィルタリング: 空のマークダウンブロック、内部XMLタグ、未完了のバッククォートは、フロントエンドに到達する前にフィルタリングされます。
ツール名の操作: シンプルなストリーム操作により、生成されたメディアファイルのアップロードを拒否するモデルを回避します。
テスト済みセットアップ
- OpenClaw 3.8を搭載したRaspberry Pi 5(8GB)
- MLX-LLMでQwen2.5-Coder-7B-Instruct-4bitを実行するMac mini M4 Pro 24GB
- OllamaとQwen 2.5 Coder 14Bモデルを搭載したWindowsマシン(ClawCut統合予定)
制限事項
ClawCutは7BモデルをGPT-4に変えるものではありません。非常に複雑な多段階の論理チェーンは、小規模モデルにとって依然として困難です。このプロキシは、以前は日常的なアシスタントとしてほぼ使用不能にしていた技術的な障害に特化して対処します。
📖 Read the full source: r/openclaw
👀 See Also

First-Tree: 就寝中にGitHub通知をトリアージするClaude Codeを使用したオープンソースデーモン
オープンソースのメニューバーデーモンで、Claude Codeを使ってGitHub通知を自律的にトリアージします。最近のスキャンでは100件中98件の通知を処理し、人間のレビューが必要だったのはわずか2件でした。

オープンソースのセカンドブレインシステム、Claude Codeを基盤としたタスク管理
オープンソースシステム「Kipi System」は、Claude Codeを使用して未解決のスレッドを追跡し、フォローアップを下書きし、カレンダー、メール、CRM、ソーシャルフィードからデータを取得してタスクを管理します。摩擦度(最も簡単なものから順に)でソートされた事前作成済みのアクションを含む日次HTMLファイルを生成します。

定足数:AIコードガバナンスツールが独立したモデルレビューを実施
quorumは、AI支援開発におけるガバナンス層であり、コードがコミットされる前に別のモデルによって独立してレビューされることを要求するコンセンサスプロトコルを強制します。進捗をブロックする3つの構造的ゲート(監査、振り返り、品質ゲート)を含みます。

log-context-mcp: MCPツールはClaudeデバッグ時のログトークン使用量を96%削減します
log-context-mcpは、デバッグセッション中に冗長なログファイルでClaude Codeがトークンを消費する問題に対処するために構築されたMCP(Model Context Protocol)ツールです。ログファイルがClaudeのコンテキストに到達する前に前処理を行い、重複行の排除、スタックトレースのグループ化、ノイズの除去を行ってトークン使用量を削減します。2000行のApacheログでのテストでは、96.5%の削減率を示しながら、根本原因を正しく特定しました。