MCPスリム:MCPツールのローカル埋め込み検索でコンテキスト肥大化を軽減

MCP Slimは、完全なツールカタログを3つのメタツール(検索、説明、呼び出し)に置き換えることで、MCPのコンテキスト肥大化問題に対処するプロキシツールです。すべてのツール定義を事前に読み込む代わりに、LLMが必要なものを検索するため、コンテキストウィンドウの使用量を96%削減します。
主な詳細
このツールは、いくつかのサーバーに接続するだけで最初のメッセージ前に55,000以上のトークンがツール定義に消費されるという、MCPの文書化されたコンテキスト肥大化問題に特化しています。MCP Slimがmcp-compressorやMCProxyなどの他のプロキシと異なる主な点は、ローカルのMiniLM埋め込みモデルを使用した意味検索です。これにより、キーワードの重複がなくても関連するツールを見つけることができます。例えば、「メモを保存する」という検索でcreate_entitiesツールを見つけることが可能です。
このツールは完全にオフラインで動作し、APIキーを必要としません。Claude Desktop、Cursor、Cline、Windsurf、Zedを含む、任意のstdio MCPクライアントで動作します。
インストールとセットアップ
インストールは次のコマンドで行います:npx mcp-slim init
GitHubリポジトリはこちらで利用可能です:https://github.com/dopatools/mcp-slim
作者(/u/OpportunitySpare2441)は、アーキテクチャやトレードオフに関する質問に答える用意があります。
📖 完全なソースを読む: r/LocalLLaMA
👀 See Also

Beacon: ローカルAIエージェント向けオープンソースエンドポイントテレメトリ
BeaconはローカルのAIエージェントアクティビティ(Claude Code、Codex CLI、Cursorなど)をキャプチャし、エンドポイントイベントに正規化して、Wazuh、Elastic、Splunk HEC経由での検査やSIEM転送を可能にします。

ロア: AIコーディング会話から構造化されたコンテキストを抽出するツール
LoreはClaude Codeで構築されたブラウザベースのツールで、AI会話から構造化されたコンテキストを抽出し、決定事項、TODO、ブロッカー、再開チェックリストを記録します。React + TypeScriptのPWAで、Chrome拡張機能により会話の直接キャプチャとコンテキスト注入が可能です。

自動最適化:自律的なパフォーマンス最適化のためのClaudeコードプラグイン
開発者がauto-optimizeというClaude Codeプラグインを作成しました。このプラグインは、プロファイリング→計画→ベンチマークのループを自律的に実行してコードのパフォーマンスを最適化します。あるテストでは、約3時間で全てのベンチマークシナリオにおいて27%高速なハッシュテーブルを実現しました。

Pleng:AI駆動のインフラ管理を備えたセルフホスト型クラウドプラットフォーム
Plengは、AGPL-3.0ライセンスのセルフホスト型クラウドプラットフォームで、AIエージェント(現在はClaude)を使用してTelegramボットコマンドでインフラストラクチャを管理します。GitHubリポジトリまたはローカルディレクトリから自動化されたTraefikルーティング、Let's Encrypt SSL、基本分析機能を備えたデプロイを実現します。