VoidLLM:OllamaとvLLMのためのゼロ知識プロキシ、チームアクセス制御付き

VoidLLMは、OllamaやvLLMなどのローカルLLMサーバーとアプリケーションの間に位置するプロキシサーバーです。組織やチームのアクセス制御、APIキー管理、使用状況の追跡、レート制限を追加しますが、プロンプトやコンテンツを閲覧することはありません。
主な機能
- OpenAI互換 — OpenAI APIフォーマットをサポートする任意のSDKで動作
- Ollama、vLLM、Anthropic、Azure、OpenAI用のプロバイダーアダプター
- プロキシオーバーヘッド2ミリ秒未満
- 組織、チーム、またはAPIキーごとのレート制限(Redisによる分散)
- コスト追跡と分析ダッシュボード
- コンテンツロギングなし — メタデータのみ(誰がどのモデルにアクセスし、何トークン使用したか)
ユースケース
ローカルでOllamaやvLLMを実行しており、適切なアクセス制御と使用状況の可視化を備えてチーム全体で共有したい場合、このプロキシはゼロ知識アーキテクチャによるプライバシーを維持しながら、これらの機能を提供します。
このツールはGitHubで利用可能です: github.com/voidmind-io/voidllm。
📖 Read the full source: r/LocalLLaMA
👀 See Also

SOPHIA メタエージェント for AIエージェントメンテナンス
SOPHIAは、本番環境におけるAIエージェントの性能劣化という実践的な課題に対処するために設計されたメタエージェントです。営業、臨床文書作成、カスタマーサービス向けのエージェントを運用する際、プロンプトが陳腐化したり、ツールがずれたり、ユーザーの行動が時間とともに変化したりすることがあります。SOPHIAは、システム内の他のすべてのエージェントを観察、診断、調査し、改善を提案するチーフラーニングオフィサーとして機能します。

Claude Code Plugin Yoinkは、サプライチェーンリスクを低減するためにライブラリ依存関係を置き換えます
Yoinkは、必要な機能のみを再実装することで複雑な依存関係を排除するClaude Codeプラグインで、/setup、/curate-tests、/decomposeの3段階ワークフローを使用します。現在はPythonをサポートしており、TypeScriptとRustのサポートも進行中です。

エングラム:Claude CodeおよびMCPクライアント向けオープンソースメモリレイヤー
Engramは、Claude Code、Cursor、Windsurfなどの任意のクライアントと連携するMCPサーバーとして機能するオープンソースのメモリレイヤーです。意味的ベクトル検索により無制限のメモリを保存し、LOCOMOベンチマークで80%の精度を達成、クエリあたり約800トークンを使用します(ファイルベースのアプローチでは5,000トークン以上)。

x402とSolanaを使用したAIエージェントのマイクロペイメントのデモ
x402-helloデモは、Solanaブロックチェーン上でAIエージェントがUSDCを用いて自律的にマイクロペイメントを処理する方法を示しています。