Kvaser: サブエージェントルーティングとWolfram統合を備えたオープンソースのローカルファーストAIオーケストレーター

Kvaserはオープンソースのオーケストレーションサーバーで、Qwen 3.6 35Bを使った実験から始まり、ローカルAIワークフローのための完全な中間者プロキシに進化しました。フロントエンド(Open WebUIなど)とバックエンド(llama.cpp)の間に位置し、標準的なOpenAIエンドポイントを公開します。
主な技術的特徴
- ゼロ埋め込みRAG: ベクトルデータベースのオーバーヘッドを回避し、MCPサーバーを介してローカルのKiwixデータセット(Wikipedia、StackOverflow)を直接クエリします。
- Wolfram Engine連携: KiwixのMathematica StackOverflowダンプで強化され、記号数学のクエリ構造化を改善します。
- GEDCOM MCP: 家系図データとKiwixを組み合わせて歴史的背景を提供するカスタム系図ツール。
- サブエージェントルーティング: 各サブエージェントを個別に設定し、異なるマシンやモデルにルーティングできます。
- スマートツールホワイトリスティング: 各サブエージェントが表示するツールを制限し、Qwen 3.5 4Bのような小規模モデルに集中させ、35Bモデルが複雑なタスクを処理できるようにします。
- アルゴリズム的拡張: 共通祖先の発見や関係計算など複雑なタスクに、LLM推論ではなくアルゴリズム的ツールを実装します。
アーキテクチャ
システムは単一エージェントから、サブエージェントによる完全なオーケストレーションモデルへと進化しました。これにより、ツールが増えるにつれて生じた「ツールの肥大化」や複雑なツリー探索の問題が解決されます。
ユースケース:歴史的背景を考慮した系図学
GEDCOM家系図データとKiwixを組み合わせることで、モデルは祖先の記録に歴史的背景を追加できます。これは、ローカルファーストのオーケストレーションの強力な例です。
ソースコード
GitHubで入手可能:https://github.com/Na1w/kvaser-core
📖 全文ソースを読む: r/LocalLLaMA
👀 See Also

CrabMeat v0.1.0:セキュリティ境界をLLMに委ねない、セキュリティ優先のエージェントゲートウェイ
CrabMeat v0.1.0は、アーキテクチャレベルでセキュリティを強化するエージェント型LLMワークロード用のWebSocketゲートウェイです。機能ID間接参照、エフェクトクラス、IRONCLAD_CONTEXT固定命令、改ざん検出可能な監査チェーン、ストリーミング出力漏洩フィルター、そしてYOLOモードなし。

SQLiteクッキー復号化によるリアルタイムClaude使用統計を表示する無料macOSメニューバーアプリ
Claude Usage Trackerは、無料のmacOSメニューバーアプリです。Claudeデスクトップアプリの暗号化されたSQLiteクッキーを読み取り、Keychain経由で復号化し、セッション%、週間制限、支出、ルーティン実行をローカルで表示します。APIキーは不要です。

llama.cpp ブランチ経由のV100 32GB上のQwen 3.6 27B MTP:54 t/s
am17anのMTPブランチのllama.cppは、PCIeアダプタ経由のV100 32GB上でQwen 3.6 27Bを54 t/sで実行し、MTPなしでは29-30 t/sに低下する。

オムナラ:どこからでもClaude CodeとCodexを実行
Omnaraは、クラウド同期や音声エージェントなどの機能を備え、開発者がどこからでもClaude CodeとCodexセッションを実行・対話できるWebおよびモバイルIDEです。